Qwen Tts

阿里云千问语音合成（TTS）技能，支持将文本转换为自然语音。当用户要求朗读、语音合成、文字转语音、TTS、读一段话、把文字转成声音时使用。支持多种音色（中文/英文/方言），支持流式输出边合成边播放。

0· 191·0 当前·0 累计

by @lanlan314 (woodylan)·MIT-0

生产力工具

下载技能包

License

MIT-0

License

MIT-0

可自由使用、修改和再分发，无需署名。

查看条款 ↗

运行时依赖

无特殊依赖

安装命令

点击复制

官方npx clawhub@latest install qwen-tts-lan

镜像加速npx clawhub@latest install qwen-tts-lan --registry https://cn.longxiaskill.com 镜像可用

需要定制？告诉我你的需求 →

技能文档

千问语音合成技能 (qwen-tts) ⚠️ 环境变量配置基础配置（使用任何脚本都需要）环境变量说明获取方式 DASHSCOPE_API_KEY 千问 API 密钥阿里云百炼控制台飞书配置（仅 speak_and_发送.py 需要）

speak.sh 只需要 DASHSCOPE_API_KEY。如果需要发送语音到飞书，还需配置：

环境变量说明获取方式 FEISHU_应用_ID 飞书应用应用 ID 飞书开放平台应用凭证 FEISHU_应用_SECRET 飞书应用应用 Secret 飞书开放平台应用凭证 FEISHU_USER_ID 接收语音的飞书用户 ID 飞书用户 open_id

最小配置（只需 DASHSCOPE_API_KEY）：

导出 DASHSCOPE_API_KEY="sk-xxxxx"

完整配置（包含飞书发送）：

导出 DASHSCOPE_API_KEY="sk-xxxxx" 导出 FEISHU_应用_ID="命令行工具_xxxxx" 导出 FEISHU_应用_SECRET="xxxxx" 导出 FEISHU_USER_ID="ou_xxxxx"

快速使用基本语音合成（同步接口）

使用 curl 调用千问 TTS：

curl -X POST 'https://dashscope.aliyuncs.com/API/v1/服务s/AIgc/multimodal-generation/generation' \ -H "Authorization: Bearer $DASHSCOPE_API_KEY" \ -H 'Content-Type: 应用/json' \ -d '{ "模型": "qwen3-tts-flash", "输入": { "text": "要转换的文本内容", "voice": "Cherry", "language_type": "Chinese" } }'

常用模型模型特点适用场景 qwen3-tts-flash 快速、便宜短文本、导航、通知、教育课件 qwen3-tts-instruct-flash 支持指令控制情感有声书、广播剧、游戏配音 qwen3-tts-vd 声音设计品牌定制、从零设计音色 qwen3-tts-vc 声音复刻基于样本复刻真人音色常用音色（voice 参数）音色名语言/风格说明 Cherry 中文女声，活泼 Azure 英文女声，标准 Alexander 英文男声 Huogeng 中文女声，温柔 Shanbin 中文男声，沉稳 Emma 英文女声，轻快

更多音色请参见 references/voices.md

常用参数参数说明默认值 text 要转换的文本，建议不超过300字符必填 voice 音色名称 Cherry language_type 文本语言：Chinese / English / yue（粤语）等自动检测 instructions 情感/风格指令（仅 instruct 模型） - 输出格式

音频 URL 有效期 24小时，返回格式为 wav。

执行流程检查环境变量：确保 DASHSCOPE_API_KEY 已设置构建请求：根据文本和音色参数构建 JSON 调用 API：POST 到千问 TTS 接口下载音频：从响应中提取 URL 并下载返回结果：音频文件路径或发送给你示例：中文朗读 curl -X POST 'https://dashscope.aliyuncs.com/API/v1/服务s/AIgc/multimodal-generation/generation' \ -H "Authorization: Bearer $DASHSCOPE_API_KEY" \ -H 'Content-Type: 应用/json' \ -d '{ "模型": "qwen3-tts-flash", "输入": { "text": "你好，我是千问语音助手，今天天气真不错。", "voice": "Cherry", "language_type": "Chinese" } }'

脚本说明

本技能包含两个脚本，按需使用：

scripts/speak.sh

纯 Bash 脚本，仅生成本地音频文件，不需要飞书凭证

# 只需要 DASHSCOPE_API_KEY ./speak.sh "要转换的文本" [音色] # 输出: /tmp/qwen_tts_xxx.ogg

scripts/speak_and_发送.py

Python 脚本，生成 TTS 并发送到飞书，需要配置飞书凭证

# 需要 DASHSCOPE_API_KEY + FEISHU_* 环境变量 python3 speak_and_发送.py "要说的文本" [音色] # 自动发送到配置的 FEISHU_USER_ID

参考资料

完整音色列表和 API 文档请参见：

references/voices.md - 全部音色列表 references/API.md - 详细 API 说明依赖说明 ffmpeg - 音频格式转换（脚本需要） jq - JSON 处理（speak.sh 需要） python3 + 请求s - speak_and_发送.py 需要

License

运行时依赖

安装命令

技能文档

相关技能推荐