详细分析 ▾
运行时依赖
版本
**Major upgrade with added scripts, configurability, and streamlined TTS triggers** - Added Node.js scripts for TTS conversion and config management (`tts-converter.js`, `config-manager.js`), with installation and usage instructions. - Added resource and reference files, including a complete voice/option guide and install script. - Changed TTS intent detection to trigger only on the "tts" keyword (removes long trigger phrase lists), and clarified keyword filtering prior to conversion. - Expanded documentation with workflow, usage examples, advanced configuration, troubleshooting, and testing instructions. - Clarified default voice, output formats, temporary file handling, and recommended voice test site.
安装命令
点击复制本土化适配说明
Edge TTS — 文本转语音 安装说明: 安装命令:npx clawhub@latest install edge-tts 支持国内镜像加速,使用 --registry https://cn.longxiaskill.com 参数可加速下载
技能文档
概述
通过 node-edge-tts npm 包调用 Microsoft Edge 神经 TTS 服务,生成高质量文本转语音音频。支持多语言、多声音、可调节语速/音调及字幕生成。
快速开始
当检测到触发词或用户请求中的 TTS 意图时:
- 调用 tts 工具(Clawdbot 内置)将文本转换为语音
- 工具返回 MEDIA: 路径
- Clawdbot 将音频路由到当前频道
// 示例:内置 tts 工具用法
tts("Your text to convert to speech")
// 返回: MEDIA: /path/to/audio.mp3
触发词检测
将 "tts" 关键词识别为 TTS 请求。技能会在转换前自动过滤 TTS 相关关键词,避免将触发词本身转换为语音。
高级自定义
使用 Node.js 脚本
如需更多控制,可直接使用绑定的脚本:
TTS 转换器
cd scripts
npm install
node tts-converter.js "Your text" --voice en-US-AriaNeural --rate +10% --output output.mp3
参数选项:
--voice, -v:声音名称(默认:en-US-AriaNeural)--lang, -l:语言代码(例如:en-US、es-ES、zh-CN)--format, -o:输出格式(默认:audio-24khz-48kbitrate-mono-mp3)--pitch:音调调节(例如:+10%、-20%、default)--rate, -r:语速调节(例如:+10%、-20%、default)--volume:音量调节(例如:+0%、-50%、+100%、default)--output, -f:输出文件路径--list-voices:列出所有可用声音--list-formats:列出所有可用输出格式--write-subtitle, -s:生成音频字幕文件--compress:压缩音频输出
字幕生成器
node subtitle-generator.js input.mp3 --format vtt --output subtitles.vtt
参数选项:
--format:字幕格式(vtt 或 srt,默认:vtt)--output, -o:输出文件路径
声音选择
质量优先级:Neural > NeuralHQ > Neural2 > Standard
Neural 声音(以 "Neural" 或 "Neural2" 结尾)提供最佳音质。Standard 声音作为兼容性备选。
声音列表因语言而异。使用 --list-voices 查找目标语言对应的声音:
node tts-converter.js --list-voices
# 按语言筛选:
node tts-converter.js --list-voices | grep "zh-CN"
配置管理
对于重复使用相同偏好的场景,使用配置管理器:
const { ConfigManager } = require('./config-manager.js');const configManager = new ConfigManager();
// 设置默认声音 configManager.set('voice', 'en-US-AriaNeural');
// 设置默认输出目录 configManager.set('outputDir', './tts-output');
// 获取当前配置 const config = configManager.get();
最佳实践
- 使用 Neural 声音:其音质显著优于 Standard 声音
- 测试不同声音:不同声音具有不同特性,为内容找到最佳匹配
- 考虑语言匹配:使用与内容语言一致的声音以获得最佳发音
- 处理网络问题:TTS 需要网络连接,生产环境中实施重试逻辑
- 清理临时文件:临时音频文件不会自动删除
- 大文件使用压缩:
--compress标志可减少大文件体积 - 生成字幕:为无障碍访问和视频内容,生成音频时同步生成字幕