📦 私人专属音色生成工具（合规版）

v1.0.0

声音复刻技能，使用 AI Artist API 进行音色克隆和语音合成。支持查询已有音色、上传音频创建新音色、使用指定音色合成语音。 ⚠️ 使用前必须设置环境变量 AI_ARTIST_TOKEN 为你的 API Key！需要 API Key 授权：已有账号请前往 https://ai.deepsop.com/ 登录获取。

0· 0·0 当前·0 累计

by @kukuoai

API开发 AI模型访问安全加密

下载技能包

运行时依赖

无特殊依赖

安装命令

点击复制

官方npx clawhub@latest install personal-voice-generator

镜像加速npx clawhub@latest install personal-voice-generator --registry https://cn.longxiaskill.com镜像同步中

需要定制？告诉我你的需求 →

技能文档

声纹克隆 - 使用 AI Artist API 进行音色克隆和语音合成的完整解决方案。基于 CosyVoice v3.5 Plus 模型，支持高质量的音色复刻和文本转语音。技能概述本技能提供三大核心功能：功能说明典型场景查询音色列出系统中所有可用音色查看已有音色库，选择合适的声音音色克隆上传音频创建新的音色复刻自己的声音、领导的声音、明星声音等语音合成使用指定音色生成语音用特定声音朗读文本、生成配音、制作语音消息首次使用必读

获取 API Key 本技能需要 API Key 授权才能调用 AI Artist API：

已有账号 → 前往 https://ai.deepsop.com/login?source=2 登录获取没有账号 → 前往 https://ai.deepsop.com/register?source=2 注册后获取登录后在复制您的 API Key（sk- 开头）。

设置环境变量在使用前，你必须先设置自己的 API Key：

# Windows PowerShell $env:AI_ARTIST_TOKEN="sk-your_api_key_here" # Linux/macOS/Git Bash (Windows) export AI_ARTIST_TOKEN="sk-your_api_key_here"

验证配置

python scripts/voice_clone.py --list 如果看到音色列表，说明配置成功！快速开始基础用法 # 1. 列出所有可用音色 python scripts/voice_clone.py --list # 2. 使用音色 ID 合成语音 python scripts/voice_clone.py --synthesize --id 10 --text "大家好，我是测试语音" # 3. 使用音色名称合成语音 python scripts/voice_clone.py --synthesize --name "蔡总的音色" --text "你好世界" # 4. 下载合成的音频到本地 python scripts/voice_clone.py --synthesize --id 10 --text "你好" --download 创建新音色 # 使用本地音频文件创建音色 python scripts/voice_clone.py --create --name "我的音色" --audio "./my_voice.mp3" # 使用在线音频 URL 创建音色 python scripts/voice_clone.py --create --name "我的音色" --audio-url "https://example.com/voice.mp3" # 指定音色前缀 python scripts/voice_clone.py --create --name "客服音色" --audio "./cs.mp3" --prefix "CustomerService" 详细使用指南一、查询可用音色列出系统中所有音色及其状态： python scripts/voice_clone.py --list 输出示例： [INFO] 共有 4 个音色可用音色列表: [13] 王俏的音色 [OK] - cosyvoice-v3.5-plus [12] 测试 11 [OK] - cosyvoice-v3.5-plus [10] 蔡总的音色 [OK] - cosyvoice-v3.5-plus [4] 测试音色 [OK] - cosyvoice-v3.5-plus 状态说明：状态说明是否可用 OK 音色已就绪可用 DEPLOYING 音色部署中暂不可用其他音色异常不可用二、语音合成方式 1：使用音色 ID python scripts/voice_clone.py --synthesize --id 13 --text "真正重要的东西，用眼睛是看不见的，只有用心才能看清。" 方式 2：使用音色名称 python scripts/voice_clone.py --synthesize --name "王俏的音色" --text "你好，欢迎使用库阔 AI" 方式 3：合成并下载 # 下载到默认目录 (~/.openclaw/workspace/audio/) python scripts/voice_clone.py --synthesize --id 13 --text "测试语音" --download # 下载到指定目录 python scripts/voice_clone.py --synthesize --id 13 --text "测试语音" --download --output-dir "./my_audio" 三、创建新音色从本地音频文件创建 # 支持 MP3、WAV 等常见格式 python scripts/voice_clone.py --create --name "我的声音" --audio "./my_voice.mp3" # 使用完整路径 python scripts/voice_clone.py --create --name "领导音色" --audio "C:\Users\admin\Downloads\leader_voice.wav" 从在线 URL 创建 python scripts/voice_clone.py --create --name "网络音色" --audio-url "https://example.com/voice.mp3" 指定音色前缀 python scripts/voice_clone.py --create --name "客服小王" --audio "./wang.mp3" --prefix "CustomerService" 音色克隆最佳实践音频素材要求要求说明格式 MP3、WAV、M4A 等常见音频格式时长 10-60 秒（推荐 30 秒左右）音质清晰的人声，无明显背景噪音内容纯人声朗读，无背景音乐采样率 16kHz 或以上录制建议环境安静 - 选择安静的房间，关闭空调、风扇等噪音源距离适中 - 麦克风距离嘴巴 10-15 厘米语速均匀 - 用正常语速朗读，不要过快或过慢情感自然 - 用自然的情感朗读，不要过于夸张内容多样 - 包含不同的音调、韵律，有助于模型学习推荐的录音文本你好，我是 XXX。这是一段用于音色克隆的录音样本。我希望用我的声音来生成各种语音内容，包括问候语、通知、故事朗读等。请确保录音清晰，语速适中，情感自然。谢谢你的配合。参数说明全局参数参数必填说明 --list 三选一列出所有可用音色 --synthesize 三选一语音合成模式 --create 三选一创建新音色模式合成模式参数参数必填说明示例 --id 与 --name 二选一音色 ID --id 13 --name 与 --id 二选一音色名称 --name "王俏的音色" --text 必填要合成的文本 --text "你好世界" --download 否下载音频到本地 --download --output-dir 否音频保存目录 --output-dir "./audio" 创建音色参数参数必填说明示例 --name 必填音色名称 --name "我的音色" --audio 与 --audio-url 二选一本地音频路径 --audio "./voice.mp3" --audio-url 与 --audio 二选一在线音频 URL --audio-url "https://..." --prefix 否音色前缀 --prefix "DeepSop" 环境配置方式 1：临时设置（当前终端有效） # Windows PowerShell $env:AI_ARTIST_TOKEN="sk-5c6c262755dc43d59ec5a742a7e80202" # Linux/macOS export AI_ARTIST_TOKEN="sk-5c6c262755dc43d59ec5a742a7e80202" 方式 2：永久设置（推荐）创建 .env 文件（在脚本同目录或技能根目录）： AI_ARTIST_TOKEN=sk-your_api_key_here 方式 3：系统环境变量 Windows: [System.Environment]::SetEnvironmentVariable('AI_ARTIST_TOKEN', 'sk-your_api_key_here', 'User') Linux/macOS: echo 'export AI_ARTIST_TOKEN="sk-your_api_key_here"' >> ~/.bashrc source ~/.bashrc 实用场景示例场景 1：用特定音色发送语音消息 # 用蔡总的音色发送通知 python scripts/voice_clone.py --synthesize --name "蔡总的音色" --text "各位同事，下午三点在会议室召开周会，请准时参加。" --download 场景 2：批量生成语音 # 生成多个语音片段 python scripts/voice_clone.py --synthesize --id 13 --text "第一章：开始" --download --output-dir "./audiobook/ch1" python scripts/voice_clone.py --synthesize --id 13 --text "第二章：发展" --download --output-dir "./audiobook/ch2" python scripts/voice_clone.py --synthesize --id 13 --text "第三章：高潮" --download --output-dir "./audiobook/ch3" 场景 3：创建多人音色库 # 为团队创建音色库 python scripts/voice_clone.py --create --name "客服小王" --audio "./wang.mp3" python scripts/voice_clone.py --create --name "客服小李" --audio "./

数据来源：ClawHub ↗ · 中文优化：龙虾技能库