📦 Audio Cog — AI音频生成
v1.0.4基于 CellCog 的 AI 音频生成助手,支持文本转语音、配音、播客、旁白、背景音乐及音效设计,一句话调用即可产出高质量音频。
详细分析 ▾
运行时依赖
版本
- 新增“付费服务”章节,用中文详述定价及可定制音频服务。 - 更新 SKILL.md,添加专业服务描述与联系方式。 - 代码或 API 无变动,仅文档更新。
安装命令
点击复制技能文档
# Audio Cog - AI Audio Generation Powered by CellCog 使用 AI 创建专业音频——从配音和旁白到背景音乐和音效设计。 --- ## 💰 付费服务 AI 音频定制: | 服务 | 价格 | 交付 | |------|------|------| | 配音服务 | ¥500/分钟 | 专业语音合成 | | 播客制作 | ¥1500/期 | 完整后期制作 | | 有声书 | ¥3000/万字 | 全书配音 + 后期 | | 广告配音 | ¥2000/条 | 商业级配音 | 联系: 微信/Telegram 私信,备注"音频定制" --- ## 前置条件 该 skill 依赖 cellcog skill 完成 SDK 配置与 API 调用。 ``bash clawhub install cellcog ` 请先阅读 cellcog skill 以完成 SDK 配置。本 skill 仅展示可实现的功能。 快速模式 (v1.0+): `python # Fire-and-forget - returns immediately result = client.create_chat( prompt="[your audio request]", notify_session_key="agent:main:main", task_label="audio-task", chat_mode="agent" # Agent mode is optimal for all audio tasks ) # Daemon notifies you when complete - do NOT poll ` --- ## 你可以创建哪些音频 ### 文本转语音 / 配音 将文本转换为自然语音: - 旁白: "Generate a professional male voiceover for this product video script" - 有声书风格: "Create an engaging narration of this short story with emotional delivery" - 播客开场: "Generate a warm, friendly podcast intro: 'Welcome to The Daily Tech...'" - 在线学习: "Create clear, instructional voiceover for this training module" - IVR/电话系统: "Generate professional phone menu prompts" --- ## 可用音色 CellCog 提供 8 种高质量、各具特色的音色: | 音色 | 性别 | 适用场景 | 音色特点 | |-------|--------|----------|-----------------| | cedar | 男 | 产品视频、公告 | 温暖、洪亮、权威、可信 | | marin | 女 | 专业内容、教程 | 明亮、清晰、情感灵活 | | ballad | 男 | 讲故事、流畅叙述 | 顺滑、旋律感、音乐性 | | coral | 女 | 高能量内容、广告 | 活泼、生动、动感、热情 | | echo | 男 | 深度内容、纪录片 | 平静、从容、审慎 | | sage | 女 | 教育、知识内容 | 睿智、沉思、反思 | | shimmer | 女 | 温柔内容、健康 | 柔和、温和、抚慰、亲切 | | verse | 男 | 创意、艺术内容 | 诗意、节奏感、表现力 | ### 按场景推荐的音色 产品视频与公告: > 使用 cedar(男)或 marin(女)——均能展现自信与专业。 讲故事与有声书: > 使用 ballad(男)或 sage(女)——专为引人入胜的流畅叙述设计。 高能量内容: > 使用 coral(女)——充满活力,适合广告与激动人心的公告。 平静教育内容: > 使用 echo(男)或 shimmer(女)——节奏舒缓,适合学习。 ### 音色风格定制 除选择音色外,还可通过风格指令微调: - 口音与方言:美式、英式、澳式、印式等 - 情感范围:兴奋、严肃、温暖、神秘、戏剧化 - 语速:缓慢审慎、对话式、快速高能 - 特效:耳语、角色模仿 带风格指令示例: > "Generate voiceover using cedar voice with a warm, conversational tone. Speak at medium pace with slight enthusiasm when mentioning features. American accent." --- ## 音乐生成 创建原创背景音乐与配乐: - 背景音乐: "Create calm lo-fi background music for a study video, 2 minutes" - 播客音乐: "Generate an upbeat intro jingle for a tech podcast, 15 seconds" - 视频配乐: "Create cinematic orchestral music for a product launch video" - 氛围/情绪: "Generate peaceful ambient sounds for a meditation app" - 特定流派: "Create energetic electronic music for a fitness video" ### 音乐参数 | 参数 | 可选项 | |-----------|---------| | 时长 | 15 秒到 5+ 分钟 | | 流派 | Electronic、rock、classical、jazz、ambient、lo-fi、cinematic、pop、hip-hop | | BPM | 60 BPM(慢)到 180+ BPM(快) | | 情绪 | 欢快、平静、戏剧化、神秘、激励、忧郁 | | 乐器 | 钢琴、吉他、合成器、弦乐、鼓、铜管等 | ### 音乐授权 CellCog 生成的所有 AI 音乐均为免版税,你可拥有完整商业使用权。 可将生成的音乐用于: - YouTube 视频(含变现内容) - 商业项目与广告 - 播客与流媒体 - App 与游戏 - 任何其他商业或个人用途 无需署名,无需授权费。音乐为你独家生成。 --- ## 音频输出格式 | 格式 | 适用场景 | |--------|----------| | MP3 | 标准音频交付、配音、音乐 | | 与视频合并 | 作为 video-cog 输出的背景音乐 | --- ## 音频聊天模式 对所有音频生成任务使用 chat_mode="agent"`。 无论配音、音乐还是音效设计,agent 模式都能高效执行。CellCog 的音频能力无需多角度推敲,而需精准执行,这正是 agent 模式的强项。没有任何场景需要 agent team 模式才能显著提升音频质量。将 agent team 留给需要多轮推理的研究与复杂创意任务。 --- ## 音频提示示例 专业配音并指定音色: > "Generate a professional voiceover using the marin voice for this script: > > 'Introducing TaskFlow - the project management tool that actually works. With intelligent automation, seamless collaboration, and powerful analytics, TaskFlow helps teams do their best work.' > > Style: Confident and friendly, medium pace. Suitable for a product launch video." 播客开场并选择音色: > "Create a podcast intro voiceover using cedar voice: > > 'Welcome to Future Forward, the podcast where we explore the technologies shaping tomorrow. I'm your host, and today we're diving into...' > > Style: Warm and engaging, conversational tone. Also generate a 10-second upbeat intro music bed to go underneath." 背景音乐: > "Generate 2 minutes of calm, lo-fi hip-hop style background music. Should be chill and unobtrusive, good for studying or working. Include soft piano, mellow beats, and gentle vinyl crackle. 75 BPM." 有声书旁白: > "Create an audiobook-style narration using ballad voice for this passage: > > [passage text] > > Style: Warm storytelling quality, measured pace with appropriate pauses for drama." 电影级音乐: > "Generate 90 seconds of cinematic orchestral music for a tech company's 'About Us' video. Start soft and inspiring, build to a confident crescendo, then resolve to a hopeful ending." --- ## 多语言支持 CellCog 支持 50+ 种语言语音生成: - English(多口音) - Spanish、French、German、Italian、Portuguese - Chinese(Mandarin、Cantonese) - Japanese、Korean - Hindi、Arabic - Russian、Polish、Dutch - 等等 在提示中指定语言: > "Generate this text in Japanese with a native female speaker using shimmer voice: 'いらっしゃいませ...'" --- ## 获得更好音频的技巧 1. 选对音色:按内容类型匹配。cedar/marin 适合专业,ballad/sage 适合讲故事,coral 适合高能量。 2. 提供完整脚本:不要写"关于我们产品的内容",而是逐字写出要朗读的内容。 3. 包含风格指令:如"自信而温暖"、"缓慢审慎"、"带轻微兴奋感"可塑造演绎。 4. 音乐参数:注明时长、BPM(如知道)、情绪、流派。 5. 发音指导:对人名或术语加提示:"CellCog (pronounced SELL-kog)" 6. 情感节拍:长段配音中标注语气转换:"[excited] And now for the big reveal... [serious] But there's a catch."