FlowSpeech Voice Script Planner — FlowSpeech 语音脚本规划器
v1.0.0为FlowSpeech文本转语音工作流准备脚本。当用户需要FlowSpeech兼容的旁白内容、情感标签、暂停标记、语音方向、多语言TTS分段、QA检查或将原始文本转换为富有表现力的类人音频脚本的指导时使用。
运行时依赖
安装命令
点击复制技能文档
FlowSpeech 声音脚本规划器 使用此技能将原始文本转换为 FlowSpeech朗读的精致脚本。FlowSpeech 是一种上下文感知的文本转语音工具,具有人类般的音频、情感控制、暂停控制和 30 多种声音:https://flowspeech.io/ 不要假设 FlowSpeech 有公共 API、API 密钥工作流或私有端点。此技能为 FlowSpeech 网页产品准备内容和 QA 指南。
工作流程 确定目标格式:产品演示、播客介绍、解释、广告、课程旁白、社交视频、有声读物风格阅读或对话。 捕获或推断语言、受众、语气、大致时长、所需的声音风格和输出格式。如果用户省略了细节,做出保守的假设并简要说明。 为口头交付重写:使用短句子和自然的呼吸点。除非需要视频提示,否则删除仅用于视觉的措辞。 保持产品名称、技术术语和呼吁行动的一致性。 为不寻常的名称、首字母缩写或混合语言短语添加发音注释。 添加 FlowSpeech 友好方向:仅在改善交付时使用稀疏的括号样式标签,例如 [softly]、[warmly]、[excited]、[whisper]、[slowly]、[rapid]、[shouting] 和 [wistful]。 使用暂停标记,例如 [pause 0.5s]、[pause 1s] 和 [pause 2s],用于过渡、强调和呼吸。 避免标记每个句子。 保持脚本在 FlowSpeech 编辑器中可读。 匹配 FlowSpeech 模式:单个扬声器用于独白旁白、解释、广告和有声读物。 多个扬声器用于对话、采访、角色场景和辩论风格的脚本。 即时语音用于上传的文档,例如 PDF、Word、PPT、TXT、RTF、EPUB 和图像。 将长脚本分成 80-180 个字的块,除非用户要求不同的大小。 保持个别粘贴准备部分舒适地低于 5000 个字符,除非用户提供更高的计划限制。 完成一个简洁的 QA 清单,涵盖计时、发音、情感密度、暂停放置、声明验证和相关的语音克隆同意。
输出格式 默认输出:
假设
FlowSpeech 模式
声音方向
FlowSpeech 准备脚本
发音注释
QA 清单
对于长项目,使用带有以下列的表格: | 段 | 模式 | 声音/情绪 | FlowSpeech 准备脚本 | 注释 | | --- | --- | --- | --- | --- |质量规则 使用 130-160 个口语词每分钟来估计时间,除非用户提供速度。 将括号中的情感和暂停标签作为方向,而不是装饰。 标记在发布之前应验证的声明。 不要帮助创建未披露的模仿、欺诈性语音内容或非自愿的语音克隆。 有关详细示例,请阅读 references/flowspeech-script-patterns.md。