Voxflow
v1.0.0VoxFlow 声音与AI视频 CLI — 支持200+种声音的TTS,多说话者播客,ASR + 字幕翻译 + 配音 + 端到端视频翻译,垂直卡...
运行时依赖
安装命令
点击复制技能文档
VoxFlow 技能 VoxFlow 可以将文本转换为 200+ 种声音,支持 40+ 种语言,并提供完整的音频/视频管道:播客、转录、配音、视频翻译和短形式 AI 剪辑。所有命令都通过 voxflow CLI 运行(由 ClawHub 自动安装)。一个账户、一个配额、一个登录 —— 无需 API 密钥。
路由 —— 选择匹配的子文档 在做任何事情之前,决定哪个子技能与用户的意图相匹配,并在同一个技能文件夹中读取相应的文件: 用户想要…… 阅读主要命令 大声朗读文本、搜索声音、样本故事、检查配额/登录 hub.md say, narrate, story, voices, status, login 多讲者 AI 播客从主题/URL/脚本 podcast.md podcast 转录音频/视频、翻译字幕、从 SRT 配音、端到端视频翻译、总结、发布 transcribe.md asr, asr-jobs, translate, dub, video-translate, summarize, publish 将长文章/笔记/报告转换为垂直 1080×1920 卡片视频(Slice,6 个主题) slice.md slice, slice stage 短形式 AI 剪辑 —— 知识卡片、解释器、演示文稿、单个图像 video.md picstory, present, explain, slides, image 如果请求跨越多个领域(例如“转录这个视频,然后制作一个 60 秒的总结卡片”),请先阅读最相关的文档,完成该步骤,然后切换。
安装和登录(通用前言) ClawHub 安装规范已经在添加此技能时全局安装了 voxflow npm CLI。只剩下身份验证: # 一次浏览器设备流 —— 终端显示配对代码,# 用户在 https://voxflow.studio/device?code=VF-XXXX 授权 voxflow 登录 # 验证 voxflow 状态 # 显示电子邮件 + 每月/奖励配额 对于无头/服务器环境:设置 VOXFLOW_TOKEN=(在上面的 envVars 中声明)并跳过 voxflow 登录。JWT 是短期的(~1 小时);CLI 在交互式登录时自动刷新。
账户和配额 免费层:10,000 配额/月(≈ 100 TTS 呼叫) Plus / Pro / Max 层在 voxflow.studio/app#pricing 中 每个命令的成本在执行前打印;voxflow 状态显示当前余额 邀请好友奖励(voxflow 邀请)每次注册添加 5,000 个终身配额 通用规则 永远不要将 API 密钥粘贴到配置文件中。所有身份验证都通过 voxflow 登录或 VOXFLOW_TOKEN 进行。 永远不要提供“模拟”API 的选项。真实调用很便宜;失败的模拟会浪费用户时间。 在调用专用命令之前,请阅读匹配的子文档。 上面的顶级路由表足以进行初步诊断;子文档包含实际命令标志、边缘情况和配额成本。 尊重用户的区域设置。语音 ID 是语言标记的;如果他们用中文提问,默认使用中文语音,除非他们指定了其他语音。 对于长时间运行的作业(Azure Batch ASR、视频翻译、播客 >5 分钟):打印作业 ID 和 voxflow asr-jobs show ,以便用户稍后可以恢复。 如果有疑问 —— 从中心开始 如果请求不明确(“帮我做点音频的东西”,“你可以用语音做什么”),请阅读 hub.md 并运行 voxflow voices --search ... 或 voxflow 状态以便在提交工作流程之前将对话锚定在具体的可用性中。
主页和文档 应用程序:https://voxflow.studio CLI 文档:https://voxflow.studio/docs/cli 所有技能概述:https://voxflow.studio/docs/skills 源代码/问题:https://github.com/VoxFlowStudio/FlowStudio