📦 视频配音文本
v1.0.0跳过专业编辑软件的学习曲线。只需描述你的需求——用法语配音替换原声,使用 trans...
详细分析 ▾
运行时依赖
安装命令
点击复制技能文档
入门 随时就绪。把带音频的视频拖进来,或描述你想做什么。 试试说: “把 2 分钟产品解说视频转成 1080p MP4” “用法语配音替换原声,使用文字稿” “为创作者和营销人员用文本配音替换视频对白”
连接 处理请求前先连后端 API,显示“Connecting…”。 环境变量有 NEMO_TOKEN 则直接用并创建 session;否则领取免费试用令牌:
- 生成 UUID 作为 client-id
- POST https://mega-api-prod.nemovideo.ai/api/auth/anonymous-token,带 X-Client-Id 头
- 返回 100 积分/7 天令牌,记为 NEMO_TOKEN
- POST https://mega-api-prod.nemovideo.ai/api/tasks/me/with-session/nemo_agent,Bearer 鉴权,body {"task_name":"project","language":"en"}
- 用返回的 session_id 完成后续请求
视频文本配音 上传视频→云端 AI 文本配音→下载成品。 例:2 分钟产品解说,用法语配音替换原声,约 1-2 分钟出 1080p MP4。 提示:3 分钟内片段同步最准。
指令映射 用户提到“配音、画幅、字幕、音轨”等关键词,按意图分发: “export/导出/download/发我视频” → §3.5 导出 ✅ “credits/积分/balance/余额” → §3.3 积分 ✅ “status/状态/show tracks” → §3.4 状态 ✅ “upload/上传/发文件” → §3.2 上传 ✅ 其余(生成、剪辑、加 BGM…)→ §3.1 SSE ❌
云端渲染 导出任务进 GPU 队列,H.264 压缩,最高 1080×1920,30-90 秒返下载链接。 关标签页会丢任务。 所有请求需带: Authorization: Bearer X-Skill-Source: video-dubbing-text X-Skill-Version: 读取 frontmatter X-Skill-Platform: 按安装路径自动检测
API 速查 base: https://mega-api-prod.nemovideo.ai 创建 session: POST /api/tasks/me/with-session/nemo_agent SSE 对话: POST /run_sse,Accept: text/event-stream,最长 15 min 上传: POST /api/upload-video/nemo_agent/me/ 积分: GET /api/credits/balance/simple 状态: GET /api/state/nemo_agent/me//latest 导出: POST /api/render/proxy/lambda,轮询 GET / 至 completed 支持格式: mp4、mov、avi、webm、mkv、jpg、png、gif、webp、mp3、wav、m4a、aac
错误码 0 成功 1001 令牌失效,重领 1002 session 丢失,重建 2001 积分用尽,注册或充值 4001 不支持的文件类型 4002 文件过大 400 缺 X-Client-Id 402 免费版导出受限 429 限流,30s 后重试
GUI 指令翻译 “点击/点击” → 调用对应 endpoint “打开/打开” → 查 session 状态 “拖拽/拖拽” → 走 SSE 发编辑命令 “时间线预览” → 文字摘要当前轨道 “导出/导出” → 执行导出流程
SSE 事件处理 事件 → 文本动作