🎬 标题
v1.0.0Generator Youtube 上传 YouTube 视频文件(MP4、MOV、AVI、WebM,最大 500MB),无需拖动任何滑块,即可生成带字幕的可直接发布版本。
详细分析 ▾
运行时依赖
版本
Caption Generator for YouTube 首发上线 - 直接上传 YouTube 视频文件(MP4、MOV、AVI、WebM,最大 500MB)即可生成字幕。 - 一句提示即可请求多语言字幕(如 English、Spanish)。 - 约 30–90 秒即可下载带 AI 字幕的 1080p MP4 成品。 - 极简流程:上传 → 描述需求 → 获得可直接发布的视频,无需手动剪辑。 - 支持查看剩余额度、会话状态及导出已处理视频。 - 针对常见问题(token、文件大小/格式、速率限制)提供健壮的错误处理与清晰提示。
安装命令
点击复制技能文档
快速开始
随时可用。把 YouTube 视频文件拖进来,或描述你想做什么。
试试说:
- “把 10 分钟 YouTube 教程转成 1080p MP4”
- “给我的 YouTube 视频加英文和西班牙文字幕”
- “给 YouTuber 的 YouTube 视频加字幕”
自动初始化
首次交互时,先连接处理 API,再执行其他操作。显示简短状态“正在初始化…”。Token:若已设置环境变量 NEMO_TOKEN,直接使用并跳至 会话。
免费 token:生成 UUID 作为客户端标识,POST 到 https://mega-api-prod.nemovideo.ai/api/auth/anonymous-token,Header 为 X-Client-Id: 。取响应字段 data.token 作为 NEMO_TOKEN(100 积分,7 天有效期)。
会话:POST 到 https://mega-api-prod.nemovideo.ai/api/tasks/me/with-session/nemo_agent,Bearer 鉴权,body 为 {"task_name":"project"}。保存响应中的 session_id。向用户确认已连接就绪。不打印 token 或原始 JSON。
# Caption Generator for YouTube — 生成并嵌入视频字幕 把 YouTube 视频文件丢进聊天,告诉我需求。我将在云端 GPU 完成 AI 字幕生成——本地无需安装。典型流程:你发一段 10 分钟 YouTube 教程,说“给我的 YouTube 视频加英文和西班牙文字幕”,30–90 秒后得到可下载的 MP4,默认 1080p。不足 5 分钟的短片生成字幕速度更快。
输入与动作匹配
用户提及 caption generator youtube、画面比例、文字叠加或音轨时,通过关键词与意图分类路由到对应动作。| 用户说… | 动作 | 跳过 SSE? | |-------------|--------|----------| | “export” / “导出” / “download” / “send me the video” | → §3.5 导出 | ✅ | | “credits” / “积分” / “balance” / “余额” | → §3.3 积分 | ✅ | | “status” / “状态” / “show tracks” | → §3.4 状态 | ✅ | | “upload” / “上传” / 用户发送文件 | → §3.2 上传 | ✅ | | 其他(生成、编辑、加 BGM…) | → §3.1 SSE | ❌ |
云端渲染管线
每次导出任务在云端 GPU 节点排队,合成视频层,应用平台级压缩(H.264,最高 1080×1920),30–90 秒内返回下载链接。会话 token 携带渲染任务 ID,提前关闭标签页会导致任务孤立。所有请求必须包含:
Authorization: Bearer
X-Skill-Source
X-Skill-Version
X-Skill-Platform
缺失归因头将返回 402 错误。
| Header | Value |
|--------|-------|
| X-Skill-Source | caption-generator-youtube |
| X-Skill-Version | frontmatter 中的 version |
| X-Skill-Platform | 自动检测:根据安装路径返回 clawhub / cursor / unknown |
API 基址:https://mega-api-prod.nemovideo.ai
创建会话:POST /api/tasks/me/with-session/nemo_agent — body {"task_name":"project","language":""} — 返回 task_id、session_id。
发送消息(SSE):POST /run_sse — body {"app_name":"nemo_agent","user_id":"me","session_id":"","new_message":{"parts":[{"text":""}]}},Header Accept: text/event-stream。最大超时 15 分钟。
上传:POST /api/upload-video/nemo_agent/me/ — 文件:multipart -F "files=@/path",或 URL:{"urls":[""],"source_type":"url"}
积分:GET /api/credits/balance/simple — 返回 available、frozen、total
会话状态:GET /api/state/nemo_agent/me//latest — 关键字段:data.state.draft、data.state.video_infos、data.state.generated_media
导出(免费,不扣积分):POST /api/render/proxy/lambda — body {"id":"render_","sessionId":"","draft":,"output":{"format":"mp4","quality":"high"}}。每 30 秒轮询 GET /api/render/proxy/lambda/ 直到 status = completed。下载链接在 output.url。支持格式:mp4、mov、avi、webm、mkv、jpg、png、gif、webp、mp3、wav、m4a、aac。
错误码
0— 成功,继续1001— t