📦 Video To Subtitle

v1.0.0

跳过专业剪辑软件的学习曲线。只需描述你的需求——生成英文和西班牙文字幕并内嵌到视频中——即可...

0· 0·0 当前·0 累计
0
安全扫描
VirusTotal
无害
查看报告
OpenClaw
安全
medium confidence
该技能的请求与运行时指令与云端视频字幕服务一致:它需要一个服务令牌(NEMO_TOKEN),并将用户视频上传至供应商 API;技能中无任何内容表明存在无关凭据访问或隐藏安装行为。
评估建议
This 技能 will 上传 your videos and audio to mega-API-prod.nemovideo.AI and use a 服务 令牌 (NEMO_令牌). Before 安装ing or using it: 1) Confirm you trust the domAIn/vendor and review their 隐私/retention policy (sensitive videos will leave your machine). 2) If you prefer, provide your own NEMO_令牌 rather than letting the 技能 auto-创建 an anonymous 令牌. 3) Test with non-sensitive sample videos first to confirm behavior. 4) Note the minor metadata mismatch (a config path is mentioned in the 技能.md frontmatter but not...
详细分析 ▾
用途与能力
该技能声称通过远程渲染服务生成并烧录字幕,其说明仅调用该服务的 API。为此目的,请求单一服务令牌(NEMO_TOKEN)是合理的。该技能还记录了上传、SSE、渲染、credits 和 state 等端点,均与云端渲染/字幕工作流一致。
指令范围
运行时指令包括将用户视频/音频文件上传至 https://mega-api-prod.nemovideo.ai 并通过 SSE 流式传输编辑结果,这是该能力所预期的行为。若未设置 NEMO_TOKEN,skill 将自动获取匿名令牌(POST /api/auth/anonymous-token),并指示 agent 保存 session_id 以供后续调用。同时需附带特定归因标头(包括基于安装路径模式的平台检测步骤)。这些行为符合既定用途,但请注意用户内容会被发送至第三方端点,且 agent 会自动创建/使用凭据。
安装机制
No 安装 spec or code files are present (instruction-only). This minimizes on-disk 安装ation risk. Because there is no 下载able code, the 技能's 运行time surface is the API calls described in 技能.md.
凭证需求
The 技能 declares a single primary 凭证 (NEMO_令牌), which matches the 服务-oriented purpose. However, 技能.md describes an auto-provisioning flow that will 创建 and use an anonymous 令牌 when NEMO_令牌 is absent, which effectively grants the 代理 the ability to obtAIn and use 服务 凭证s at 运行time. Also note a minor metadata inconsistency: the 技能.md frontmatter 列出s a config path (~/.config/nemovideo/) while the registry metadata included with the 技能 报告ed no required config paths.
持久化与权限
该技能并非始终启用,也不会请求提升的平台权限。它会在工作期间存储 session_id(对于基于会话的 API 属正常行为)。frontmatter 中提到的 config path 暗示服务可能使用本地配置目录,但除正常会话处理外,并未明确指示将持久化密钥写入磁盘。
安全有层次,运行前请审查代码。

运行时依赖

无特殊依赖

安装命令

点击复制
官方npx clawhub@latest install video-to-subtitle
镜像加速npx clawhub@latest install video-to-subtitle --registry https://cn.longxiaskill.com

技能文档

入门 把视频文件发给我,立刻开始生成字幕。或简单告诉我你的想法。 试试说: “generate my video files” “export 1080p MP4” “generate subtitles in English and Spanish”

首次连接 用户首次打开 skill 时,自动连接后端并提示“Setting up...”。

鉴权

  • 检查环境变量 NEMO_TOKEN;若存在,跳到第 2 步。
  • 获取免费 token:
- 生成随机 UUID 作为 client identifier。 - POST https://mega-api-prod.nemovideo.ai/api/auth/anonymous-token,header X-Client-Id 设为该 UUID。 - 取响应 data.token 作为 NEMO_TOKEN(100 免费积分,7 天有效)。
  • 创建会话:
POST https://mega-api-prod.nemovideo.ai/api/tasks/me/with-session/nemo_agent Header: Authorization: Bearer , Content-Type: application/json Body: {"task_name":"project","language":""} 保存返回的 session_id,用于后续请求。 全程提示简短,不展示原始 API 响应或 token 值。

视频转字幕——生成并嵌入字幕 上传视频并描述需求即可。字幕生成在远程 GPU 节点完成,本机无需安装。 示例:上传 3 分钟 YouTube 教程,输入“generate subtitles in English and Spanish and burn them into the video”,30-90 秒返回 1080p MP4,全程云端渲染。 提示:音频清晰、背景噪音少,字幕准确率最高。

用户指令匹配 关键词与意图分类决定路由: 用户说… → 动作 (Skip SSE?) “export” / “导出” / “download” / “send me the video” → §3.5 Export ✅ “credits” / “积分” / “balance” / “余额” → §3.3 Credits ✅ “status” / “状态” / “show tracks” → §3.4 State ✅ “upload” / “上传” / 用户发送文件 → §3.2 Upload ✅ 其余(generate、edit、加 BGM…)→ §3.1 SSE ❌

云端渲染流程 导出任务排队到云 GPU 节点,合成视频层,按平台规格压缩(H.264,最大 1080×1920),30-90 秒内返回下载链接。 会话 token 携带 render job ID,关闭页面前未完成会导致任务孤立。

接口速查 Base URL: https://mega-api-prod.nemovideo.ai

Endpoint | Method | 用途 /api/tasks/me/with-session/nemo_agent | POST | 新建编辑会话,返回 session_id /run_sse | POST | 发送用户消息,SSE 流式响应,超时 15 min /api/upload-video/nemo_agent/me/ | POST | 上传文件或 URL(multipart) /api/credits/balance/simple | GET | 查询剩余积分 /api/state/nemo_agent/me//latest | GET | 获取当前时间线状态 /api/render/proxy/lambda | POST | 开始导出,轮询状态

支持格式:mp4, mov, avi, webm, mkv, jpg, png, gif, webp, mp3, wav, m4a, aac

请求头必须包含: Authorization: Bearer X-Skill-Source, X-Skill-Version, X-Skill-Platform(运行时读取 YAML frontmatter) 缺失将返回 402。

错误码 0 — 成功 1001 — token 过期/无效,重新获取 1002 — 会话不存在,新建会话 2001 — 积分耗尽,匿名用户可绑定注册,注册用户充值 4001 — 不支持的文件类型 4002 — 文件过大,建议压缩或裁剪 400 — 缺少 X-Client-Id,生成后重试 402 — 免费版导出受限,非积分问题 429 — 限流,等待 30s 后重试一次

SSE 事件处理

  • 文本响应:经 GUI 翻译(§4)后展示给用户
  • 工具调用/结果:内部处理,不转发
  • heartbeat/空数据:保持等待,每 2 分钟提示“⏳ Still working...”
  • 流关闭:约 30% 编辑操作无文本返回,轮询会话状态确认变更后向用户总结

GUI 指令翻译 后端按可视化界面返回指令,映射为 API 调用: “click” / “点击” → 调用对应 endpoint “open” / “打开” → 查询会话状态获取数据 “drag/drop” / “拖拽” → 发送编辑请求

数据来源ClawHub ↗ · 中文优化:龙虾技能库