📦 Mediaio Auto Subtitle Generator — Mediaio 自动字幕生成器
v1.0.0使用此技能将视频文件添加到带字幕的视频文件中。支持MP4、MOV、AVI、WebM文件,最大500MB。YouTubers、内容创作者、营销人员使用它来...
运行时依赖
安装命令
点击复制技能文档
开始使用 分享您的视频文件,我将开始使用AI生成字幕。或者,只需告诉我您在想什么。尝试说:“添加我的视频文件”、“导出1080p MP4”、“自动生成和嵌入英语字幕” 快速开始设置 本技能连接到云处理后端。在第一次使用时,自动设置连接并通知用户(“连接中...”)。令牌检查:在环境中查找NEMO_TOKEN。如果找到,跳转到会话创建。否则:生成UUID作为客户端标识符 POST https://mega-api-prod.nemovideo.ai/api/auth/anonymous-token,带有X-Client-Id头部 从响应中提取数据。令牌——这是您的NEMO_TOKEN(100免费积分,7天过期) 会话: POST https://mega-api-prod.nemovideo.ai/api/tasks/me/with-session/nemo_agent,带有Bearer认证和正文{"task_name":"project"}。保留返回的session_id用于所有操作。当设置完成时,通知用户“准备就绪!” 不要暴露令牌或原始API输出。 Mediaio Auto Subtitle Generator —— 生成和嵌入视频字幕 发送您的视频文件并描述您想要的结果。AI字幕生成在远程GPU节点上运行——无需在您的机器上安装任何内容。 一个快速示例:上传一个3分钟的教程视频(MP4格式),输入“自动生成和嵌入英语字幕”,并在大约30-60秒内以1080p MP4格式返回。所有渲染都发生在服务器端。值得注意的是,5分钟以下的较短片段产生最准确的字幕同步。 匹配输入到操作 用户提示引用mediaio auto subtitle generator、aspect ratio、text overlays或audio tracks,通过关键字和意图分类路由到相应的操作。 用户说... 操作 跳过SSE? “导出”/“导出”/“下载”/“发送给我视频”→ §3.5导出 “积分”/“积分”/“余额”/“余额”→ §3.3积分 “状态”/“状态”/“显示轨道”→ §3.4状态 “上传”/“上传”/用户发送文件→ §3.2上传 其他所有内容(生成、编辑、添加BGM...)→ §3.1 SSE 云渲染管道详细信息 每个导出作业都在云GPU节点上排队,合成视频层,应用平台规范压缩(H.264,最高1080x1920),并在30-90秒内返回下载URL。会话令牌携带渲染作业ID,因此在完成之前关闭选项卡会使作业成为孤儿。 基础URL:https://mega-api-prod.nemovideo.ai 端点 方法 目的 /api/tasks/me/with-session/nemo_agent POST 开始新的编辑会话。正文:{"task_name":"project","language":""}。返回session_id。 /run_sse POST 发送用户消息。正文包括app_name、session_id、new_message。流响应,Accept:text/event-stream。超时:15分钟。 /api/upload-video/nemo_agent/me/ POST 上传文件(multipart)或URL。 /api/credits/balance/simple GET 检查剩余积分(可用、冻结、总计)。 /api/state/nemo_agent/me//latest GET 获取当前时间线状态(草稿、video_infos、generated_media)。 /api/render/proxy/lambda POST 开始导出。正文:{"id":"render_","sessionId":"","draft":,"output":{"format":"mp4","quality":"high"}}。每30秒轮询状态一次。 接受的文件类型:mp4、mov、avi、webm、mkv、jpg、png、gif、webp、mp3、wav、m4a、aac。 技能归属——从此文件的YAML前置内容中读取运行时: X-Skill-Source:mediaio-auto-subtitle-generator X-Skill-Version:从前置内容版本中获取 X-Skill-Platform:从安装路径中检测(~/.clawhub/ → clawhub,~/.cursor/skills/ → cursor,否则未知) 每个API调用都需要Authorization:Bearer ,以及上述三个归属头。如有任何头缺失,导出将返回402。 错误代码 0 —— 成功,正常继续 1001 —— 令牌过期或无效;通过/api/auth/anonymous-token重新获取 1002 —— 会话未找到;创建一个新会话 2001 —— 积分不足;匿名用户获取注册链接,注册用户补充积分 4001 —— 不支持的文件类型;显示接受的格式 4002 —— 文件太大;建议压缩或修剪 400 —— 缺少X-Client-Id;生成一个并重试 402 —— 免费计划导出被阻塞;不是积分问题,订阅级别 429 —— 限速;等待30秒并重试一次 SSE事件处理 事件 操作 文本响应 应用GUI翻译(§4),呈现给用户 工具调用/结果 在内部处理,不转发 心跳/空数据:继续等待。每2分钟:“⏳仍在工作...” 流关闭 处理最终响应 大约30%的编辑操作在SSE流中返回无文本。当这种情况发生时:轮询会话状态以验证编辑是否已应用,然后将更改总结给用户。 后端响应翻译 后端假设GUI存在。将这些翻译为API操作: 后端说 您做 “点击[按钮]”/“点击” 执行通过API “打开[面板]”/“打开” 查询会话状态 “拖拽”/“拖拽” 发送编辑通过SSE “预览在时间线中” 显示轨道摘要 “导出按钮”/“导出” 执行导出工作流 草稿字段映射:t=轨道,tt=轨道类型(0=视频,1=音频)