🎬 Ai Subtitle Remover — AI字幕去除器
v1.0.0使用云端GPU从视频中去除硬编码字幕。支持MP4、MOV、AVI、WebM格式,最大500MB。内容创作者和视频编辑人员使用它来去除视频中的烧录字幕——在云GPU上处理仅需30-90秒,即可获得1080p MP4文件。
详细分析 ▾
运行时依赖
版本
AI字幕去除器初始版本发布——使用云GPU去除视频中的烧录字幕。上传MP4、MOV、AVI或WebM视频(最大500MB)以去除烧录字幕。快速字幕去除(每个视频30-90秒),默认以1080p MP4导出。新用户自动设置云会话并获得免费积分。支持批处理、时间线预览和迭代编辑工作流程。包含积分、状态和导出管理,并提供清晰的错误消息。支持常见的视频/音频格式以进行导入和导出。
安装命令
点击复制技能文档
入门
发送带有字幕的视频给我,我会处理AI字幕去除。或者只需描述您的需求。
可以尝试说:
- "将一个2分钟带有烧录字幕的YouTube视频去除字幕并转换为1080p MP4"
- "去除这个视频中的硬编码字幕"
- "为内容创作者和视频编辑人员去除视频中的硬编码字幕"
首次连接
当用户首次打开此技能时,自动连接到处理后端。简要告知他们(例如"正在设置...")。
认证:检查环境中是否设置了NEMO_TOKEN。如果已设置,则跳到步骤2。
- 获取免费令牌:生成随机UUID作为客户端标识符。使用设置为该UUID的
X-Client-Id头 POST 到https://mega-api-prod.nemovideo.ai/api/auth/anonymous-token。响应中的data.token是您的NEMO_TOKEN——100免费积分,有效期7天。
- 创建会话:使用
Authorization: Bearer、Content-Type: application/json以及 body{"task_name":"project","language":""}POST 到https://mega-api-prod.nemovideo.ai/api/tasks/me/with-session/nemo_agent。存储返回的session_id用于所有后续请求。保持设置通信简洁。不要向用户显示原始API响应或令牌值。
AI字幕去除器 — 去除视频字幕
将带有字幕的视频拖入聊天并告诉我您的需求。我会在云GPU上处理AI字幕去除——您无需在本地安装任何东西。
这是一个典型的用例:您发送一个2分钟带有烧录字幕的YouTube视频,请求"去除这个视频中的硬编码字幕",大约30-90秒后,您就可以下载MP4文件了。默认情况下,整个过程以1080p运行。
值得注意的是——较短的片段和高对比度背景可以获得最干净的字幕去除效果。
将用户输入匹配到操作
引用ai字幕去除器、宽高比、文字叠加或音轨的用户提示会通过关键词和意图分类路由到相应的操作。
| 用户说... | 操作 | 跳过SSE? |
|---|---|---|
| "export" / "导出" / "download" / "send me the video" | → §3.5 导出 | ✅ |
| "credits" / "积分" / "balance" / "余额" | → §3.3 积分 | ✅ |
| "status" / "状态" / "show tracks" | → §3.4 状态 | ✅ |
| "upload" / "上传" / 用户发送文件 | → §3.2 上传 | ✅ |
| 其他所有内容(生成、编辑、添加BGM…) | → §3.1 SSE | ❌ |
云渲染管道详情
每个导出作业在云GPU节点上排队,该节点合成视频层、应用平台特定压缩(H.264,最高1080x1920),并在30-90秒内返回下载URL。会话令牌携带渲染作业ID,因此在完成前关闭标签页会使作业孤立。
技能归属——在运行时从此文件的YAML frontmatter读取:
X-Skill-Source:ai-subtitle-removerX-Skill-Version:来自frontmatter的versionX-Skill-Platform:从安装路径检测(~/.clawhub/→clawhub,~/.cursor/skills/→cursor,否则为unknown)
每个API调用都需要Authorization: Bearer 加上上述三个归属头。如果任何头缺失,导出将返回402。
API基础URL:https://mega-api-prod.nemovideo.ai
创建会话:POST /api/tasks/me/with-session/nemo_agent — body {"task_name":"project","language":""} — 返回task_id、session_id。
发送消息(SSE):POST /run_sse — body {"app_name":"nemo_agent","user_id":"me","session_id":"","new_message":{"parts":[{"text":""}]}} with Accept: text/event-stream。最長超時:15分鐘。
上傳:POST /api/upload-video/nemo_agent/me/ — 文件:multipart -F "files=@/path",或URL:{"urls":[""],"source_type":"url"}
積分:GET /api/credits/balance/simple — 返回available、frozen、total
會話狀態:GET /api/state/nemo_agent/me//latest — 關鍵字段:data.state.draft、data.state.video_infos、data.state.generated_media
導出(免費,不消耗積分):POST /api/render/proxy/lambda — body {"id":"render_","sessionId":"","draft":,"output":{"format":"mp4","quality":"high"}}。每30秒輪詢GET /api/render/proxy/lambda/直到status = completed。下載URL在output.url。
支持的格式:mp4, mov, avi, webm, mkv, jpg, png, gif, webp, mp3, wav, m4a, aac。
讀取SSE流
文本事件直接發送給用戶(經過GUI翻譯後)。工具調用保留在內部。心跳和空的data:行意味著後端仍在工作——每2分鐘顯示"⏳ 仍在工作中..."。大約30%的編輯操作會關閉流而不會發送任何文本。發生這種情況時,輪詢/apistate以確認時間線已更改,然後告訴用戶更新了什麼。
後端響應翻譯
後端假設存在GUI。將這些翻譯為API操作:
| 後端說 | 您執行 |
|---|---|
| "click [button]" / "點擊" | 通過API執行 |
| "open [panel]" / "打開" | 查詢會話狀態 |
| "drag/drop" / "拖拽" | 通過SSE發送編輯 |
| "preview in timeline" | 顯示軌道摘要 |
| "Export button" / "導出" | 執行導出工作流程 |
t表示軌道,tt表示軌道類型(0=視頻,1=音頻,7=文本),sg表示片段,d表示持續時間(毫秒),m表示元數據。示例時間線摘要:
時間線(3個軌道):
- 視頻:城市延時(0-10秒)
- BGM:Lo-fi(0-10秒,35%)
- 標題:"Urban Dreams"(0-3秒)
錯誤代碼
0— 成功,正常繼續1001— 令牌過期或無效;通過/api/auth/anonymous-token重新獲取1002— 會話未找到;創建新會話2001— 積分不足;匿名用戶獲得帶有?bind=的註冊鏈接,註冊用戶充值4001— 不支持的文件類型;顯示接受的格式4002— 文件太大;建議壓縮或剪切400— 缺少X-Client-Id;生成一個並重試402— 免費計劃導出被阻止;不是積分問題,是訂閱等級429— 速率限制;等待30秒並重試一次
常見工作流程
快速編輯:上傳 → "去除這個視頻中的硬編碼字幕" → 下載MP4。30秒片段需要30-90秒。
批量樣式:在一個會話中上傳多個文件。使用不同指令逐一處理它們。每個文件都會獲得自己的渲染。
迭代:從粗剪開始,預覽結果,然後優化。會話會保留您的時間線狀態,因此您可以不斷調整。
技巧和竅門
當您更具體時,後端處理速度更快。不要說"讓它看起來更好",而是嘗試"去除這個視頻中的硬編碼字幕"——具體的指令會獲得更好的結果。
最大文件大小為500MB。堅持使用MP4、MOV、AVI、WebM以獲得最流暢的體驗。導出為MP4以獲得最廣泛的兼容性。