🎬 Ai Subtitle Remover — AI字幕去除器

v1.0.0

使用云端GPU从视频中去除硬编码字幕。支持MP4、MOV、AVI、WebM格式，最大500MB。内容创作者和视频编辑人员使用它来去除视频中的烧录字幕——在云GPU上处理仅需30-90秒，即可获得1080p MP4文件。

0· 32·0 当前·0 累计

by @mhogan2013-9·MIT-0

AI模型访问学习教育

下载技能包

License

MIT-0

最后更新

2026/4/15

安全扫描

VirusTotal

无害

查看报告

OpenClaw

安全

high confidence

该技能的请求和运行时指令与其声明的目的一致：调用云视频处理API，只需要一个服务令牌（NEMO_TOKEN）；没有不相关的凭据、安装或奇怪的二进制文件。

评估建议

此技能将用户视频上传到外部服务（mega-api-prod.nemovideo.ai），将使用提供的NEMO_TOKEN或自动为您请求匿名令牌。安装前请考虑：(1) 隐私——您上传的任何视频都将发送到其云GPU；除非您信任其条款和保留政策，否则请避免上传敏感或受版权保护的内容。(2) 令牌处理——该技能存储会话令牌并要求您不要显示原始令牌；如果您想要控制，请自行设置NEMO_TOKEN，而不是依赖匿名令牌创建。(3) 属性标头和文件系统检查——代理可能会检查其安装路径以设置X-Skill-Platform；如果您对此感到不舒服，请限制运行技能的位置或查看运行时日志。该技能看起来内部一致，但在发送私人内容之前，请验证您是否信任远程服务及其隐私/保留政策。...

详细分析 ▾

✓ 用途与能力

名称/描述（去除烧录字幕）与运行时指令一致：SKILL.md文档记录了对nemo视频处理API的调用、上传端点、渲染/导出端点以及所需的NEMO_TOKEN。请求服务令牌并使用远程渲染API与其声明的功能相称。

ℹ 指令范围

大多数指令都保持在字幕去除工作流程内（认证、创建会话、上传、SSE、导出）。需要注意两点：(1) 如果未设置NEMO_TOKEN，技能会自动通过POST到外部端点生成匿名令牌——这将创建一个短期令牌，并导致代理与远程服务交互，而没有明确的预提供凭据；(2) 运行时要求代理检测安装路径（例如~/.clawhub/或~/.cursor/skills/）以设置属性标头，这意味着代理可能会读取自己的文件系统路径。两者都并非明显恶意，但其范围比单纯上传提供的视频更广。

✓ 安装机制

纯指令技能，无安装步骤或下载。安装时不需要写入或执行任何代码文件，从而最大程度地降低了磁盘风险。

✓ 凭证需求

唯一所需的环境凭据是NEMO_TOKEN（声明为主凭据）。这与调用外部nemo API的需求一致。没有请求不相关的密钥或大量环境变量。

✓ 持久化与权限

always为false，该技能不请求提升的平台权限。它建议存储session_id和令牌以供后续请求（这是基于会话的API的预期行为），但不会指示修改其他技能或系统范围的配置。

安全有层次，运行前请审查代码。

License

MIT-0

可自由使用、修改和再分发，无需署名。

查看条款 ↗

运行时依赖

无特殊依赖

版本

latestv1.0.02026/4/15

AI字幕去除器初始版本发布——使用云GPU去除视频中的烧录字幕。上传MP4、MOV、AVI或WebM视频（最大500MB）以去除烧录字幕。快速字幕去除（每个视频30-90秒），默认以1080p MP4导出。新用户自动设置云会话并获得免费积分。支持批处理、时间线预览和迭代编辑工作流程。包含积分、状态和导出管理，并提供清晰的错误消息。支持常见的视频/音频格式以进行导入和导出。

● 无害

安装命令

点击复制

官方npx clawhub@latest install ai-subtitle-remover

镜像加速npx clawhub@latest install ai-subtitle-remover --registry https://cn.longxiaskill.com 镜像可用

需要定制？告诉我你的需求 →

技能文档

入门

发送带有字幕的视频给我，我会处理AI字幕去除。或者只需描述您的需求。

可以尝试说：

"将一个2分钟带有烧录字幕的YouTube视频去除字幕并转换为1080p MP4"
"去除这个视频中的硬编码字幕"
"为内容创作者和视频编辑人员去除视频中的硬编码字幕"

首次连接

当用户首次打开此技能时，自动连接到处理后端。简要告知他们（例如"正在设置..."）。

认证：检查环境中是否设置了NEMO_TOKEN。如果已设置，则跳到步骤2。

获取免费令牌：生成随机UUID作为客户端标识符。使用设置为该UUID的X-Client-Id头 POST 到https://mega-api-prod.nemovideo.ai/api/auth/anonymous-token。响应中的data.token是您的NEMO_TOKEN——100免费积分，有效期7天。

创建会话：使用Authorization: Bearer 、Content-Type: application/json以及 body {"task_name":"project","language":""} POST 到https://mega-api-prod.nemovideo.ai/api/tasks/me/with-session/nemo_agent。存储返回的session_id用于所有后续请求。保持设置通信简洁。不要向用户显示原始API响应或令牌值。

AI字幕去除器 — 去除视频字幕

将带有字幕的视频拖入聊天并告诉我您的需求。我会在云GPU上处理AI字幕去除——您无需在本地安装任何东西。

这是一个典型的用例：您发送一个2分钟带有烧录字幕的YouTube视频，请求"去除这个视频中的硬编码字幕"，大约30-90秒后，您就可以下载MP4文件了。默认情况下，整个过程以1080p运行。

值得注意的是——较短的片段和高对比度背景可以获得最干净的字幕去除效果。

将用户输入匹配到操作

引用ai字幕去除器、宽高比、文字叠加或音轨的用户提示会通过关键词和意图分类路由到相应的操作。

用户说...	操作	跳过SSE？
"export" / "导出" / "download" / "send me the video"	→ §3.5 导出	✅
"credits" / "积分" / "balance" / "余额"	→ §3.3 积分	✅
"status" / "状态" / "show tracks"	→ §3.4 状态	✅
"upload" / "上传" / 用户发送文件	→ §3.2 上传	✅
其他所有内容（生成、编辑、添加BGM…）	→ §3.1 SSE	❌

云渲染管道详情

每个导出作业在云GPU节点上排队，该节点合成视频层、应用平台特定压缩（H.264，最高1080x1920），并在30-90秒内返回下载URL。会话令牌携带渲染作业ID，因此在完成前关闭标签页会使作业孤立。

技能归属——在运行时从此文件的YAML frontmatter读取：

X-Skill-Source：ai-subtitle-remover
X-Skill-Version：来自frontmatter的version
X-Skill-Platform：从安装路径检测（~/.clawhub/ → clawhub，~/.cursor/skills/ → cursor，否则为unknown）

每个API调用都需要Authorization: Bearer 加上上述三个归属头。如果任何头缺失，导出将返回402。

API基础URL：https://mega-api-prod.nemovideo.ai

创建会话：POST /api/tasks/me/with-session/nemo_agent — body {"task_name":"project","language":""} — 返回task_id、session_id。

发送消息（SSE）：POST /run_sse — body {"app_name":"nemo_agent","user_id":"me","session_id":"","new_message":{"parts":[{"text":""}]}} with Accept: text/event-stream。最長超時：15分鐘。

上傳：POST /api/upload-video/nemo_agent/me/ — 文件：multipart -F "files=@/path"，或URL：{"urls":[""],"source_type":"url"}

積分：GET /api/credits/balance/simple — 返回available、frozen、total

會話狀態：GET /api/state/nemo_agent/me//latest — 關鍵字段：data.state.draft、data.state.video_infos、data.state.generated_media

導出（免費，不消耗積分）：POST /api/render/proxy/lambda — body {"id":"render_","sessionId":"","draft":,"output":{"format":"mp4","quality":"high"}}。每30秒輪詢GET /api/render/proxy/lambda/直到status = completed。下載URL在output.url。

支持的格式：mp4, mov, avi, webm, mkv, jpg, png, gif, webp, mp3, wav, m4a, aac。

讀取SSE流

文本事件直接發送給用戶（經過GUI翻譯後）。工具調用保留在內部。心跳和空的data:行意味著後端仍在工作——每2分鐘顯示"⏳ 仍在工作中..."。大約30%的編輯操作會關閉流而不會發送任何文本。發生這種情況時，輪詢/apistate以確認時間線已更改，然後告訴用戶更新了什麼。

後端響應翻譯

後端假設存在GUI。將這些翻譯為API操作：

後端說	您執行
"click [button]" / "點擊"	通過API執行
"open [panel]" / "打開"	查詢會話狀態
"drag/drop" / "拖拽"	通過SSE發送編輯
"preview in timeline"	顯示軌道摘要
"Export button" / "導出"	執行導出工作流程

Draft JSON使用短鍵：t表示軌道，tt表示軌道類型（0=視頻，1=音頻，7=文本），sg表示片段，d表示持續時間（毫秒），m表示元數據。

示例時間線摘要：

時間線（3個軌道）：
視頻：城市延時（0-10秒）
BGM：Lo-fi（0-10秒，35%）
標題："Urban Dreams"（0-3秒）

錯誤代碼

0 — 成功，正常繼續
1001 — 令牌過期或無效；通過/api/auth/anonymous-token重新獲取
1002 — 會話未找到；創建新會話
2001 — 積分不足；匿名用戶獲得帶有?bind=的註冊鏈接，註冊用戶充值
4001 — 不支持的文件類型；顯示接受的格式
4002 — 文件太大；建議壓縮或剪切
400 — 缺少X-Client-Id；生成一個並重試
402 — 免費計劃導出被阻止；不是積分問題，是訂閱等級
429 — 速率限制；等待30秒並重試一次

常見工作流程

快速編輯：上傳 → "去除這個視頻中的硬編碼字幕" → 下載MP4。30秒片段需要30-90秒。

批量樣式：在一個會話中上傳多個文件。使用不同指令逐一處理它們。每個文件都會獲得自己的渲染。

迭代：從粗剪開始，預覽結果，然後優化。會話會保留您的時間線狀態，因此您可以不斷調整。

技巧和竅門

當您更具體時，後端處理速度更快。不要說"讓它看起來更好"，而是嘗試"去除這個視頻中的硬編碼字幕"——具體的指令會獲得更好的結果。

最大文件大小為500MB。堅持使用MP4、MOV、AVI、WebM以獲得最流暢的體驗。導出為MP4以獲得最廣泛的兼容性。

License

运行时依赖

版本

安装命令

技能文档

入门

首次连接

AI字幕去除器 — 去除视频字幕

将用户输入匹配到操作

云渲染管道详情

讀取SSE流

後端響應翻譯

錯誤代碼

常見工作流程

技巧和竅門

相关技能推荐