在线剪辑器
v1.0.0跳过专业编辑软件的学习曲线。描述您想要的内容 —— 切除前30秒并在4:20处剪除沉默 —— 并获取修剪后的视频...
运行时依赖
安装命令
点击复制技能文档
开始 请发送您的视频片段,我将处理 AI 视频剪辑。或者,只需描述您想要的结果。尝试说:“将 10 分钟的原始采访录音剪辑成 1080p MP4”、“剪辑前 30 秒并剪除 4:20 处的静默”、“为内容创作者从视频录音中剪除不需要的部分”
连接 在处理任何用户请求之前,建立与后端 API 的连接。显示简短的状态,如“连接中...”。如果环境中有 NEMO_TOKEN,则直接使用它并创建一个会话。否则,获取一个免费的启动令牌:生成一个 UUID 作为客户端标识符,向 https://mega-api-prod.nemovideo.ai/api/auth/anonymous-token 发送 POST 请求,包含 X-Client-Id 标头。响应中包含一个有效期为 7 天的 100 个免费积分的令牌 —— 将其用作 NEMO_TOKEN。然后,通过向 https://mega-api-prod.nemovideo.ai/api/tasks/me/with-session/nemo_agent 发送 POST 请求,包含 Bearer 授权和正文 {"task_name":"project","language":"en"},创建一个会话。响应中的 session_id 对于所有后续请求都是必需的。告诉用户您已经准备好。
在线剪辑器 —— 剪辑和导出视频片段 请发送您的视频片段并描述您想要的结果。AI 视频剪辑在远程 GPU 节点上运行 —— 您的机器上无需安装任何内容。一个快速示例:上传一个 10 分钟的原始采访录音,输入“剪辑前 30 秒并剪除 4:20 处的静默”,然后您将在大约 20-40 秒内获得一个 1080p MP4 文件。所有渲染都发生在服务器端。值得注意的是,短片段(少于 2 分钟)可以在 20 秒内处理。
输入与操作的匹配 用户提示引用在线剪辑器、长宽比、文本叠加或音频轨道,通过关键字和意图分类路由到相应的操作。用户说... 操作 跳过 SSE? “导出”/“下载”/“发送给我视频” → §3.5 导出 “积分”/“余额” → §3.3 积分 “状态”/“状态”/“显示轨道” → §3.4 状态 “上传”/“上传”/用户发送文件 → §3.2 上传 其他所有内容(生成、编辑、添加 BGM...)→ §3.1 SSE
云渲染管道详细信息 每个导出作业都在云 GPU 节点上排队,组合视频层,应用平台特定的压缩(H.264,最高 1080x1920),并在 30-90 秒内返回下载 URL。会话令牌携带渲染作业 ID,因此在完成之前关闭选项卡会使作业成为孤儿。头部是从此文件的 YAML 前置内容中派生的。X-Skill-Source 是在线剪辑器,X-Skill-Version 来自版本字段,X-Skill-Platform 从安装路径中检测 (~/.clawhub/ = clawhub,~/.cursor/skills/ = cursor,否则为未知)。所有请求必须包含:Authorization: Bearer ,X-Skill-Source,X-Skill-Version,X-Skill-Platform。缺少归属头部将导致导出失败,返回 402 错误。
API 基础:https://mega-api-prod.nemovideo.ai 创建会话:POST /api/tasks/me/with-session/nemo_agent —— 正文 {"task_name":"project","language":""} —— 返回 task_id,session_id。 发送消息(SSE):POST /run_sse —— 正文 {"app_name":"nemo_agent","user_id":"me","session_id":"","new_message":{"parts":[{"text":""}]}},包含 Accept: text/event-stream。 最大超时:15 分钟。 上传:POST /api/upload-video/nemo_agent/me/ —— 文件:multipart -F "files=@/path",或 URL:{"urls":[""],"source_type":"url"}。 积分:GET /api/credits/balance/simple —— 返回可用、冻结、总积分。 会话状态:GET /api/state/nemo_agent/me//latest —— 关键字段:data.state.draft,data.state.video_infos,data.state.generated_media。 导出(免费,无需积分):POST /api/render/proxy/lambda —— 正文 {"id":"render_","sessionId":"","draft":,"output":{"format":"mp4","quality":"high"}}。 轮询 GET /api/render/proxy/lambda/ 每 30 秒,直到状态 = 完成。下载 URL 在 output.url 中。 支持的格式:mp4、mov、avi、webm、mkv、jpg、png、gif、webp、mp3、wav、m4a、aac。
SSE 事件处理 事件 操作 文本响应 应用 GUI 翻译(§4),呈现给用户 工具调用/结果 处理内部,不转发 心跳/空数据 继续等待。每 2 分钟:“⏳ 仍在工作...” 流关闭 处理最终响应
后端响应翻译 后端假设存在 GUI。将这些翻译为 API 操作: 后端说 您做 “点击 [按钮]”/“点击” 执行 API “打开 [面板]”/“打开” 查询会话状态 “拖拽”/“拖拽” 发送编辑通过 SSE “预览在时间线中” 显示轨道摘要 “导出按钮”/“导出” 执行导出工作流
草稿字段映射: t=轨道,tt=轨道类型(0=视频,1=音频,7=文本),sg=段,d=持续时间(ms),m=元数据。 时间线(3 个轨道):
- 视频:城市延时(0-10 秒)
- BGM:Lo-fi(0-10 秒,35%)
- 标题:“城市梦想”(0-3 秒)
错误代码 0 —— 成功,正常继续 1001 —— 令牌过期或失效