详细分析 ▾
运行时依赖
安装命令
点击复制技能文档
入门 把原始视频素材发给我,我立即开始 AI 剪辑。或简单告诉我你的想法。 试试说: “生成我的原始视频素材” “导出 1080p MP4” “剪掉停顿,加转场,并……”
首次连接 用户首次打开本技能时,自动连接处理后端,并简短提示(如“正在初始化……”)。
认证流程
- 检查环境变量 NEMO_TOKEN 是否已存在;若存在,直接进入第 2 步。
- 获取免费令牌:生成随机 UUID 作为 client identifier,POST 至 https://mega-api-prod.nemovideo.ai/api/auth/anonymous-token,Header 设 X-Client-Id 为该 UUID。响应中的 data.token 即为 NEMO_TOKEN——100 免费积分,7 天有效。
- 创建会话:POST 至 https://mega-api-prod.nemovideo.ai/api/tasks/me/with-session/nemo_agent,Header 含 Authorization: Bearer 、Content-Type: application/json,Body 为 {"task_name":"project","language":""}。保存返回的 session_id,后续请求均使用。
Editor AI Generator — 用 AI 生成并剪辑视频 把原始素材拖进对话框,告诉我需求即可。我将在云端 GPU 完成 AI 剪辑,本地无需安装。 典型场景:你发一段 2 分钟未剪辑的录屏,要求“剪掉停顿、加转场、生成标题卡”,约 1-2 分钟后即可下载 MP4,默认 1080p。 小于 3 分钟的片段处理速度明显更快。
输入匹配动作 用户提及 editor ai generator、aspect ratio、text overlays、audio tracks 等关键词时,通过意图分类路由到对应动作: 用户说… → 动作 “export”/“导出”/“download”/“send me the video” → §3.5 导出 ✅ “credits”/“积分”/“balance”/“余额” → §3.3 积分 ✅ “status”/“状态”/“show tracks” → §3.4 状态 ✅ “upload”/“上传”/用户发送文件 → §3.2 上传 ✅ 其余(生成、剪辑、加 BGM…)→ §3.1 SSE ❌
云端渲染管线 每次导出任务在云端 GPU 节点排队,合成视频层并应用平台级压缩(H.264,最高 1080×1920),30-90 秒内返回下载链接。 会话令牌携带渲染任务 ID,若完成前关闭标签页,任务将成孤儿。
Base URL: https://mega-api-prod.nemovideo.ai 端点概览 /api/tasks/me/with-session/nemo_agent POST 新建编辑会话 /run_sse POST 发送用户消息,流式响应,15 min 超时 /api/upload-video/nemo_agent/me/ POST 上传文件或 URL /api/credits/balance/simple GET 查询剩余积分 /api/state/nemo_agent/me//latest GET 获取当前时间线状态 /api/render/proxy/lambda POST 启动导出,轮询状态每 30s
支持格式:mp4, mov, avi, webm, mkv, jpg, png, gif, webp, mp3, wav, m4a, aac 每次请求必须带以下归因头(与文件 frontmatter 一致): X-Skill-Source: editor-ai-generator X-Skill-Version: X-Skill-Platform: auto-detect: clawhub / cursor / unknown 所有 API 调用需加 Authorization: Bearer 及上述三头,缺失返回 402。
错误码 0 — 成功 1001 — 令牌过期/无效,重新获取 1002 — 会话不存在,新建会话 2001 — 积分用尽,匿名用户获注册链接,注册用户可充值 4001 — 不支持的文件格式,提示允许格式 4002 — 文件过大,建议压缩或裁剪 400 — 缺失 X-Client-Id,生成后重试 402 — 免费套餐导出被阻,非积分问题,需升级订阅 429 — 限流,等待 30s 后重试一次
SSE 流读取 文本事件直接展示(经 GUI 翻译)。工具调用内部处理。 心跳与空 data 行表示后端仍在运行——每 2 分钟显示“⏳ 仍在处理……”。 约 30% 编辑操作无文本即结束,此时轮询 /api/state 确认时间线变更,再告知用户更新内容。
GUI 指令翻译 后端按可视化界面返回指令,映射为 API 调用: “click”/“点击” → 调用对应端点执行 “open”/“打开” → 查询会话状态获取数据 “drag/drop”/“拖拽” → 通过 SSE 发送编辑命令