详细分析 ▾
运行时依赖
安装命令
点击复制技能文档
入门 把视频片段发给我,我立刻开始 AI 手机剪辑。或者直接告诉我你的想法。 试试说:“edit my video clips”“export 1080p MP4”“trim the clip, add transitions, and”
自动初始化 首次交互时,先连 processing API,再干别的。显示“Setting things up...”。
Token 若环境变量 NEMO_TOKEN 已存在,直接用它,跳到 Session。
免费 token 生成 UUID 作为 client-id,POST https://mega-api-prod.nemovideo.ai/api/auth/anonymous-token,带 header X-Client-Id:。取响应 data.token 即为 NEMO_TOKEN(100 积分,7 天有效期)。
Session POST https://mega-api-prod.nemovideo.ai/api/tasks/me/with-session/nemo_agent Bearer 认证,body {"task_name":"project"}。保存返回的 session_id。 告知用户已连接就绪。勿打印 token 或原始 JSON。
Editor on Android — 手机剪辑导出 把视频片段发给我,并描述想要的效果。AI 手机剪辑在远程 GPU 节点运行,本机无需安装。 示例:上传 Android 拍的 2 分钟视频,输入“trim the clip, add transitions, and export in 1080p”,约 1–2 分钟返回 1080p MP4。渲染全在云端。 注意:60 秒以内短片在移动网络下处理明显更快。
意图匹配 用户提及 editor on android、比例、文字层、音轨等,按关键词与意图分类路由:
用户说… → 动作 → 跳过 SSE? “export”/“导出”/“download”/“send me the video” → §3.5 Export ✅ “credits”/“积分”/“balance”/“余额” → §3.3 Credits ✅ “status”/“状态”/“show tracks” → §3.4 State ✅ “upload”/“上传”/用户传文件 → §3.2 Upload ✅ 其余(生成、剪辑、加 BGM…) → §3.1 SSE ❌
云端渲染流程 每次导出任务在云端 GPU 节点排队,合成视频层,按平台规格压缩(H.264,最大 1080×1920),30–90 秒内返回下载链接。 session token 携带 render job ID,关闭页面前未完成会导致任务孤立。
Base URL: https://mega-api-prod.nemovideo.ai 端点概览 /api/tasks/me/with-session/nemo_agent POST 新建编辑会话 /run_sse POST 发用户消息,流式返回 /api/upload-video/nemo_agent/me/ POST 上传文件或 URL /api/credits/balance/simple GET 查剩余积分 /api/state/nemo_agent/me//latest GET 取当前时间线状态 /api/render/proxy/lambda POST 开始导出,轮询状态
支持格式 mp4、mov、avi、webm、mkv、jpg、png、gif、webp、mp3、wav、m4a、aac
技能归因 运行时读取本文件 YAML 头: X-Skill-Source: editor-on-android X-Skill-Version: 取自头信息 X-Skill-Platform: 按安装路径检测 每次请求带 Authorization: Bearer 及归因头,缺则导出报 402。
错误码 0 — 成功 1001 — token 失效,重新获取 1002 — 会话不存在,新建 2001 — 积分用尽,匿名用户得注册链接 4001 — 不支持的文件类型 4002 — 文件过大 400 — 缺 X-Client-Id,补后重试 402 — 免费套餐导出被阻 429 — 限流,30 秒后重试一次
SSE 流读取 文本事件直接展示(GUI 翻译后)。工具调用内部处理。 心跳/空 data 行表示后端仍在跑,每 2 分钟显示“⏳ Still working...”。 约 30% 编辑操作无文本即关流,此时轮询 /api/state 确认时间线变更,再告知用户。
后端响应翻译 后端假设有 GUI,按以下映射为 API 动作: “click [button]”/“点击” → 调 API “open [panel]”/“打开” → 查会话状态 “drag/drop”/“拖拽” → SSE 发编辑 “preview in timeline” → 展示轨道摘要 “Export button”/“导出” → 执行导出流程
Draft JSON 简写:t=tracks, tt=track type (0=video,1=audio,7=text), sg=segments, d=duration(ms), m=metadata 时间线示例:Timeline (3