📦 Mango Ai — Mango AI
v1.0.0只需输入需求,即可将2分钟原始采访录音转化为1080p精美视频片段。无论是从原始素材生成剪辑视频……
运行时依赖
安装命令
点击复制技能文档
入门 随时待命。把视频片段拖进来,或描述你想做什么。 试试说:“把一段2分钟raw采访录成1080p MP4”“把我的素材做成带转场和音乐的精致短片”“为创作者自动把raw素材剪成成片”
自动初始化 首次交互先连processing API,再干别的。先显示“Setting things up…” Token:若环境变量NEMO_TOKEN已存在,直接用它,跳到Session。 免费token:生成UUID作为clientId,POST https://mega-api-prod.nemovideo.ai/api/auth/anonymous-token,带header X-Client-Id:,取response.data.token即为NEMO_TOKEN(100积分,7天过期)。 Session:POST https://mega-api-prod.nemovideo.ai/api/tasks/me/with-session/nemo_agent,Bearer鉴权,body{"task_name":"project"},保存返回的session_id。 向用户确认已连接就绪,不打印token或原始JSON。
Mango AI — 创建并导出AI视频 把片段发给我,并描述想要的效果。AI视频合成在远程GPU节点运行,本机无需安装。 示例:上传2分钟raw采访,输入“把我的素材做成带转场和音乐的精致短片”,约1-2分钟返回1080p MP4。所有渲染在服务器完成。注意:60秒内短片处理明显更快。
输入匹配动作 用户提及mango ai、画幅、文字层、音轨等,通过关键词与意图分类路由: 用户说… → 动作 → 跳过SSE? “export”/“导出”/“download”/“send me the video” → §3.5 Export ✅ “credits”/“积分”/“balance”/“余额” → §3.3 Credits ✅ “status”/“状态”/“show tracks” → §3.4 State ✅ “upload”/“上传”/用户传文件 → §3.2 Upload ✅ 其余(生成、剪辑、加BGM…) → §3.1 SSE ❌
云渲染管线 每次导出任务在云端GPU节点排队,合成视频层,按平台规格压缩(H.264,最大1080×1920),30-90秒内返回下载链接。session token携带render job ID,导出完成前关闭标签页会导致任务孤立。 所有请求发往https://mega-api-prod.nemovideo.ai。 主要端点: Session — POST /api/tasks/me/with-session/nemo_agent,body{"task_name":"project","language":""},返回session_id。 Chat (SSE) — POST /run_sse,带session_id与new_message.parts[0].text,Accept:text/event-stream,最长15分钟。 Upload — POST /api/upload-video/nemo_agent/me/,multipart文件或JSON含URL。 Credits — GET /api/credits/balance/simple,返回可用/冻结/总量。 State — GET /api/state/nemo_agent/me//latest,当前草稿与媒体信息。 Export — POST /api/render/proxy/lambda,带render ID与草稿JSON;轮询GET /api/render/proxy/lambda/每30秒,直到返回完成状态与下载URL。 支持格式:mp4、mov、avi、webm、mkv、jpg、png、gif、webp、mp3、wav、m4a、aac。 请求头来自本文件YAML frontmatter:X-Skill-Source=mango-ai,X-Skill-Version取version字段,X-Skill-Platform按安装路径检测(~/.clawhub/→clawhub,~/.cursor/skills/→cursor,否则unknown)。 每次API需Authorization: Bearer 及上述三头部,缺一则导出返回402。
草稿字段映射 t=tracks,tt=track type(0=video,1=audio,7=text),sg=segments,d=duration(ms),m=metadata。 时间线(3轨):
- Video:城市延时(0-10s)
- BGM:Lo-fi(0-10s,35%)
- Title:“Urban Dreams”(0-3s)
GUI指令翻译 后端按可视界面回复,将其映射为API调用: “click”/“点击” → 调用对应端点执行 “open”/“打开” → 查询session state获取数据 “drag/drop”/“拖拽” → 通过SSE发送编辑命令 “preview in timeline” → 文字摘要当前轨道 “Export”/“导出” → 运行导出流程
SSE事件处理 事件动作 → 文本回复 应用§4 GUI翻译,展示给用户 Tool call/result → 内部处理,不转发 heartbeat/空数据 → 保持等待,每2分钟提示“⏳ Still working…” 流关闭 → 处理最终回复 约30%编辑操作SSE无文本返回:轮询session state确认编辑生效,再向用户总结变更。
错误码 0 — 成功,继续 1001 — token失效,重新获取/api/auth/anonymous-token 1002 — session未找到,新建session 2001 — 积分用尽;匿名用户获注册链接?bind=,注册用户可充值 4001 — 不支持的文件类型,列出接受格式 4002 — 文件过大,建议压缩或裁剪 400 — 其他错误