详细分析 ▾
运行时依赖
安装命令
点击复制技能文档
入门 把原始视频片段发给我,我立即开始 AI 风格增强。或者直接告诉我你的想法。 试着说: “transform my raw video clips” “export 1080p MP4” “add bold color grading, dynamic cuts,”
自动初始化 首次交互时,先连接处理 API,再执行任何操作。显示简短状态“Setting things up...”。
Token: 若环境变量 NEMO_TOKEN 已存在,直接使用并跳至 Session。
免费 token: 生成 UUID 作为客户端标识,POST 至 https://mega-api-prod.nemovideo.ai/api/auth/anonymous-token,Header 带 X-Client-Id: 。取响应字段 data.token 作为 NEMO_TOKEN(100 积分,7 天有效期)。
Session: POST 至 https://mega-api-prod.nemovideo.ai/api/tasks/me/with-session/nemo_agent,Bearer 鉴权,body {"task_name":"project"}。保存响应中的 session_id。向用户确认已连接就绪。勿打印 token 或原始 JSON。
Spicy AI Video — 让视频大胆鲜活 把原始片段发给我,并描述想要的效果。AI 风格增强在远程 GPU 节点运行,本机无需安装。 示例:上传 60 秒口播片段,输入“add bold color grading, dynamic cuts, and energetic music to make this video pop”,约 30-60 秒返回 1080p MP4。渲染全程云端完成。注意:60 秒以内短片风格最稳定。
输入匹配动作 用户提及 spicy ai video、画幅、文字层、音轨等,通过关键词与意图分类路由: 用户说… → 动作 跳过 SSE? “export” / “导出” / “download” / “send me the video” → §3.5 Export ✅ “credits” / “积分” / “balance” / “余额” → §3.3 Credits ✅ “status” / “状态” / “show tracks” → §3.4 State ✅ “upload” / “上传” / 用户发送文件 → §3.2 Upload ✅ 其余(生成、编辑、加 BGM…) → §3.1 SSE ❌
云端渲染流程 每次导出任务在云端 GPU 节点排队,合成视频层,按平台规格压缩(H.264,最高 1080×1920),30-90 秒内返回下载链接。会话 token 携带渲染任务 ID,关闭页签会导致任务孤立。 所有请求须带 Authorization: Bearer 及归因 Header,缺失将触发 402。
技能归因(运行时读取本文件 YAML frontmatter): X-Skill-Source: spicy-ai-video X-Skill-Version: 取自 frontmatter version X-Skill-Platform: 按安装路径检测(~/.clawhub/ → clawhub,~/.cursor/skills/ → cursor,其余 unknown)
API 基址:https://mega-api-prod.nemovideo.ai 创建会话:POST /api/tasks/me/with-session/nemo_agent — body {"task_name":"project","language":""} — 返回 task_id, session_id 发送消息(SSE):POST /run_sse — body {"app_name":"nemo_agent","user_id":"me","session_id":"","new_message":{"parts":[{"text":""}]}},Accept: text/event-stream,最长 15 分钟 上传:POST /api/upload-video/nemo_agent/me/ — 文件:multipart -F "files=@/path",或 URL:{"urls":[""],"source_type":"url"} 积分:GET /api/credits/balance/simple — 返回 available, frozen, total 会话状态:GET /api/state/nemo_agent/me//latest — 关键字段:data.state.draft, data.state.video_infos, data.state.generated_media 导出(免费,不扣积分):POST /api/render/proxy/lambda — body {"id":"render_","sessionId":"","draft":,"output":{"format":"mp4","quality":"high"}}。每 30 秒轮询 GET /api/render/proxy/lambda/ 直至 status=completed,下载链接在 output.url。 支持格式:mp4, mov, avi, webm, mkv, jpg, png, gif, webp, mp3, wav, m4a, aac。
错误码 0 — 成功,继续 1001 — token 过期/无效;重新获取 /api/auth/anonymous-token 1002 — 会话未找到;新建会话 2001 — 积分耗尽;匿名用户获注册链接 ?bind=,注册用户可充值 4001 — 不支持的文件类型;提示接受格式 4002 — 文件过大;建议压缩或裁剪 400 — 缺失 X-Client-Id;生成后重试 402 — 免费版导出被阻;非积分问题,需订阅 429 — 限流;等待 30 秒后重试一次
GUI 指令翻译 后端按可视化界面返回指令,映射为 API 调用: “click” / “点击” → 调用对应端点执行 “open” / “打开” → 查询会话状态获取数据 “drag/drop” / “拖拽” → 通过 SSE 发送编辑命令 “preview in timeline” → 文字摘要当前轨道 “Export” / “导出” → 执行导出流程
读取 SSE 流 文本事件直接呈现用户(经 GUI 翻译),工具调用内部处理。心跳与空 data: 行表示后端仍在运行——每 2 分钟显示“⏳ Still working...”。约 30% 编辑操作会无文本直接关闭流。