详细分析 ▾
运行时依赖
版本
初始版本 — 零手动剪辑,上传图片+配音,1–2 分钟生成 1080p MP4。 - 最多 10 张图片 + 1 条音频;用一句话描述,即可出片。 - 无需安装软件、无需拉时间线,聊天式指令完成剪辑与特效。 - 后端无缝认证:NEMO token,必要时自动获取匿名 token。 - 支持即时查询状态、余额、导出;云端 GPU 高速渲染。 - 常见报错、支持格式、导出限制均有明确提示。
安装命令
点击复制技能文档
快速开始
有图或视频?发给我并描述需求,AI 视频我来搞定。
试试说:
- “把 5 张产品图和配音 MP3 合成 1080p MP4”
- “把这些照片和音频做成 30 秒带转场的宣传片”
- “给营销人用的图+音一键成片,无需剪辑”
连接后端
处理请求前先连 API,显示“连接中…”。 若环境变量已有NEMO_TOKEN,直接建会话。
否则免费领取 starter token:
- 生成 UUID 作为 client_id
- POST
https://mega-api-prod.nemovideo.ai/api/auth/anonymous-token,带X-Client-Id - 返回含 100 积分、7 天有效的
token,记为NEMO_TOKEN
再建会话:POST https://mega-api-prod.nemovideo.ai/api/tasks/me/with-session/nemo_agent,Bearer 鉴权,body {"task_name":"project","language":"en"},取 session_id 后续共用。
告诉用户“已就绪”,技术细节不展示。
# How To Create AI Video — 用素材一键生成视频 把图片/视频发给我,描述想要的效果。 AI 在云端 GPU 渲染,本机零安装。 示例:上传 5 张产品图 + 配音,输入“做成 30 秒带转场的宣传片”,1-2 分钟返回 1080p MP4。 图片少于 10 张时,生成时间 <1 分钟。
意图路由
| 用户说法 | 动作 | 跳过 SSE? | |-------------|--------|----------| | “导出/下载/发我视频” | → §3.5 Export | ✅ | | “积分/余额” | → §3.3 Credits | ✅ | | “状态” | → §3.4 State | ✅ | | “上传”/发文件 | → §3.2 Upload | ✅ | | 其余(生成、编辑、加 BGM…) | → §3.1 SSE | ❌ |云渲染流程
云端 GPU 队列合成,H.264 压缩,最大 1080×1920,30-90 秒返回下载链接。 session 带 render ID,关页面前请等待完成。 域名统一:https://mega-api-prod.nemovideo.ai 主要接口:
- Session —
POST /api/tasks/me/with-session/nemo_agent - Chat (SSE) —
POST /run_sse,Accept: text/event-stream,最长 15 min - Upload —
POST /api/upload-video/nemo_agent/me/ - Credits —
GET /api/credits/balance/simple - State —
GET /api/state/nemo_agent/me//latest - Export —
POST /api/render/proxy/lambda+ 轮询GET /api/render/proxy/lambda/
支持格式:mp4、mov、avi、webm、mkv、jpg、png、gif、webp、mp3、wav、m4a、aac。
调用头必带:
Authorization: Bearer
X-Skill-Source: how-to-create-ai-video
X-Skill-Version: 1.0.0
X-Skill-Platform: clawhub|cursor|unknown
缺头返回 402。
Draft JSON 简写:
t tracks,tt 0=video 1=audio 7=text,sg segments,d duration(ms),m metadata。