详细分析 ▾
运行时依赖
版本
Image to Video AI 首发——把图片变成视频片段 - 输入最多 3 张 JPG 商品图,一句文字指令即可秒变 1080p 动画短片。 - 零配置:自动接入云端 GPU,完成鉴权并赠送免费额度。 - 支持批量上传、文字叠层、背景音乐、画幅调整,一句话搞定。 - 输出高码率 MP4 及主流格式,30–90 秒生成,直链下载。 - 报错清晰、会话续接、状态实时反馈,体验顺滑。
安装命令
点击复制技能文档
入门
发图给我,立即开始 AI 视频创作。或直接说出想法。试试说:
- “convert my images”
- “export 1080p MP4”
- “turn my images into a smooth”
首次连接
用户首次打开技能时,自动连接后端,简短提示(如“Setting up...”)。 认证:检查环境变量NEMO_TOKEN。若已存在,跳至第 2 步。
- 获取免费 token:生成随机 UUID 作为客户端 ID,POST 至
https://mega-api-prod.nemovideo.ai/api/auth/anonymous-token,HeaderX-Client-Id设为该 UUID。响应data.token即为 NEMO_TOKEN——100 积分,7 天有效。 - 创建会话:POST 至
https://mega-api-prod.nemovideo.ai/api/tasks/me/with-session/nemo_agent,Header 含Authorization: Bearer与Content-Type: application/json,Body{"task_name":"project","language":""}。保存返回的session_id供后续调用。
# Image to Video AI — Convert Images Into Video Clips 发图并描述想要的效果。AI 视频在远程 GPU 节点运行,本机零安装。 示例:上传三张 JPG 产品图,输入“turn my images into a smooth video with transitions and background music”,约 30-60 秒返回 1080p MP4。所有渲染在服务端完成。提示:图少分辨高,效果更流畅。
输入与动作映射
用户提及 image to video oi、aspect ratio、text overlays、audio tracks 等,将通过关键词与意图分类路由至对应动作。| 用户说法 | 动作 | 跳过 SSE? | |-------------|--------|------------| | “export” / “导出” / “download” / “send me the video” | → §3.5 Export | ✅ | | “credits” / “积分” / “balance” / “余额” | → §3.3 Credits | ✅ | | “status” / “状态” / “show tracks” | → §3.4 State | ✅ | | “upload” / “上传” / 用户发文件 | → §3.2 Upload | ✅ | | 其他(generate、edit、加 BGM…) | → §3.1 SSE | ❌ |
云渲染管线详情
每次导出任务在云 GPU 节点排队,合成视频层并应用平台级压缩(H.264,最高 1080×1920),30-90 秒内返回下载链接。会话 token 携带渲染任务 ID,关闭页签将导致任务孤立。 请求头取自本文件 YAML frontmatter:X-Skill-Source 为 image-to-video-oi,X-Skill-Version 取自 version 字段,X-Skill-Platform 按安装路径检测(~/.clawhub/ = clawhub,~/.cursor/skills/ = cursor,其余为 unknown)。
每次请求须带 Authorization: Bearer 及所有归因头,缺失将触发 402。 API 基址:https://mega-api-prod.nemovideo.ai
创建会话:POST /api/tasks/me/with-session/nemo_agent — Body {"task_name":"project","language":""} — 返回 task_id, session_id。
发送消息(SSE):POST /run_sse — Body {"app_name":"nemo_agent","user_id":"me","session_id":"","new_message":{"parts":[{"text":""}]}},Header Accept: text/event-stream。最大超时 15 分钟。
上传:POST /api/upload-video/nemo_agent/me/ — 文件:multipart -F "files=@/path",或 URL:{"urls":[""],"source_type":"url"}
积分:GET /api/credits/balance/simple — 返回 available, frozen, total
会话状态:GET /api/state/nemo_agent/me//latest — 关键字段:data.state.draft, data.state.video_infos, data.state.generated_media
导出(免费,不扣积分):POST /api/render/proxy/lambda — Body {"id":"render_","sessionId":"","draft":,"output":{"format":"mp4","quality":"high"}}。每 30 秒 GET /api/render/proxy/lambda/ 轮询,直至 status = completed。下载地址在 output.url。
支持格式:mp4, mov, avi, webm, mkv, jpg, png, gif, webp, mp3, wav, m4a, aac。
SSE 事件处理
| 事件 | 动作 | |-------|--------| | 文本响应 | 应用 GUI 翻译(§4),展示给用户 | | 工具调用/结果 | 内部处理,不转发 | |heartbeat / 空 data: | 继续等待 |