🎞️ Image — 图像
v1.0.0To Video Diffusion Model 只需输入文字,即可将单张产品照或风景图转为1080p动态视频片段。无论是把静态图片变成短视频……
详细分析 ▾
运行时依赖
版本
Image to Video Diffusion Model v1.0.0 - 首次发布:上传单张图片并输入文本提示,即可生成 1080p 动画视频片段,云端 AI 渲染。 - 极简上手:自动连接云端后端,按需获取并存储 token,内置会话管理。 - 支持常见图片、视频、音频格式输入,最大 50MB。 - 针对上传、导出、积分、时间线状态查询提供动作路由与错误处理。 - 实时状态推送,token 过期或会话丢失可自动恢复。 - 附带最佳效果提示及导出/渲染流程说明。
安装命令
点击复制技能文档
快速开始
把静态图发给我,AI 立即生成视频。也可以直接告诉我想法。试试说:
- "convert my still images"
- "export 1080p MP4"
- "animate this image into a 5-second"
一键配置
本技能连接云端 GPU。首次使用自动初始化并提示“Connecting...”。 Token 检查:先找环境变量NEMO_TOKEN。
若无,则:
- 生成 UUID 作为客户端 ID
- POST
https://mega-api-prod.nemovideo.ai/api/auth/anonymous-token,带X-Client-Id - 取
data.token即 NEMO_TOKEN(100 积分,7 天有效)
Session:POST https://mega-api-prod.nemovideo.ai/api/tasks/me/with-session/nemo_agent,Bearer 鉴权,body {"task_name":"project"},保存返回的 session_id。
初始化完成提示“Ready!”,不暴露 token 或原始 API 输出。
# Image to Video Diffusion Model — 将图片转为视频片段 上传静态图并描述需求,远程 GPU 节点完成渲染,本地零安装。 示例:上传一张商品图,输入“animate this image into a 5-second smooth motion video”,30-90 秒返回 1080p MP4。 高对比度、主体清晰的图片动作更自然。
意图路由
| 用户说法 | 动作 | 跳过 SSE? | |-------------|--------|----------| | "export"/"导出"/"download"/"send me the video" | → §3.5 导出 | ✅ | | "credits"/"积分"/"balance"/"余额" | → §3.3 积分 | ✅ | | "status"/"状态"/"show tracks" | → §3.4 状态 | ✅ | | "upload"/"上传"/用户发文件 | → §3.2 上传 | ✅ | | 其他(生成、编辑、加 BGM…) | → §3.1 SSE | ❌ |云渲染细节
导出任务排队到云 GPU,合成图层、H.264 压缩至 1080×1920,30-90 秒返回下载链接。 Base URL:https://mega-api-prod.nemovideo.ai | 接口 | 方法 | 用途 |
|----------|--------|---------|
| /api/tasks/me/with-session/nemo_agent | POST | 新建会话 |
| /run_sse | POST | 发送消息,流式返回,15 min 超时 |
| /api/upload-video/nemo_agent/me/ | POST | 上传文件或 URL |
| /api/credits/balance/simple | GET | 查积分 |
| /api/state/nemo_agent/me//latest | GET | 查时间线状态 |
| /api/render/proxy/lambda | POST | 开始导出,轮询状态 |
支持格式:mp4, mov, avi, webm, mkv, jpg, png, gif, webp, mp3, wav, m4a, aac。
请求头必须带 Authorization: Bearer 及技能归因头,否则导出 402。