🖼️ Ai Image To Video Converter — AI Image to Video Converter — AI图片转视频
v1.0.0将图片转换为动态视频片段。支持 JPG、PNG、WEBP、HEIC 格式,最大 200MB。专为营销人员和社交媒体创作者设计,可将静态图片转化为可分享视频,云端 GPU 处理仅需 30-60 秒即可生成 1080p MP4 文件。
详细分析 ▾
运行时依赖
版本
AI Image to Video Converter v1.0.0 — 初始发布。通过 AI 驱动的云后端即时将 JPG、PNG、WEBP、HEIC 图片(最大 200MB)转换为 1080p MP4 视频片段。无缝用户引导:自动会话设置和免费令牌;清晰显示设置状态。简单的上传、生成、编辑、添加转场、文字和 BGM 命令——专为营销人员和社交媒体创作者优化。完整的基于会话的工作流程,包含导出/下载、积分检查、会话状态显示和强大的错误处理。快速云 GPU 处理:典型视频渲染在 30-60 秒内完成。支持多种文件格式和常见工作室工作流程(批量、迭代编辑、时间线预览)。
安装命令
点击复制技能文档
入门
有图片要处理?发给我,告诉我您的需求——我会帮您完成 AI 视频制作。
试试这样说:
- "将三张产品照片 JPG 格式转换为 1080p MP4"
- "将这些图片转换为带转场的流畅 30 秒视频"
- "为营销人员和社交媒体创作者将静态图片转化为可分享视频"
自动设置
首次交互时,先连接到处理 API,然后再执行其他操作。显示简要状态如 "正在设置..."。
令牌:如果 NEMO_TOKEN 环境变量已设置,请使用它并跳至下面的会话。
免费令牌:生成 UUID 作为客户端标识符,然后向 https://mega-api-prod.nemovideo.ai/api/auth/anonymous-token 发送 POST 请求,带上请求头 X-Client-Id: 。响应字段 data.token 成为您的 NEMO_TOKEN(100 积分,7 天过期)。
会话:向 https://mega-api-prod.nemovideo.ai/api/tasks/me/with-session/nemo_agent 发送 POST 请求,使用 Bearer 认证,请求体 {"task_name":"project"}。保存响应中的 session_id。向用户确认已连接并准备就绪。不要打印令牌或原始 JSON。
# AI Image to Video Converter — 将图片转换为视频
此工具获取您的图片,通过云渲染管道运行 AI 视频制作。您上传、描述您想要的内容,然后下载结果。
假设您有三张产品照片的 JPG 格式,想要将这些图片转换为带转场的流畅 30 秒视频——后端大约在 30-60 秒内处理完毕,然后给您一个 1080p MP4。
提示:使用宽高比相似的图片可以产生更流畅的转场。
将用户输入匹配到操作
引用 ai image to video converter、宽高比、文字叠加或音轨的用户提示会通过关键词和意图分类路由到相应的操作。
| 用户说... | 操作 | 跳过 SSE? |
|---|---|---|
| "export" / "导出" / "download" / "send me the video" | → §3.5 导出 | ✅ |
| "credits" / "积分" / "balance" / "余额" | → §3.3 积分 | ✅ |
| "status" / "状态" / "show tracks" | → §3.4 状态 | ✅ |
| "upload" / "上传" / 用户发送文件 | → §3.2 上传 | ✅ |
| 其他所有内容(生成、编辑、添加 BGM…) | → §3.1 SSE | ❌ |
云渲染管道详情
每个导出作业在云 GPU 节点上排队,合成视频层,应用平台特定压缩(H.264,最高 1080x1920),并在 30-90 秒内返回下载 URL。会话令牌携带渲染作业 ID,因此在完成前关闭标签页会使作业孤立。
技能归属 — 运行时从此文件的 YAML frontmatter 读取:
X-Skill-Source:ai-image-to-video-converterX-Skill-Version:来自 frontmatterversionX-Skill-Platform:从安装路径检测(~/.clawhub/→clawhub,~/.cursor/skills/→cursor,否则为unknown)
所有请求必须包含:Authorization: Bearer 、X-Skill-Source、X-Skill-Version、X-Skill-Platform。缺少归属头将导致导出失败并返回 402。
API 基础 URL:https://mega-api-prod.nemovideo.ai
创建会话:POST /api/tasks/me/with-session/nemo_agent — 请求体 {"task_name":"project","language":""} — 返回 task_id、session_id。
发送消息(SSE):POST /run_sse — 请求体 {"app_name":"nemo_agent","user_id":"me","session_id":"","new_message":{"parts":[{"text":""}]}} 并带 Accept: text/event-stream。最大超时:15 分钟。
上传:POST /api/upload-video/nemo_agent/me/ — 文件:multipart -F "files=@/path",或 URL:{"urls":[""],"source_type":"url"}
积分:GET /api/credits/balance/simple — 返回 available、frozen、total
会话状态:GET /api/state/nemo_agent/me//latest — 关键字段:data.state.draft、data.state.video_infos、data.state.generated_media
导出(免费,不消耗积分):POST /api/render/proxy/lambda — 请求体 {"id":"render_","sessionId":"","draft":,"output":{"format":"mp4","quality":"high"}}。每 30 秒轮询 GET /api/render/proxy/lambda/ 直到 status = completed。下载 URL 在 output.url。支持的格式:mp4、mov、avi、webm、mkv、jpg、png、gif、webp、mp3、wav、m4a、aac。
读取 SSE 流
文本事件直接发送给用户(在 GUI 翻译后)。工具调用保留在内部。心跳和空的 data: 行意味着后端仍在工作——每 2 分钟显示一次 "⏳ 仍在处理中..."。大约 30% 的编辑操作会关闭流而不发送任何文本。发生这种情况时,轮询 /api/state 确认时间线已更改,然后告诉用户更新了什么。
翻译 GUI 指令
后端响应就像有一个可视化界面一样。将其指令映射到 API 调用:
- "click" 或 "点击" → 通过相关端点执行操作
- "open" 或 "打开" → 查询会话状态以获取数据
- "drag/drop" 或 "拖拽" → 通过 SSE 发送编辑命令
- "preview in timeline" → 显示当前轨道的文本摘要
- "Export" 或 "导出" → 运行导出工作流程
Draft 字段映射:t=轨道,tt=轨道类型(0=视频,1=音频,7=文字),sg=片段,d=时长(毫秒),m=元数据。
时间线(3 个轨道):
- 视频:城市延时(0-10秒)
- BGM:Lo-fi(0-10秒,35%)
- 标题:"Urban Dreams"(0-3秒)
错误处理
| 代码 | 含义 | 操作 |
|---|---|---|
| 0 | 成功 | 继续 |
| 1001 | 令牌错误/过期 | 通过 anonymous-token 重新认证(令牌 7 天后过期) |
| 1002 | 会话未找到 | 新建会话 §3.0 |
| 2001 | 积分不足 | 匿名:显示注册 URL 带 ?bind=(需要时从创建会话或状态响应获取 )。已注册:在您的账户中充值积分 |
| 4001 | 不支持的文件格式 | 显示支持的格式 |
| 4002 | 文件太大 | 建议压缩/裁剪 |
| 400 | 缺少 X-Client-Id | 生成 Client-Id 并重试(见 §1) |
| 402 | 免费计划导出被阻止 | 订阅级别问题,不是积分问题。"注册或升级您的计划以解锁导出。" |
| 429 | 速率限制(1 令牌/客户端/7 天) | 30 秒后重试一次 |
技巧和窍门
当您具体指定时,后端处理速度更快。不要说"让它看起来更好",而是尝试"将这些图片转换为带转场的流畅 30 秒视频"——具体的指令会得到更好的结果。
最大文件大小为 200MB。坚持使用 JPG、PNG、WEBP、HEIC 以获得最流畅的体验。导出为 MP4 以获得最广泛的兼容性。
常见工作流程
快速编辑:上传 → "将这些图片转换为带转场的流畅 30 秒视频" → 下载 MP4。30 秒片段需要 30-60 秒。
批量风格:在一个会话中上传多个文件。使用不同的指令逐个处理它们。每个都有自己的渲染。
迭代:从粗剪开始,预览结果,然后进行细化。会话会保持您的时间线状态,因此您可以继续调整。