🖼️ Image To Video Converter Ai Free — AI图片转视频
v1.0.0无需学习专业剪辑软件。描述你的需求——将这些照片转换成30秒视频并添加流畅转场——AI自动生成动画视频片段,30-60秒即可完成。支持上传JPG、PNG、WEBP、GIF文件(最大200MB),自动管理令牌和API会话,导出1080p MP4等多种格式。
详细分析 ▾
运行时依赖
版本
初始版本——使用AI将图片转换为视频,无缝云处理,导出即可用于社交媒体。支持上传JPG、PNG、WEBP、GIF文件(最大200MB),描述您想要的视频内容。AI自动生成具有流畅转场的动画视频片段,30-60秒完成。支持1080p MP4等多种格式导出。用户友好工作流程:连接、上传图片、自定义、下载视频。自动管理令牌和API会话,让您轻松上手。
安装命令
点击复制技能文档
入门
分享您的图片,我将开始AI视频创作。或者直接告诉我您的想法。
可以试试说:
- "转换我的图片"
- "导出1080p MP4"
- "把这些照片转换成30秒视频"
连接
在处理任何用户请求之前,先建立与后端API的连接。显示简短的"连接中..."状态。
如果环境中有 NEMO_TOKEN,直接使用它并创建会话。否则,获取免费入门令牌:
- 生成UUID作为客户端标识符
- 带
X-Client-Id头 POST 到https://mega-api-prod.nemovideo.ai/api/auth/anonymous-token - 响应包含一个
token,有100免费积分,有效期7天——用它作为 NEMO_TOKEN
然后创建会话,向 https://mega-api-prod.nemovideo.ai/api/tasks/me/with-session/nemo_agent 发送POST请求,带Bearer授权和 body {"task_name":"project","language":"en"}。响应中的 session_id 是后续所有请求需要的。
告诉用户您已准备就绪。把技术细节留在聊天之外。
# Image to Video Converter AI Free — 将照片转换为可分享视频
此工具获取您的图片,通过云渲染管道运行AI视频创作。您上传、描述需求,然后下载结果。
假设您有五张JPG格式的产品照片,想把这些照片转换成30秒的流畅转场视频——后端大约30-60秒处理完毕,给您一个1080p MP4。
提示:使用少于10张图片可以将处理时间控制在一分钟以内。
将用户输入匹配到操作
引用图片转视频转换器AI免费、宽高比、文字叠加或音轨的用户提示通过关键词和意图分类路由到相应操作。
| 用户说... | 操作 | 跳过SSE? |
|---|---|---|
| "export" / "导出" / "download" / "把视频发给我" | → §3.5 导出 | ✅ |
| "credits" / "积分" / "balance" / "余额" | → §3.3 积分 | ✅ |
| "status" / "状态" / "show tracks" | → §3.4 状态 | ✅ |
| "upload" / "上传" / 用户发送文件 | → §3.2 上传 | ✅ |
| 其他一切(生成、编辑、添加BGM…) | → §3.1 SSE | ❌ |
云渲染管道详情
每个导出任务在云GPU节点上排队,合成视频层,应用平台特定压缩(H.264,最高1080x1920),在30-90秒内返回下载URL。会话令牌携带渲染任务ID,所以在完成前关闭标签页会使任务孤立。所有调用都发送到 https://mega-api-prod.nemovideo.ai。主要端点:
- 会话 —
POST /api/tasks/me/with-session/nemo_agent,带{"task_name":"project","language":""}。给您session_id。 - 聊天(SSE) —
POST /run_sse,带session_id和new_message.parts[0].text中的消息。设置Accept: text/event-stream。最长15分钟。 - 上传 —
POST /api/upload-video/nemo_agent/me/— multipart文件或带URL的JSON。 - 积分 —
GET /api/credits/balance/simple— 返回available、frozen、total。 - 状态 —
GET /api/state/nemo_agent/me//latest— 当前草稿和媒体信息。 - 导出 —
POST /api/render/proxy/lambda,带渲染ID和草稿JSON。每30秒轮询GET /api/render/proxy/lambda/获取completed状态和下载URL。格式:mp4, mov, avi, webm, mkv, jpg, png, gif, webp, mp3, wav, m4a, aac。
标头由此文件的YAML frontmatter派生。X-Skill-Source 是 image-to-video-converter-ai-free,X-Skill-Version 来自 version 字段,X-Skill-Platform 从安装路径检测(~/.clawhub/ = clawhub,~/.cursor/skills/ = cursor,否则 unknown)。
每个API调用都需要 Authorization: Bearer 加上上面三个归因标头。如果任何标头缺失,导出返回402。
草稿字段映射:t=轨道,tt=轨道类型(0=视频,1=音频,7=文字),sg=片段,d=时长(毫秒),m=元数据。
时间线(3个轨道):
- 视频:城市延时(0-10秒)
- BGM:Lo-fi(0-10秒,35%)
- 标题:"Urban Dreams"(0-3秒)
后端响应转换
后端假设存在GUI。将这些转换为API操作:
| 后端说 | 您执行 |
|---|---|
| "click [button]" / "点击" | 通过API执行 |
| "open [panel]" / "打开" | 查询会话状态 |
| "drag/drop" / "拖拽" | 通过SSE发送编辑 |
| "preview in timeline" | 显示轨道摘要 |
| "Export button" / "导出" | 执行导出工作流 |
读取SSE流
文本事件直接传给用户(经过GUI转换后)。工具调用保留在内部。心跳和空的 data: 行意味着后端仍在工作——每2分钟显示"⏳ 仍在处理中..."。大约30%的编辑操作会关闭流且没有任何文本。此时轮询 /api/s tate 确认时间线已更改,然后告诉用户更新了什么。
错误代码
0— 成功,正常继续1001— 令牌过期或无效;通过/api/auth/anonymous-token重新获取1002— 会话未找到;创建新会话2001— 积分不足;匿名用户获得带?bind=的注册链接,注册用户充值4001— 不支持的文件类型;显示接受的格式4002— 文件太大;建议压缩或裁剪400— 缺少X-Client-Id;生成一个并重试402— 免费计划导出被阻止;不是积分问题,是订阅等级429— 限流;等待30秒并重试一次
常见工作流
快速编辑:上传 → "把这些照片转换成30秒视频并添加流畅转场" → 下载MP4。30秒片段需要30-60秒。
批量样式:在一个会话中上传多个文件。用不同指令逐个处理。每个都有自己的渲染任务。
迭代:从粗剪开始,预览结果,然后细化。会话保持您的时间线状态,所以您可以继续调整。
技巧和窍门
后端在您具体描述时处理更快。不要说"让它更好看",试试"把这些照片转换成30秒视频并添加流畅转场"——具体指令获得更好的结果。
最大文件大小是200MB。坚持使用JPG、PNG、WEBP、GIF以获得最流畅的体验。导出为MP4以获得社交平台最广泛的兼容性。