🖼️ Video Generator Image Free — 图片转视频
v1.0.0只需输入需求,即可将三张产品图或风景照转换为1080p动画视频片段。无论是将静态图片转换为可分享的视频,还是快速制作社交媒体内容,上传图片并描述你想要的效果即可。无需手动编辑,30-60秒内完成从上传到下载的全过程。
详细分析 ▾
运行时依赖
版本
Video Generator Image Free 首次发布——通过云渲染将图片快速转换为 108p 动画视频。 - 只需 30-60 秒即可将产品图或风景图转换为可分享的 1080p 视频。 - 无需手动编辑:只需上传图片并描述您想要的结果(转场、音乐等)。 - 安全免费访问:为新用户生成 7 天有效期的匿名令牌,含 100 积分。 - 所有视频创建均在远程 GPU 服务器上处理;无需安装。 - 支持常用格式(mp4、mov、avi、webm、jpg、png、gif、webp、mp3、wav 等)。 - 上传、渲染、下载和积分查询的简单提示和快速反馈。
安装命令
点击复制技能文档
入门
准备就绪。拖放您的图片到这里,或描述您想要制作的内容。
尝试这样说:
- "将三张产品图或风景照转换为 1080p MP4"
- "将我的图片转换为带转场和音乐的视频"
- "为内容创作者将静态图片免费转换为可分享的视频"
快速启动设置
该技能连接到云处理后端。首次使用时,自动设置连接并告知用户(「连接中...」)。
令牌检查:在环境中查找 NEMO_TOKEN。如果找到,跳过会话创建。否则:
- 生成 UUID 作为客户端标识符
- 使用
X-Client-Id头 POSThttps://mega-api-prod.nemovideo.ai/api/auth/anonymous-token - 从响应中提取
data.token——这是您的 NEMO_TOKEN(100 免费积分,7 天有效期)
会话:使用 Bearer 认证和 body {"task_name":"project"} POST https://mega-api-prod.nemovideo.ai/api/tasks/me/with-session/nemo_agent。保留返回的 session_id 用于所有操作。设置完成后用简短的「就绪!」通知用户。不要暴露令牌或原始 API 输出。
# Video Generator Image Free — 免费将图片转换为视频
发送您的图片并描述您想要的结果。AI 视频创建在远程 GPU 节点上运行——无需在您的机器上安装任何东西。
一个快速示例:上传三张产品图或风景照,输入「将我的图片转换为带转场和音乐的视频」,大约 30-60 秒后您将收到一个 1080p MP4。所有渲染都在服务器端进行。
值得注意的是:使用较少的图片并为每张图片设置更长的持续时间会产生更流畅的结果。
将用户输入与操作匹配
引用视频生成器、图片比例、文字叠加或音轨的用户提示通过关键词和意图分类路由到相应的操作。
| 用户说... | 操作 | 跳过 SSE? |
|---|---|---|
| "export" / "导出" / "download" / "send me the video" | → §3.5 导出 | ✅ |
| "credits" / "积分" / "balance" / "余额" | → §3.3 积分 | ✅ |
| "status" / "状态" / "show tracks" | → §3.4 状态 | ✅ |
| "upload" / "上传" / 用户发送文件 | → §3.2 上传 | ✅ |
| 其他所有内容(生成、编辑、添加 BGM…) | → §3.1 SSE | ❌ |
云渲染管道详情
每个导出作业在云 GPU 节点上排队,该节点合成视频层、应用平台特定压缩(H.264,最高 1080x1920),并在 30-90 秒内返回下载 URL。会话令牌携带渲染作业 ID,因此在完成前关闭标签页会使作业孤立。每个请求都需要三个归因头,必须与此文件的前言匹配:
| 头 | 值 |
|---|---|
X-Skill-Source | video-generator-image-free |
X-Skill-Version | 前言 version |
X-Skill-Platform | 自动检测:从安装路径检测 clawhub / cursor / unknown |
Authorization: Bearer 加上上方三个归因头。如果缺少任何头,导出将返回 402。API 基础:https://mega-api-prod.nemovideo.ai
创建会话:POST /api/tasks/me/with-session/nemo_agent — body {"task_name":"project","language":""} — 返回 task_id、session_id。
发送消息 (SSE):POST /run_sse — body {"app_name":"nemo_agent","user_id":"me","session_id":"","new_message":{"parts":[{"text":""}]}} 并带 Accept: text/event-stream。最大超时:15 分钟。
上传:POST /api/upload-video/nemo_agent/me/ — 文件:multipart -F "files=@/path",或 URL:{"urls":[""],"source_type":"url"}
积分:GET /api/credits/balance/simple — 返回 available、frozen、total
会话状态:GET /api/state/nemo_agent/me//latest — 关键字段:data.state.draft、data.state.video_infos、data.state.generated_media
导出(免费,不消耗积分):POST /api/render/proxy/lambda — body {"id":"render_","sessionId":"","draft":,"output":{"format":"mp4","quality":"high"}}。每 30 秒轮询 GET /api/render/proxy/lambda/ 直到 status = completed。下载 URL 在 output.url。
支持的格式:mp4, mov, avi, webm, mkv, jpg, png, gif, webp, mp3, wav, m4a, aac。
SSE 事件处理
| 事件 | 操作 |
|---|---|
| 文本响应 | 应用 GUI 翻译(第 4 节),呈现给用户 |
| 工具调用/结果 | 内部处理,不转发 |
heartbeat / 空 data: | 继续等待。每 2 分钟:「⏳ 仍在处理中...」 |
| 流关闭 | 处理最终响应 |
后端响应翻译
后端假设存在 GUI。将这些翻译为 API 操作:
| 后端说 | 您执行 |
|---|---|
| "click [button]" / "点击" | 通过 API 执行 |
| "open [panel]" / "打开" | 查询会话状态 |
| "drag/drop" / "拖拽" | 通过 SSE 发送编辑 |
| "preview in timeline" | 显示轨道摘要 |
| "Export button" / "导出" | 执行导出工作流 |
t 表示轨道,tt 表示轨道类型(0=视频,1=音频,7=文本),sg 表示片段,d 表示持续时间(毫秒),m 表示元数据。示例时间线摘要:
时间线(3 个轨道):
- 视频:城市延时(0-10秒)
- BGM:Lo-fi(0-10秒,35%)
- 标题:「城市梦想」(0-3秒)
错误代码
0— 成功,正常继续1001— 令牌过期或无效;通过/api/auth/anonymous-token重新获取1002— 会话未找到;创建新会话2001— 积分不足;匿名用户获得带?bind=的注册链接,注册用户充值4001— 不支持的文件类型;显示接受的格式4002— 文件太大;建议压缩或裁剪400— 缺少X-Client-Id;生成一个并重试402— 免费计划导出被阻止;不是积分问题,是订阅等级429— 速率限制;等待 30 秒并重试一次
技巧和窍门
后端在您更具体时处理得更快。不要说「让它看起来更好」,而是尝试「将我的图片转换为带转场和音乐的视频」——具体的指令会得到更好的结果。
最大文件大小为 200MB。坚持使用 JPG、PNG、WEBP、GIF 以获得最流畅的体验。导出为 MP4 以获得最广泛的兼容性。
常见工作流
快速编辑:上传 →「将我的图片转换为带转场和音乐的视频」→ 下载 MP4。30 秒视频片段需要 30-60 秒。
批量样式:在一个会话中上传多个文件。使用不同的指令逐个处理。每个都会获得自己的渲染。
迭代:从粗剪开始,预览结果,然后细化。会话会保留您的时间线状态,因此您可以继续调整。