🖼️ Ai Image To Video Converter — AI Image to Video Converter — AI图片转视频

v1.0.0

将图片转换为动态视频片段。支持 JPG、PNG、WEBP、HEIC 格式，最大 200MB。专为营销人员和社交媒体创作者设计，可将静态图片转化为可分享视频，云端 GPU 处理仅需 30-60 秒即可生成 1080p MP4 文件。

0· 47·0 当前·0 累计

by @dsewell-583h0·MIT-0

AI模型访问学习教育

下载技能包

License

MIT-0

最后更新

2026/4/14

安全扫描

VirusTotal

无害

查看报告

OpenClaw

安全

medium confidence

该技能的请求和运行时指令与图片转视频云服务一致：需要单个服务令牌，对接 nemo video API，无安装步骤或无关的凭据请求。

评估建议

安装前需考虑：该技能会将您提供的任何图片上传到 mega-api-prod.nemovideo.ai，需要 NEMO_TOKEN（可提供您自己的付费令牌，或让技能请求匿名短期令牌）。仅提供您愿意发送给第三方的图片（避免敏感个人或专有图片）。确认您信任 nemovideo.ai 域名及其隐私/存储策略。注意元数据的小不匹配（SKILL.md 引用了配置路径）—— 这表明该技能可能会在 ~/.config/nemovideo/ 下读取或存储配置；如果您关心持久化，请验证令牌/会话的存储位置。如果您想要更高的保障，请向发布者索要首页/源代码仓库或隐私政策，或先使用合成测试图片进行上传测试。如果该技能后续请求额外的环境变量、任意下载或超出列出路径的文件系统访问，请停止并重新评估。...

详细分析 ▾

✓ 用途与能力

名称/描述（将图片转换为短视频）与声明的要求（NEMO_TOKEN）以及 SKILL.md 的 REST 端点（用于上传、SSE、渲染/导出和积分）一致。一个小的不一致：SKILL.md frontmatter 列出了配置路径（~/.config/nemovideo/），而向您显示的注册元数据说没有需要的配置路径——这是元数据的小不匹配，但不会改变核心功能。

✓ 指令范围

运行时指令专注于创建会话、上传文件、推动 SSE 进行编辑、轮询导出状态并返回下载 URL。该技能指示代理读取其自己的 YAML frontmatter 并检查典型安装路径以设置归属头（X-Skill-Platform）——这只需要读取预期的技能/安装路径。没有读取无关系统文件或额外环境变量的指令。它确实指示代理不要打印令牌/原始 JSON。

✓ 安装机制

纯指令技能，无安装规范和代码文件；安装程序不会下载或写入任何内容到磁盘。这是最低风险的安装模式。

✓ 凭证需求

只需要一个环境变量（NEMO_TOKEN），它直接用作所述 API 的 Bearer 令牌。该技能还记录了在不存在 NEMO_TOKEN 时从提供商获取短期匿名令牌的流程。除了 frontmatter-configPath 提及（~/.config/nemovideo/）外，没有额外的秘密或无关的凭据请求。

✓ 持久化与权限

该技能不是始终启用的，使用平台默认值（允许代理调用/自主）。它不请求提升的平台权限或修改其他技能。它要求保存 session_id 以处理正在进行的任务，这对于云渲染工作流程是预期的。

安全有层次，运行前请审查代码。

License

MIT-0

可自由使用、修改和再分发，无需署名。

查看条款 ↗

运行时依赖

无特殊依赖

版本

latestv1.0.02026/4/14

AI Image to Video Converter v1.0.0 — 初始发布。通过 AI 驱动的云后端即时将 JPG、PNG、WEBP、HEIC 图片（最大 200MB）转换为 1080p MP4 视频片段。无缝用户引导：自动会话设置和免费令牌；清晰显示设置状态。简单的上传、生成、编辑、添加转场、文字和 BGM 命令——专为营销人员和社交媒体创作者优化。完整的基于会话的工作流程，包含导出/下载、积分检查、会话状态显示和强大的错误处理。快速云 GPU 处理：典型视频渲染在 30-60 秒内完成。支持多种文件格式和常见工作室工作流程（批量、迭代编辑、时间线预览）。

● 无害

安装命令

点击复制

官方npx clawhub@latest install ai-image-to-video-converter

镜像加速npx clawhub@latest install ai-image-to-video-converter --registry https://cn.longxiaskill.com 镜像可用

需要定制？告诉我你的需求 →

技能文档

入门

有图片要处理？发给我，告诉我您的需求——我会帮您完成 AI 视频制作。

试试这样说：

"将三张产品照片 JPG 格式转换为 1080p MP4"
"将这些图片转换为带转场的流畅 30 秒视频"
"为营销人员和社交媒体创作者将静态图片转化为可分享视频"

自动设置

首次交互时，先连接到处理 API，然后再执行其他操作。显示简要状态如 "正在设置..."。

令牌：如果 NEMO_TOKEN 环境变量已设置，请使用它并跳至下面的会话。

免费令牌：生成 UUID 作为客户端标识符，然后向 https://mega-api-prod.nemovideo.ai/api/auth/anonymous-token 发送 POST 请求，带上请求头 X-Client-Id: 。响应字段 data.token 成为您的 NEMO_TOKEN（100 积分，7 天过期）。

会话：向 https://mega-api-prod.nemovideo.ai/api/tasks/me/with-session/nemo_agent 发送 POST 请求，使用 Bearer 认证，请求体 {"task_name":"project"}。保存响应中的 session_id。向用户确认已连接并准备就绪。不要打印令牌或原始 JSON。

# AI Image to Video Converter — 将图片转换为视频

此工具获取您的图片，通过云渲染管道运行 AI 视频制作。您上传、描述您想要的内容，然后下载结果。

假设您有三张产品照片的 JPG 格式，想要将这些图片转换为带转场的流畅 30 秒视频——后端大约在 30-60 秒内处理完毕，然后给您一个 1080p MP4。

提示：使用宽高比相似的图片可以产生更流畅的转场。

将用户输入匹配到操作

引用 ai image to video converter、宽高比、文字叠加或音轨的用户提示会通过关键词和意图分类路由到相应的操作。

用户说...	操作	跳过 SSE？
"export" / "导出" / "download" / "send me the video"	→ §3.5 导出	✅
"credits" / "积分" / "balance" / "余额"	→ §3.3 积分	✅
"status" / "状态" / "show tracks"	→ §3.4 状态	✅
"upload" / "上传" / 用户发送文件	→ §3.2 上传	✅
其他所有内容（生成、编辑、添加 BGM…）	→ §3.1 SSE	❌

云渲染管道详情

每个导出作业在云 GPU 节点上排队，合成视频层，应用平台特定压缩（H.264，最高 1080x1920），并在 30-90 秒内返回下载 URL。会话令牌携带渲染作业 ID，因此在完成前关闭标签页会使作业孤立。

技能归属 — 运行时从此文件的 YAML frontmatter 读取：

X-Skill-Source：ai-image-to-video-converter
X-Skill-Version：来自 frontmatter version
X-Skill-Platform：从安装路径检测（~/.clawhub/ → clawhub，~/.cursor/skills/ → cursor，否则为 unknown）

所有请求必须包含：Authorization: Bearer 、X-Skill-Source、X-Skill-Version、X-Skill-Platform。缺少归属头将导致导出失败并返回 402。

API 基础 URL：https://mega-api-prod.nemovideo.ai

创建会话：POST /api/tasks/me/with-session/nemo_agent — 请求体 {"task_name":"project","language":""} — 返回 task_id、session_id。

发送消息（SSE）：POST /run_sse — 请求体 {"app_name":"nemo_agent","user_id":"me","session_id":"","new_message":{"parts":[{"text":""}]}} 并带 Accept: text/event-stream。最大超时：15 分钟。

上传：POST /api/upload-video/nemo_agent/me/ — 文件：multipart -F "files=@/path"，或 URL：{"urls":[""],"source_type":"url"}

积分：GET /api/credits/balance/simple — 返回 available、frozen、total

会话状态：GET /api/state/nemo_agent/me//latest — 关键字段：data.state.draft、data.state.video_infos、data.state.generated_media

导出（免费，不消耗积分）：POST /api/render/proxy/lambda — 请求体 {"id":"render_","sessionId":"","draft":,"output":{"format":"mp4","quality":"high"}}。每 30 秒轮询 GET /api/render/proxy/lambda/ 直到 status = completed。下载 URL 在 output.url。支持的格式：mp4、mov、avi、webm、mkv、jpg、png、gif、webp、mp3、wav、m4a、aac。

读取 SSE 流

文本事件直接发送给用户（在 GUI 翻译后）。工具调用保留在内部。心跳和空的 data: 行意味着后端仍在工作——每 2 分钟显示一次 "⏳ 仍在处理中..."。大约 30% 的编辑操作会关闭流而不发送任何文本。发生这种情况时，轮询 /api/state 确认时间线已更改，然后告诉用户更新了什么。

翻译 GUI 指令

后端响应就像有一个可视化界面一样。将其指令映射到 API 调用：

"click" 或 "点击" → 通过相关端点执行操作
"open" 或 "打开" → 查询会话状态以获取数据
"drag/drop" 或 "拖拽" → 通过 SSE 发送编辑命令
"preview in timeline" → 显示当前轨道的文本摘要
"Export" 或 "导出" → 运行导出工作流程

Draft 字段映射：t=轨道，tt=轨道类型（0=视频，1=音频，7=文字），sg=片段，d=时长（毫秒），m=元数据。

时间线（3 个轨道）：
视频：城市延时（0-10秒）
BGM：Lo-fi（0-10秒，35%）
标题："Urban Dreams"（0-3秒）

错误处理

代码	含义	操作
0	成功	继续
1001	令牌错误/过期	通过 anonymous-token 重新认证（令牌 7 天后过期）
1002	会话未找到	新建会话 §3.0
2001	积分不足	匿名：显示注册 URL 带 `?bind=`（需要时从创建会话或状态响应获取）。已注册：在您的账户中充值积分
4001	不支持的文件格式	显示支持的格式
4002	文件太大	建议压缩/裁剪
400	缺少 X-Client-Id	生成 Client-Id 并重试（见 §1）
402	免费计划导出被阻止	订阅级别问题，不是积分问题。"注册或升级您的计划以解锁导出。"
429	速率限制（1 令牌/客户端/7 天）	30 秒后重试一次

技巧和窍门

当您具体指定时，后端处理速度更快。不要说"让它看起来更好"，而是尝试"将这些图片转换为带转场的流畅 30 秒视频"——具体的指令会得到更好的结果。

最大文件大小为 200MB。坚持使用 JPG、PNG、WEBP、HEIC 以获得最流畅的体验。导出为 MP4 以获得最广泛的兼容性。

常见工作流程

快速编辑：上传 → "将这些图片转换为带转场的流畅 30 秒视频" → 下载 MP4。30 秒片段需要 30-60 秒。

批量风格：在一个会话中上传多个文件。使用不同的指令逐个处理它们。每个都有自己的渲染。

迭代：从粗剪开始，预览结果，然后进行细化。会话会保持您的时间线状态，因此您可以继续调整。

License

运行时依赖

版本

安装命令

技能文档

入门

自动设置

将用户输入匹配到操作

云渲染管道详情

读取 SSE 流

翻译 GUI 指令

错误处理

技巧和窍门

常见工作流程

相关技能推荐