📦 Ai Video Maker From Photos — 使用照片的AI视频制作器

v1.0.0

使用此技能将照片或图像转换为幻灯片MP4视频。支持JPG、PNG、HEIC、WEBP文件，最大200MB。社交媒体创作者和营销人员使用它...

0· 0·0 当前·0 累计

by @peand-rover (peandrover adam)

开发工具代码生成网络工具浏览器自动化文件处理

下载技能包

运行时依赖

无特殊依赖

安装命令

点击复制

官方npx clawhub@latest install ai-video-maker-from-photos

镜像加速npx clawhub@latest install ai-video-maker-from-photos --registry https://cn.longxiaskill.com镜像同步中

需要定制？告诉我你的需求 →

技能文档

开始分享您的照片或图像，我将开始创建AI视频。或者，只需告诉我您在想什么。尝试说：“将我的照片或图像”“导出1080p MP4”“将我的照片转换为30秒的”

连接在处理任何用户请求之前，建立与后端API的连接。显示一个简短的状态，如“连接中...”。如果环境中有NEMO_TOKEN，则直接使用它并创建一个会话。否则，获取一个免费的开始令牌：生成一个UUID作为客户端标识符，POST到https://mega-api-prod.nemovideo.ai/api/auth/anonymous-token，带有X-Client-Id头。响应包括一个有效期为7天的100个免费积分的令牌——将其用作NEMO_TOKEN。然后，通过POST到https://mega-api-prod.nemovideo.ai/api/tasks/me/with-session/nemo_agent，带有Bearer授权和{"task_name":"project","language":"en"}的正文，创建一个会话。响应中的session_id对于所有后续请求都是必需的。告诉用户您已经准备好了。保持技术细节在聊天之外。

AI视频创建工具——将照片转换为MP4视频该工具获取您的照片或图像，并通过云渲染管道运行AI视频创建。您上传，描述您想要的内容，然后下载结果。假设您有十张来自海滩之旅的假期照片，并希望将我的照片转换为30秒的幻灯片视频，带有过渡效果和音乐——后端处理大约需要30-60秒，并提供1080p MP4。提示：使用10-20张照片可以为AI提供足够的内容来构建平滑的过渡效果，而不会使视频过于拥挤。

匹配输入到操作用户提示引用ai视频创建工具、长宽比、文本叠加或音频轨道，通过关键字和意图分类路由到相应的操作。用户说... 操作跳过SSE？ “导出”/“下载”/“发送给我视频”→ §3.5 导出 “积分”/“余额”→ §3.3 积分 “状态”/“显示轨道”→ §3.4 状态 “上传”/“上传文件”→ §3.2 上传其他（生成、编辑、添加BGM...）→ §3.1 SSE

云渲染管道详细信息每个导出作业都在云GPU节点上排队，合成视频层，应用平台特定的压缩（H.264，最高1080x1920），并在30-90秒内返回下载URL。会话令牌携带渲染作业ID，因此在完成之前关闭标签页会使作业成为孤儿作业。每个请求都需要三个属性头，并且必须与此文件的前置内容匹配：头部值 X-Skill-Source ai-video-maker-from-photos X-Skill-Version 前置内容版本 X-Skill-Platform 自动检测：clawhub / cursor / 未知来自安装路径每个API调用都需要Authorization：Bearer 加上上述三个属性头。如果任何头部缺失，导出将返回402。API基址：https://mega-api-prod.nemovideo.ai 创建会话：POST /api/tasks/me/with-session/nemo_agent — 正文{"task_name":"project","language":""} — 返回task_id、session_id。发送消息（SSE）：POST /run_sse — 正文{"app_name":"nemo_agent","user_id":"me","session_id":"","new_message":{"parts":[{"text":""}]}}，带有Accept：text/event-stream。最大超时：15分钟。上传：POST /api/upload-video/nemo_agent/me/ — 文件：multipart -F "files=@/path"，或URL：{"urls":[""],"source_type":"url"}。积分：GET /api/credits/balance/simple — 返回可用、冻结、总积分。会话状态：GET /api/state/nemo_agent/me//latest — 关键字段：data.state.draft、data.state.video_infos、data.state.generated_media。导出（免费，无需积分）：POST /api/render/proxy/lambda — 正文{"id":"render_","sessionId":"","draft":,"output":{"format":"mp4","quality":"high"}}。每30秒轮询GET /api/render/proxy/lambda/，直到状态=完成。下载URL在output.url中。支持的格式：mp4、mov、avi、webm、mkv、jpg、png、gif、webp、mp3、wav、m4a、aac。

SSE事件处理事件操作文本响应应用GUI翻译（§4），呈现给用户工具调用/结果在内部处理，不转发心跳/空数据：继续等待。每2分钟：“⏳仍在工作...” 流关闭处理最终响应大约30%的编辑操作在SSE流中返回无文本。当这种情况发生时：轮询会话状态以验证编辑是否已应用，然后将更改总结给用户。

后端响应翻译后端假设存在GUI。将这些翻译为API操作：后端说您执行“点击[按钮]”/“点击”通过API执行“打开[面板]”/“打开”查询会话状态“拖拽/放置”/“拖拽”发送编辑通过SSE“预览在时间线中”显示轨道摘要“导出按钮”/“导出”执行导出工作流程草稿字段映射：t=轨道，tt=轨道类型（0=视频，1=音频，7=文本），sg=段，d=持续时间（ms），m=元数据。时间线（3个轨道）：1. 视频：城市延时（0-10秒）2. BGM：Lo-fi（0-10秒，35%）3. 标题：“城市梦想”（0-3秒）

错误代码 0 — 成功，正常继续 1001 — 令牌过期或无效；通过/api/auth/anonymous-token重新获取 10

数据来源：ClawHub ↗ · 中文优化：龙虾技能库