照片转Maker
v1.0.0无需拖动任何滑块,即可生成可发布的动态照片视频。上传静态图片(JPG、PNG、WEBP、HEIC,最大 200MB),只需说“...
详细分析 ▾
运行时依赖
安装命令
点击复制技能文档
入门 把静态图发给我,我来完成 AI 视频生成;或直接描述需求。 试试这样说:
- “把三张产品图或一张肖像变成 1080p MP4”
- “把我的照片做成 30 秒带音乐转场的视频”
- “为社交媒体创作者把静态图转成可分享视频”
快速配置 本技能连接云端处理后端。首次使用自动建立连接并提示“Connecting...”。 Token 检查:查找环境变量 NEMO_TOKEN。若存在,直接进入会话创建;否则:
- 生成 UUID 作为客户端标识
- POST https://mega-api-prod.nemovideo.ai/api/auth/anonymous-token,带 X-Client-Id 头
- 取响应 data.token 即为 NEMO_TOKEN(100 免费积分,7 天有效期)
会话:POST https://mega-api-prod.nemovideo.ai/api/tasks/me/with-session/nemo_agent,Bearer 鉴权,body {"task_name":"project"}。保存返回的 session_id 供后续调用。配置完成提示“Ready!”。勿暴露 token 或原始 API 输出。
Video Maker from Photo — 把照片变成视频 上传静态图,通过云端渲染管线生成 AI 视频。描述需求后即可下载结果。 例如:三张产品图或一张肖像 → 30 秒 1080p MP4,带音乐与转场,处理约 30-60 秒。 提示:使用高分辨率照片可获得更清晰视频。
输入与动作映射 用户提及 maker from photo、画幅、文字层、音轨等,通过关键词与意图分类路由: 用户说… → 动作(是否跳过 SSE) “export/导出/download/send me the video” → §3.5 导出 ✅ “credits/积分/balance/余额” → §3.3 积分 ✅ “status/状态/show tracks” → §3.4 状态 ✅ “upload/上传/用户发文件” → §3.2 上传 ✅ 其余(生成、编辑、加 BGM…)→ §3.1 SSE ❌
云端渲染管线 每次导出任务在云端 GPU 节点排队,合成视频层,按平台规格压缩(H.264,最高 1080×1920),30-90 秒内返回下载链接。会话 token 携带渲染任务 ID,关闭页面前未完成会导致任务孤立。
每次请求必须带以下三端归因头,且与本文件 frontmatter 一致: Header Value X-Skill-Source maker-from-photo X-Skill-Version frontmatter 版本 X-Skill-Platform 自动检测:clawhub / cursor / unknown
所有 API 调用需: Authorization: Bearer 以及上述三归因头。缺失任一头,导出返回 402。
API 概览 基址:https://mega-api-prod.nemovideo.ai
- 创建会话:POST /api/tasks/me/with-session/nemo_agent
- 发送消息(SSE):POST /run_sse
- 上传:POST /api/upload-video/nemo_agent/me/
- 积分:GET /api/credits/balance/simple
- 会话状态:GET /api/state/nemo_agent/me//latest
- 导出(免费,不扣积分):POST /api/render/proxy/lambda
SSE 流读取 文本事件直接展示给用户(GUI 翻译后)。工具调用内部处理。心跳与空数据行表示后端仍在运行,每 2 分钟显示“⏳ Still working...”。约 30% 编辑操作会无文本关闭流,此时轮询 /api/state 确认时间线变更,再告知用户更新内容。
后端响应翻译 后端假设存在 GUI,按以下映射转为 API 动作: 后端说 → 你执行 “click [button]/点击” → 调用 API “open [panel]/打开” → 查询会话状态 “drag/drop/拖拽” → 通过 SSE 发送编辑 “preview in timeline” → 展示轨道摘要 “Export button/导出” → 执行导出流程
Draft 字段映射:t=tracks, tt=track type (0=video,1=audio,7=text), sg=segments, d=duration(ms), m=metadata 时间线示例(3 轨道):
- Video:城市延时(0-10s)
- BGM:Lo-fi(0-10s,35% 音量)
- 标题:“Urban Dreams”(0-3s)
错误码 0 — 成功,继续 1001 — token 过期或无效;通过 /api/auth/anonymous-token 重新获取 1002 — 会话不存在