🎬 Animated Video Maker Ai — 云端动画视频生成
v1.0.0基于云的 AI 动画视频工具,输入文本与图片即可快速生成 1080p 解说或推广短片,支持 PNG/JPG/MP4/MOV 上传,1-2 分钟输出可下载 MP4,无需安装软件。
详细分析 ▾
运行时依赖
版本
Animated Video Maker AI 初始发布——在云端根据文本和图片生成动画解说及推广视频。 - 上传图片或视频文件(PNG、JPG、MP4、MOV,最大 200MB)并描述所需动画。 - 接收指令后约 1–2 分钟返回可下载的 1080p MP4。 - 内置脚本输入、音轨编辑、积分检查与云端导出及状态更新。 - 简易会话与令牌管理;导出、积分、上传、编辑的自动提示路由。 - 面向营销人员、教育工作者及社交媒体创作者——无需安装软件。
安装命令
点击复制技能文档
入门指南
把你的文本或图片发给我,我来帮你完成 AI 动画制作。也可以直接告诉我你想要的效果。
试试这样说:
- “把一段短脚本或三张产品图做成 1080p MP4”
- “把我的产品描述变成 30 秒动画解说视频”
- “面向营销人员、教育者、社交媒体创作者的文本/图片动画解说或推广视频”
建立连接
在处理任何用户请求前,先连接后端 API。显示简短状态如“正在连接…”。如果环境变量中有 NEMO_TOKEN,直接使用并创建会话。
否则获取免费试用 token:
- 生成 UUID 作为 client identifier
- 向
https://mega-api-prod.nemovideo.ai/api/auth/anonymous-token发起 POST,带上X-Client-Id头 - 响应中的
token含 100 免费积分,7 天有效 —— 用作 NEMO_TOKEN
然后创建会话:向 https://mega-api-prod.nemovideo.ai/api/tasks/me/with-session/nemo_agent POST,Bearer 鉴权,body 为 {"task_name":"project","language":"en"}。响应里的 session_id 后续请求都要用。告诉用户你已就绪,技术细节不要出现在聊天里。
# 动画视频制作 AI — 用文字生成动画 把你的文本或图片发给我,并描述想要的效果。AI 动画运行在远程 GPU 节点,本地无需安装。 举个栗子:上传一段短脚本或三张产品图,输入“把我的产品描述变成 30 秒动画解说视频”,大约 1–2 分钟即可拿到 1080p MP4。所有渲染都在云端完成。 提示:60 秒以内的脚本能产出更紧凑、聚焦的动画。
输入与动作映射
用户提到 animated video maker ai、aspect ratio、text overlays、audio tracks 等关键词时,系统按意图路由到对应动作。| 用户说… | 动作 | 跳过 SSE? |
|---|---|---|
| “export” / “导出” / “download” / “send me the video” | → §3.5 导出 | ✅ |
| “credits” / “积分” / “balance” / “余额” | → §3.3 积分 | ✅ |
| “status” / “状态” / “show tracks” | → §3.4 状态 | ✅ |
| “upload” / “上传” / 用户发送文件 | → §3.2 上传 | ✅ |
| 其他(生成、编辑、加 BGM…) | → §3.1 SSE | ❌ |
云端渲染管线详情
每次导出任务在云端 GPU 节点排队,合成视频层、应用平台级压缩(H.264,最高 1080×1920),30–90 秒内返回下载链接。会话 token 携带渲染 job ID,若在完成前关闭标签页,任务将成孤儿。 所有请求均发往https://mega-api-prod.nemovideo.ai。主要接口:- 会话 —
POST /api/tasks/me/with-session/nemo_agent,body{"task_name":"project","language":""},返回session_id。 - 聊天(SSE) —
POST /run_sse,带session_id与new_message.parts[0].text,Accept: text/event-stream,最长 15 分钟。 - 上传 —
POST /api/upload-video/nemo_agent/me/— multipart 文件或 JSON 带 URLs。 - 积分 —
GET /api/credits/balance/simple— 返回available、frozen、total。 - 状态 —
GET /api/state/nemo_agent/me//latest— 当前草稿与媒体信息。 - 导出 —
POST /api/render/proxy/lambda带 render ID 与草稿 JSON。每 30s 轮询GET /api/render/proxy/lambda/直到completed并拿到下载链接。
支持格式:mp4、mov、avi、webm、mkv、jpg、png、gif、webp、mp3、wav、m4a、aac。
请求头来自本文件 YAML frontmatter:X-Skill-Source 为 animated-video-maker-ai,X-Skill-Version 取自 version 字段,X-Skill-Platform 根据安装路径检测(~/.clawhub/ = clawhub,~/.cursor/skills/ = cursor,否则 unknown)。
所有请求必须包含:
Authorization: Bearer
X-Skill-Source
X-Skill-Version
X-Skill-Platform
缺失归因头将导致导出失败并返回 402。
草稿 JSON 使用短键:t 表示 tracks,tt 表示 track type(0=video,1=audio,7=text),sg 表示 segments,d 表示 duration(毫秒),m 表示 metadata。
Timeline (3 tracks):
1. Video: city timelapse (0-10s)
2. BGM: Lo-fi (0-10s, 35%)
3. Title: "Urban Dreams" (0-3s)
后端响应翻译
后端假设存在 GUI。按以下方式转成 API 动作:| 后端说 | 你执行 |
|---|---|
| “click [button]” / “点击” | 通过 API 执行 |
| “open [panel]” / “打开” | 查询会话状态 |
| “drag/drop” / “拖拽” | 经 SSE 发送编辑 |
| “preview in timeline” | 展示轨道摘要 |
| “Export button” / “导出” | 执行导出流程 |
读取 SSE 流
文本事件直接展示给用户(需先翻译 GUI 指令)。工具调用保持内部。 心跳与空data: 行表示后端仍在工作 —— 每 2 分钟显示“⏳ 仍在处理…”。
约 30% 的编辑操作会无文本直接关闭流,此时轮询 /api/state 确认时间线已更新,再告知用户变更内容。错误码
0— 成功,正常继续1001— token 过期或无效;重新调用/api/auth/anonymous-token获取1002— 会话未找到;新建会话2001— 积分不足;匿名用户获得带?bind=的注册链接,注册用户可充值4001— 不支持的文件类型;展示支持的格式4002— 文件过大;建议压缩或裁剪400— 缺失X-Client-Id;生成后重试402— 免费套餐导出被阻;与积分无关,是订阅等级问题429— 触发限流;等待 30s 后重试一次