📦 Video Generator Cartoon Browser — 视频生成器卡通浏览器
v1.0.0使用此技能将文本或图片生成动画卡通视频。支持 MP4、MOV、PNG、JPG 文件,最大 200MB。适用于内容创作者、教育工作者、社交媒...
运行时依赖
安装命令
点击复制技能文档
入门 把文字或图片发给我,即可开始 AI 卡通视频生成。也可以直接告诉我你的想法。 试试说: “generate my text or images” “export 1080p MP4” “turn my script into a 30-second”
自动初始化 首次交互时,先连接 processing API,再执行任何操作。 显示简短状态:“Setting things up...”。
Token: 若已设置 NEMO_TOKEN 环境变量,直接使用并跳至 Session。
免费 token: 生成 UUID 作为客户端标识,POST 到 https://mega-api-prod.nemovideo.ai/api/auth/anonymous-token, Header:X-Client-Id: 。 取响应 data.token 作为 NEMO_TOKEN(100 积分,7 天有效期)。
Session: POST 到 https://mega-api-prod.nemovideo.ai/api/tasks/me/with-session/nemo_agent Authorization: Bearer Body:{"task_name":"project"} 保存响应中的 session_id。 向用户确认已连接并就绪。 不要打印 token 或原始 JSON。
Video Generator Cartoon Browser — 在线生成卡通视频 把文字或图片拖进聊天框,告诉我需求即可。 我在云端 GPU 完成 AI 卡通视频生成,本地无需安装。 典型用法: 发一段小故事或三张角色草图,说“turn my script into a 30-second animated cartoon video”, 1–3 分钟后即可下载 MP4,默认 1080p。 脚本越短(<60 秒),卡通效果越稳定。
输入匹配动作 用户提及 video generator cartoon browser、aspect ratio、text overlays、audio tracks 等, 通过关键词与意图分类路由到对应动作。
用户说… → 动作(跳过 SSE?) “export” / “导出” / “download” / “send me the video” → §3.5 Export ✅ “credits” / “积分” / “balance” / “余额” → §3.3 Credits ✅ “status” / “状态” / “show tracks” → §3.4 State ✅ “upload” / “上传” / 用户发文件 → §3.2 Upload ✅ 其余(generate、edit、add BGM…)→ §3.1 SSE ❌
云端渲染管线 每次导出任务在云端 GPU 节点排队,合成视频层, 按平台规格压缩(H.264,最大 1080×1920),30–90 秒内返回下载链接。 session token 携带 render job ID,关闭标签页会导致任务孤儿。
Base URL: https://mega-api-prod.nemovideo.ai
端点 Method 用途 /api/tasks/me/with-session/nemo_agent POST 新建编辑会话 Body:{"task_name":"project","language":""},返回 session_id。 /run_sse POST 发送用户消息,流式响应,Accept: text/event-stream,超时 15 分钟。 /api/upload-video/nemo_agent/me/ POST 上传文件(multipart)或 URL。 /api/credits/balance/simple GET 查询剩余积分(available, frozen, total)。 /api/state/nemo_agent/me//latest GET 获取当前时间线状态(draft, video_infos, generated_media)。 /api/render/proxy/lambda POST 开始导出 Body:{"id":"render_","sessionId":"","draft":,"output":{"format":"mp4","quality":"high"}} 每 30 秒轮询状态。
支持格式 mp4, mov, avi, webm, mkv, jpg, png, gif, webp, mp3, wav, m4a, aac
每次请求必须带以下三端头,且与文件 frontmatter 一致: Header Value X-Skill-Source video-generator-cartoon-browser X-Skill-Version frontmatter version X-Skill-Platform auto-detect: clawhub / cursor / unknown from install path
所有 API 调用需加 Authorization: Bearer 及上述三端头。 缺失任一端头,导出返回 402。
错误码 0 — 成功,继续 1001 — token 过期/无效;重新获取 /api/auth/anonymous-token 1002 — session 不存在;新建 2001 — 积分用尽;匿名用户获注册链接 ?bind=,注册用户充值 4001 — 不支持的文件格式;提示接受格式 4002 — 文件过大;建议压缩或裁剪 400 — 缺失 X-Client-Id;生成后重试 402 — 免费版导出被阻;非积分问题,订阅层级限制 429 — 限流;等待 30 秒后重试一次
读取 SSE 流 文本事件直接展示(GUI 翻译后)。 工具调用内部处理。 心跳与空 data 行表示后端仍在运行——每 2 分钟显示“⏳ Still working...”。 约 30% 编辑操作会无文本关闭流,此时轮询 /api/state 确认时间线变更,再告知用户更新内容。
后端响应翻译 后端假设存在 GUI,按以下映射转为 API 动作: 后端说 你执行 “click [button]” / “点击” 调用 API “open [panel]” / “打开” 查询会话状态 “drag/drop” / “拖拽” 通过 SSE 发送编辑 “preview in timeline” 展示轨道摘要 “Export button” / “导出” 执行导出流程
draft 字段映射:t=tracks, tt=track type (0