📦 Video Generation Like — 视频生成 Like
v1.0.0Skip the learning curve of professional editing software. Describe what you want — 生成 a new video in the same style, pacing, and tone as this example —...
运行时依赖
安装命令
点击复制技能文档
入门 随时待命。把参考视频拖进来,或文字描述需求。 试试说: “生成一段30秒品牌视频,输出1080p MP4” “按这条示例的风格、节奏、基调生成新视频” “为创作者、营销人批量生成匹配参考片风格的新视频”
自动初始化 首次交互时,先连接处理API,再执行任何操作。 显示“正在初始化…”
Token 若环境变量NEMO_TOKEN已存在,直接取用,跳到“会话”步骤。
免费token
- 生成UUID作为clientId
- POST https://mega-api-prod.nemovideo.ai/api/auth/anonymous-token
- 取响应data.token作为NEMO_TOKEN(100积分,7天有效期)
会话 POST https://mega-api-prod.nemovideo.ai/api/tasks/me/with-session/nemo_agent Bearer token Body: {"task_name":"project"} 保存返回的session_id 向用户确认“已连接,可开始”。 勿打印token或原始JSON。
视频生成 Like — 参考风格生成视频 把参考视频发给我,并描述想要的结果。 AI风格匹配在远程GPU节点运行,本机无需安装。 示例:上传30秒品牌视频,输入“按这条示例的风格、节奏、基调生成新视频”,约1-2分钟返回1080p MP4。 渲染全在云端完成。 提示:参考片<60秒时风格匹配更准。
指令映射 用户提及生成、画幅、文字、音轨等关键词,系统按意图分发: 用户说… → 动作 → 跳过SSE? “export/导出/download/发我视频” → §3.5 导出 ✅ “credits/积分/balance/余额” → §3.3 积分 ✅ “status/状态/show tracks” → §3.4 状态 ✅ “upload/上传/发文件” → §3.2 上传 ✅ 其余(生成、剪辑、加BGM…) → §3.1 SSE ❌
云端渲染流程 导出任务进入GPU队列,合成视频层,按平台规格压缩(H.264,最大1080×1920),30-90秒返回下载链接。 session token携带render job ID,关闭页面前未完成的作业将被遗弃。
Base URL: https://mega-api-prod.nemovideo.ai Endpoint概览 POST /api/tasks/me/with-session/nemo_agent 开启会话,返回session_id POST /run_sse 发送用户消息,SSE流式响应,15 min超时 POST /api/upload-video/nemo_agent/me/ 上传文件或URL GET /api/credits/balance/simple 查剩余积分 GET /api/state/nemo_agent/me//latest 获取时间线状态 POST /api/render/proxy/lambda 启动导出,轮询状态
支持格式 mp4, mov, avi, webm, mkv, jpg, png, gif, webp, mp3, wav, m4a, aac
技能归因 运行时读取本文件YAML头: X-Skill-Source: video-generation-like X-Skill-Version: 取自frontmatter X-Skill-Platform: 按安装路径检测
所有请求须带 Authorization: Bearer 及归因头,否则导出报402。
错误码 0 — 成功 1001 — token失效,重新获取 1002 — 会话丢失,重建 2001 — 积分用尽,匿名用户获注册链接 4001 — 不支持的文件类型 4002 — 文件过大,建议压缩 400 — 缺失X-Client-Id,补发重试 402 — 免费套餐导出受限 429 — 限流,30秒后重试
SSE事件处理 事件 → 动作 文本响应 → GUI翻译(§4)后展示 tool call/result → 内部处理,不转发 heartbeat/空数据 → 持续等待,每2分钟提示“⏳仍在处理…” 流结束 → 处理最终响应
约30%编辑操作SSE无文本返回,此时轮询session state确认变更,再向用户总结。
GUI指令翻译 后端按可视化界面回复,映射为API调用: “click/点击” → 调用对应endpoint “open/打开” → 查询session state “drag/drop/拖拽” → 经SSE发送编辑命令 “preview in timeline” → 文字描述预览