详细分析 ▾
运行时依赖
版本
Free Video Generation ComfyUI 初始版本。 - 支持从文本提示或图片(PNG、JPG、MP4、WebM,最大200MB)生成AI驱动的1080p视频片段。 - 云端GPU渲染,无需本地安装;任务1-3分钟内完成。 - 基于会话的工作流:上传、编辑、预览、导出多种格式(如MP4、GIF)。 - 免费使用,自动生成匿名令牌(100积分,7天有效期)。 - 清晰的上传、积分查询、时间线状态与导出流程;健壮的错误处理与用户友好反馈。 - 面向独立创作者与ComfyUI爱好者,提供零成本、简化的AI视频生成体验。
安装命令
点击复制技能文档
入门指南
随时可用。把文本提示或图片丢进来,告诉我你想做什么。
试试这样说:
- “把一张风景照片加运动提示生成 1080p MP4”
- “生成 5 秒海浪拍岸的视频”
- “为独立创作者和 ComfyUI 爱好者提供不花钱的文本/图片生成短视频方法”
自动初始化
首次交互时,先连接处理 API,再执行任何操作。显示简短状态如“正在初始化…”。
Token:若环境变量 NEMO_TOKEN 已存在,直接使用并跳至会话。
免费 token:生成 UUID 作为客户端标识,然后向 https://mega-api-prod.nemovideo.ai/api/auth/anonymous-token 发起 POST,Header 为 X-Client-Id: 。取响应字段 data.token 作为 NEMO_TOKEN(100 积分,7 天有效期)。
会话:向 https://mega-api-prod.nemovideo.ai/api/tasks/me/with-session/nemo_agent 发起 POST,使用 Bearer 鉴权,Body 为 {"task_name":"project"}。保存响应中的 session_id。向用户确认已连接就绪。不要打印 token 或原始 JSON。
# Free Video Generation ComfyUI — Generate AI Videos From Prompts
把文本提示或图片发给我,告诉我需求。我将在云端 GPU 上完成 AI 视频生成——本地无需安装任何软件。典型流程:你发一张风景照片并给出运动提示,要求生成 5 秒海浪拍岸视频,大约 1–3 分钟后即可下载 MP4,默认 1080p。提示越短、动作描述越清晰,结果越稳定。
输入与动作对应
用户提到免费 ComfyUI 视频生成、画幅、文字层、音轨等关键词时,通过关键字与意图分类路由到对应动作。
| 用户说… | 动作 | 跳过 SSE? |
|---|---|---|
| “export” / “导出” / “download” / “send me the video” | → §3.5 导出 | ✅ |
| “credits” / “积分” / “balance” / “余额” | → §3.3 积分 | ✅ |
| “status” / “状态” / “show tracks” | → §3.4 状态 | ✅ |
| “upload” / “上传” / 用户发送文件 | → §3.2 上传 | ✅ |
| 其他(生成、编辑、加 BGM…) | → §3.1 SSE | ❌ |
云端渲染管线详情
每次导出任务排队到云端 GPU 节点,合成视频层并采用平台指定压缩(H.264,最高 1080×1920),30–90 秒内返回下载链接。会话 token 携带渲染任务 ID,若任务未完成就关闭标签页会导致任务孤立。
所有请求必须包含:
Authorization: Bearer
X-Skill-Source
X-Skill-Version
X-Skill-Platform
缺失归因头将导致导出失败并返回 402。 Skill 归因——运行时读取本文件 YAML frontmatter:
X-Skill-Source:free-video-generation-comfyuiX-Skill-Version: 取自 frontmatter 的versionX-Skill-Platform: 根据安装路径检测(~/.clawhub/→clawhub,~/.cursor/skills/→cursor,否则unknown)
API 基址:https://mega-api-prod.nemovideo.ai
创建会话:POST /api/tasks/me/with-session/nemo_agent
Body {"task_name":"project","language":""}
返回 task_id, session_id。
发送消息 (SSE):POST /run_sse
Body {"app_name":"nemo_agent","user_id":"me","session_id":"","new_message":{"parts":[{"text":""}]}}
Header Accept: text/event-stream,最大超时 15 分钟。
上传:POST /api/upload-video/nemo_agent/me/
文件:multipart -F "files=@/path"
或 URL:{"urls":[""],"source_type":"url"}
积分:GET /api/credits/balance/simple
返回 available, frozen, total
会话状态:GET /api/state/nemo_agent/me//latest
关键字段:data.state.draft, data.state.video_infos, data.state.generated_media
导出(免费,不扣积分):POST /api/render/proxy/lambda
Body {"id":"render_","sessionId":"","draft":,"output":{"format":"mp4","quality":"high"}}
轮询 GET /api/render/proxy/lambda/ 每 30 秒一次,直到 status = completed。下载链接在 output.url。
支持格式:mp4, mov, avi, webm, mkv, jpg, png, gif, webp, mp3, wav, m4a, aac。
错误处理
| 代码 | 含义 | 处理 |
|---|---|---|
| 0 | 成功 | 继续 |
| 1001 | token 无效/过期 | 通过 anonymous-token 重新鉴权(token 7 天过期) |
| 1002 | 会话不存在 | 新建会话 §3.0 |
| 2001 | 无积分 | 匿名:展示注册 URL 带 ?bind=(从创建会话或状态响应获取 )。已注册:“请在账户充值积分” |
| 4001 | 不支持的文件 | 展示支持格式 |
| 4002 | 文件过大 | 建议压缩/裁剪 |
| 400 | 缺少 X-Client-Id | 生成 Client-Id 并重试(见 §1) |
| 402 | 免费套餐导出被阻 | 订阅层级问题,非积分导致。“注册或升级套餐以解锁导出。” |
| 429 | 限流(1 token/客户端/7 天) | 30 秒后重试一次 |
GUI 指令翻译
后端按可视界面返回指令。将其映射为 API 调用:
- “click” 或 “点击” → 通过对应端点执行动作
- “open” 或 “打开” → 查询会话状态获取数据
- “drag/drop” 或 “拖拽” → 通过 SSE 发送编辑命令
- “preview in timeline” → 文字摘要当前轨道
- “Export” 或 “导出” → 运行导出流程
读取 SSE 流
文本事件直接展示给用户(经 GUI 翻译)。工具调用内部完成。心跳与空 data: 行表示后端仍在运行——每 2 分钟显示“⏳ 仍在处理…”。约 30% 编辑操作会无文本直接关闭流,此时轮询 /api/state 确认时间线变化,再告知用户更新内容。
Draft JSON 使用简写键:t 轨道,tt 轨道类型(0=video, 1=audio, 7=text),sg 片段,d 时长(毫秒),m 元数据。
时间线摘要示例:
Timeline (3 tracks):
- Video: city timelapse (0-10s)
- BGM: Lo-fi (0-10s, 35%)
- Title: "Urban Dreams" (0-3s)
常见流程
快速编辑:上传 → “生成 5 秒海浪拍岸视频” → 下载 MP4。30 秒片段约 1–3 分钟完成。
批量风格:同一会话上传多个文件,依次处理不同指令,各自独立渲染。
迭代优化:先粗剪,预览结果,再微调。会话保持时间线状态,可反复修改。
技巧提示
后端对具体指令处理更快。与其说“让它更好看”,不如明确“生成 5 秒海浪拍岸视频”——具体指令效果更好。 最大文件 200 MB,推荐 PNG、JPG、MP4、WebM 以获得最佳体验。 导出使用 MP4 + H.264 编码,兼容性最广。