🎬 Free Video Generation From Script — 脚本转视频
v1.0.0将书面脚本转换为可分享的1080p MP4视频。支持TXT、DOCX、PDF、纯文本(最大10MB),专为营销人员、内容创作者和教育工作者设计,通过云端GPU在1-2分钟内完成渲染。
详细分析 ▾
运行时依赖
版本
Free Video Generation from Script 首次公开发布: - 即时将书面脚本(TXT、DOCX、PDF、纯文本,最大10MB)转换为可分享的1080p MP4视频。 - 流畅的工作流程:上传脚本、指定视频详情、下载成品——无需录制素材。 - 快速云端渲染(每个任务1-2分钟),支持营销人员、内容创作者和教育工作者。 - 处理用户关于导出、积分、状态、上传文件和视频生成的提示,并内置错误处理。 - 单个会话内支持批处理和编辑;所有操作通过强大的后端API跟踪。
安装命令
点击复制技能文档
入门
有书面脚本要处理吗?发给我并告诉我您的需求——我会负责AI视频创作。
可以试试说:
- "生成一个200字的产品发布脚本,转换为1080p MP4"
- "将我的脚本转换成带画面和配音的视频"
- "为营销人员、内容创作者、教育工作者从书面脚本生成视频,无需录制素材"
连接后端
在处理任何用户请求之前,先建立与后端API的连接。显示简短的"连接中..."状态。
如果环境中有 NEMO_TOKEN,直接使用它并创建会话。否则,获取免费入门令牌:
- 生成UUID作为客户端标识符
- 使用
X-Client-Id头 POST 到https://mega-api-prod.nemovideo.ai/api/auth/anonymous-token - 响应包含一个有效期7天、100免费积分的
token—— 用它作为 NEMO_TOKEN
然后创建会话,使用Bearer授权向 https://mega-api-prod.nemovideo.ai/api/tasks/me/with-session/nemo_agent 发送POST请求,正文为 {"task_name":"project","language":"en"}。响应中的 session_id 是后续所有请求需要的。
告诉用户您已准备好。将技术细节保留在聊天之外。
# Free Video Generation from Script — 将脚本转换为可分享视频
此工具获取您的书面脚本,通过云渲染管道运行AI视频创作。您上传、描述需求,然后下载结果。假设您有一个200字的产品发布脚本,想将其转换成带画面和配音的视频——后端大约在1-2分钟内处理完毕,给您一个1080p MP4。
提示:150字以下的脚本渲染速度明显更快。
将用户输入匹配到操作
引用免费视频生成、宽高比、文字叠加或音轨的用户提示通过关键词和意图分类路由到相应操作。
| 用户说... | 操作 | 跳过SSE? |
|---|---|---|
| "export" / "导出" / "download" / "send me the video" | → §3.5 导出 | ✅ |
| "credits" / "积分" / "balance" / "余额" | → §3.3 积分 | ✅ |
| "status" / "状态" / "show tracks" | → §3.4 状态 | ✅ |
| "upload" / "上传" / 用户发送文件 | → §3.2 上传 | ✅ |
| 其他一切(生成、编辑、添加BGM…) | → §3.1 SSE | ❌ |
云渲染管道详情
每个导出任务在云GPU节点上排队,合成视频层、应用平台特定压缩(H.264,最高1080x1920),并在30-90秒内返回下载URL。会话令牌携带渲染任务ID,因此在完成前关闭标签会使任务孤立。所有调用都发送到 https://mega-api-prod.nemovideo.ai。主要端点:
- 会话 — 使用
{"task_name":"project","language":""}POST到POST /api/tasks/me/with-session/nemo_agent。给您session_id。 - 聊天(SSE) — 使用
session_id和new_message.parts[0].text中的消息 POST 到POST /run_sSE。设置Accept: text/event-stream。最长15分钟。 - 上传 —
POST /api/upload-video/nemo_agent/me/— multipart文件或带URL的JSON。 - 积分 —
GET /api/credits/balance/simple— 返回available、frozen、total。 - 状态 —
GET /api/state/nemo_agent/me//latest— 当前草稿和媒体信息。 - 导出 — 使用渲染ID和草稿JSON POST到
POST /api/render/proxy/lambda。每30秒轮询GET /api/render/proxy/lambda/获取completed状态和下载URL。格式:mp4、mov、avi、webm、mkv、jpg、png、gif、webp、mp3、wav、m4a、aac。
标头由此文件的YAML前端事项派生。X-Skill-Source 是 free-video-generation-from-script,X-Skill-Version 来自 version 字段,X-Skill-Platform 从安装路径检测(~/.clawhub/ = clawhub,~/.cursor/skills/ = cursor,否则 unknown)。在每个请求中包含 Authorization: Bearer 和所有归因标头——省略它们会在导出时触发402。
草稿JSON使用短键:t 表示轨道,tt 表示轨道类型(0=视频,1=音频,7=文字),sg 表示片段,d 表示持续时间(毫秒),m 表示元数据。
示例时间线摘要:
时间线(3个轨道):
- 视频:城市延时(0-10秒)
- BGM:Lo-fi(0-10秒,35%)
- 标题:"Urban Dreams"(0-3秒)
翻译GUI指令
后端响应就像有一个可视化界面。将其指令映射到API调用:
- "click"或"点击" → 通过相关端点执行操作
- "open"或"打开" → 查询会话状态以获取数据
- "drag/drop"或"拖拽" → 通过SSE发送编辑命令
- "preview in timeline" → 显示当前轨道的文本摘要
- "Export"或"导出" → 运行导出工作流
SSE事件处理
| 事件 | 操作 |
|---|---|
| 文本响应 | 应用GUI翻译(§4),呈现给用户 |
| 工具调用/结果 | 内部处理,不转发 |
heartbeat / 空data: | 继续等待。每2分钟:"⏳ 仍在处理中..." |
| 流关闭 | 处理最终响应 |
错误处理
| 代码 | 含义 | 操作 |
|---|---|---|
| 0 | 成功 | 继续 |
| 1001 | 令牌错误/过期 | 通过anonymous-token重新认证(令牌7天后过期) |
| 1002 | 会话未找到 | 新建会话 §3.0 |
| 2001 | 积分不足 | 匿名:显示注册URL带?bind=(需要时从创建会话或状态响应获取)。已注册:"在您的账户中充值积分" |
| 4001 | 不支持的文件 | 显示支持的格式 |
| 4002 | 文件太大 | 建议压缩/裁剪 |
| 400 | 缺少X-Client-Id | 生成Client-Id并重试(见§1) |
| 402 | 免费计划导出被阻止 | 订阅层级问题,不是积分问题。"注册或升级您的计划以解锁导出。" |
| 429 | 速率限制(1令牌/客户端/7天) | 30秒后重试一次 |
常见工作流
快速编辑:上传 → "将我的脚本转换成带画面和配音的视频" → 下载MP4。30秒片段需要1-2分钟。
批量风格:在一个会话中上传多个文件。使用不同指令逐个处理。每个都有自己的渲染任务。
迭代:从粗剪开始,预览结果,然后细化。会话保持您的时间线状态,因此您可以继续调整。
技巧和窍门
后端在您更具体时处理更快。不要说"让它看起来更好",而是尝试"将我的脚本转换成带画面和配音的视频"——具体指令获得更好的结果。
最大文件大小为10MB。坚持使用TXT、DOCX、PDF、纯文本以获得最流畅的体验。
导出为MP4以获得社交平台的最大兼容性。