🎬 Video Editing Ai Gpt — AI视频编辑
v1.0.0将3分钟未剪辑的屏幕录制通过输入文字需求即可转换为1080p高清MP4视频。使用GPT驱动的命令编辑视频,无需手动操作时间轴或导出设置,1-2分钟即可完成短片编辑并下载。
详细分析 ▾
运行时依赖
版本
Video Editing AI GPT 首次发布——通过简单的 AI 提示词编辑视频。- 上传原始素材并描述所需的编辑;无需时间轴或手动导出。- 自动后端设置:为每个用户处理认证、会话管理和云连接。- 支持多种用户意图,如导出、积分、文件上传和编辑命令。- 在 1-2 分钟内为短片段编辑并导出高质量 1080p 视频。- 强大的错误处理、会话管理以及对常见问题的反馈。- 接受常见的视频/音频/图片格式,最大 500MB;推荐使用 MP4 (H.264) 以获得最佳效果。
安装命令
点击复制技能文档
入门
分享您的原始视频素材,我会开始 AI 视频编辑。或者直接告诉我您的想法。
试试这样说:
- "edit my raw video footage"
- "export 1080p MP4"
- "cut the pauses, add transitions, and"
快速启动设置
该技能连接至云处理后端。首次使用时,自动设置连接并告知用户("Connecting...")。
令牌检查:在环境中查找 NEMO_TOKEN。如果找到,跳过会话创建。否则:
- 生成 UUID 作为客户端标识符
- 使用
X-Client-Id头 POSThttps://mega-api-prod.nemovideo.ai/api/auth/anonymous-token - 从响应中提取
data.token——这是您的 NEMO_TOKEN(100 免费积分,7 天有效期)
会话:使用 Bearer 认证和 body {"task_name":"project"} POST https://mega-api-prod.nemovideo.ai/api/tasks/me/with-session/nemo_agent。保留返回的 session_id 用于所有操作。设置完成后用简短的 "Ready!" 告知用户。不要暴露令牌或原始 API 输出。
# Video Editing AI GPT — 通过 AI 提示词编辑视频
在聊天中放下您的原始视频素材,告诉我您的需求。我会在云 GPU 上处理 AI 视频编辑——您无需在本地安装任何东西。
这是一个典型的用例:您发送一个 3 分钟未剪辑的屏幕录制,请求"剪掉停顿、添加转场并生成字幕",大约 1-2 分钟后您就可以下载准备好的 MP4 文件。整个过程默认以 1080p 运行。
值得注意的一点——2 分钟以下的短片段处理速度明显更快,AI 结果也更准确。
将用户输入匹配到操作
引用视频编辑 ai gpt、宽高比、文字叠加或音轨的用户提示词通过关键词和意图分类路由到相应的操作。
| 用户说... | 操作 | 跳过 SSE? |
|---|---|---|
| "export" / "导出" / "download" / "send me the video" | → §3.5 导出 | ✅ |
| "credits" / "积分" / "balance" / "余额" | → §3.3 积分 | ✅ |
| "status" / "状态" / "show tracks" | → §3.4 状态 | ✅ |
| "upload" / "上传" / 用户发送文件 | → §3.2 上传 | ✅ |
| 其他一切(生成、编辑、添加 BGM…) | → §3.1 SSE | ❌ |
云渲染流水线详情
每个导出任务在云 GPU 节点上排队,该节点合成视频层、应用平台特定压缩(H.264,最高 1080x1920),并在 30-90 秒内返回下载 URL。会话令牌携带渲染任务 ID,因此在完成前关闭标签页会使任务孤立。所有调用都发送到 https://mega-api-prod.nemovideo.ai。主要端点:
- 会话 — 使用
{"task_name":"project","language":""}POST/api/tasks/me/with-session/nemo_agent。为您提供session_id。 - 聊天 (SSE) — 使用
session_id和您在new_message.parts[0].text中的消息 POST/run_sse。设置Accept: text/event-stream。最长 15 分钟。 - 上传 — POST
/api/upload-video/nemo_agent/me/— multipart 文件或带 URL 的 JSON。 - 积分 — GET
/api/credits/balance/simple— 返回available、frozen、total。 - 状态 — GET
/api/state/nemo_agent/me//latest— 当前草稿和媒体信息。 - 导出 — 使用渲染 ID 和草稿 JSON POST
/api/render/proxy/lambda。每 30 秒轮询GET /api/render/proxy/lambda/获取completed状态和下载 URL。格式:mp4, mov, avi, webm, mkv, jpg, png, gif, webp, mp3, wav, m4a, aac。
每个请求需要三个归属标头,必须与此文件的 frontmatter 匹配:
| 标头 | 值 |
|---|---|
X-Skill-Source | video-editing-ai-gpt |
X-Skill-Version | frontmatter version |
X-Skill-Platform | 自动检测:安装路径中的 clawhub / cursor / unknown |
Authorization: Bearer 和所有归属标头——省略它们会在导出时触发 402。草稿字段映射:t=轨道,tt=轨道类型(0=视频,1=音频,7=文字),sg=片段,d=时长(毫秒),m=元数据。
时间轴(3 轨道):
- 视频:城市延时(0-10秒)
- BGM:Lo-fi(0-10秒,35%)
- 标题:"Urban Dreams"(0-3秒)
后端响应翻译
后端假设存在 GUI。将这些翻译为 API 操作:
| 后端说 | 您执行 |
|---|---|
| "click [button]" / "点击" | 通过 API 执行 |
| "open [panel]" / "打开" | 查询会话状态 |
| "drag/drop" / "拖拽" | 通过 SSE 发送编辑 |
| "preview in timeline" | 显示轨道摘要 |
| "Export button" / "导出" | 执行导出工作流 |
SSE 事件处理
| 事件 | 操作 |
|---|---|
| 文本响应 | 应用 GUI 翻译(第 4 节),呈现给用户 |
| 工具调用/结果 | 内部处理,不转发 |
heartbeat / 空 data: | 继续等待。每 2 分钟:"⏳ 仍在处理中..." |
| 流关闭 | 处理最终响应 |
错误代码
0— 成功,正常继续1001— 令牌过期或无效;通过/api/auth/anonymous-token重新获取1002— 会话未找到;创建新会话2001— 积分不足;匿名用户获得带?bind=的注册链接,注册用户充值4001— 不支持的文件类型;显示接受的格式4002— 文件太大;建议压缩或裁剪400— 缺少X-Client-Id;生成一个并重试402— 免费计划导出被阻止;不是积分问题,是订阅等级429— 速率限制;等待 30 秒并重试一次
常见工作流
快速编辑:上传 → "剪掉停顿、添加转场并生成字幕" → 下载 MP4。30 秒片段需要 1-2 分钟。
批量风格:在一个会话中上传多个文件。使用不同指令逐个处理。每个都有自己的渲染。
迭代:从粗剪开始,预览结果,然后细化。会话会保留您的时间轴状态,因此您可以继续调整。
技巧和窍门
后端在您具体指定时处理更快。不要说"让它看起来更好",而是尝试"剪掉停顿、添加转场并生成字幕"——具体指令会获得更好的结果。
最大文件大小为 500MB。坚持使用 MP4、MOV、AVI、WebM 以获得最流畅的体验。
使用 H.264 编码的 MP4 导出,以获得跨平台的最大兼容性。