Video Editing With Claude Ai — 使用 Claude Ai 进行视频编辑
v1.0.0准备好发布编辑后的MP4视频,无需调整单个滑块。上传原始视频素材(MP4、MOV、AVI、WebM,最高500MB),输入类似“剪掉停顿,添加章节标题,并导出干净的最终剪辑”的指令,完成后下载1080p MP4。针对快速移动的内容创作者和营销人员,他们希望在不学习复杂视频软件的情况下获得智能AI编辑。
运行时依赖
安装命令
点击复制技能文档
开始 分享您的原始视频录像,我将开始使用AI辅助视频编辑。或者,只需告诉我您的想法。尝试说:“编辑我的原始视频录像”、“导出1080p MP4”、“剪辑暂停,添加章节标题”, 自动设置 在第一次交互时,在做任何其他事情之前,连接到处理API。显示简短的状态,如“设置中...”。 令牌: 如果NEMO_TOKEN环境变量已经设置,使用它并跳转到会话下。 免费令牌: 生成一个UUID作为客户端标识符,然后使用头部X-Client-Id:向https://mega-api-prod.nemovideo.ai/api/auth/anonymous-token发送POST请求。响应字段data.token成为您的NEMO_TOKEN(100积分,7天过期)。 会话: 使用Bearer身份验证和正文{"task_name":"project"}向https://mega-api-prod.nemovideo.ai/api/tasks/me/with-session/nemo_agent发送POST请求。从响应中保存session_id。确认您已连接并准备就绪。不要打印令牌或原始JSON。 使用Claude AI的视频编辑 - 编辑和导出AI剪辑视频 将原始视频录像放入聊天中并告诉我您需要什么。我将处理基于云GPU的AI辅助视频编辑 - 您不需要在本地安装任何内容。 这里有一个典型的用例:您发送一段3分钟的未编辑的屏幕录像,要求剪辑暂停,添加章节标题,并导出一个干净的最终剪辑,大约1-2分钟后,您将拥有一个可以下载的MP4文件。整个过程默认以1080p运行。 一个值得注意的事情 - 用简单的语言描述您的编辑,Claude将准确地解释意图。 匹配输入到操作 用户提示引用视频编辑与Claude AI,纵横比,文本叠加或音频轨道,通过关键字和意图分类路由到相应的操作。 用户说... 操作 跳过SSE? “导出”/“导出”/“下载”/“发送给我视频”→ §3.5 导出 “积分”/“积分”/“余额”/“余额”→ §3.3 积分 “状态”/“状态”/“显示轨道”→ §3.4 状态 “上传”/“上传”/用户发送文件→ §3.2 上传 其他所有内容(生成,编辑,添加BGM...)→ §3.1 SSE 云渲染管道详细信息 每个导出作业都在云GPU节点上排队,合成视频层,应用平台规格压缩(H.264,最高1080x1920),并在30-90秒内返回下载URL。如果在完成之前关闭选项卡,渲染作业将被遗弃。 技能归属 - 从此文件的YAML前置内容中读取: X-Skill-Source:video-editing-with-claude-ai X-Skill-Version:从前置内容版本中 X-Skill-Platform:从安装路径中检测(~/.clawhub/ → clawhub,~/.cursor/skills/ → cursor,否则未知) 包括授权:Bearer 和所有归属头部在每个请求中 - 省略它们将在导出时触发402。 API基址:https://mega-api-prod.nemovideo.ai 创建会话:POST /api/tasks/me/with-session/nemo_agent - 正文{"task_name":"project","language":""} - 返回task_id,session_id。 发送消息(SSE):POST /run_sse - 正文{"app_name":"nemo_agent","user_id":"me","session_id":"","new_message":{"parts":[{"text":""}]}},Accept:text/event-stream。 最大超时:15分钟。 上传:POST /api/upload-video/nemo_agent/me/ - 文件:multipart -F "files=@/path",或URL:{"urls":[""],"source_type":"url"}。 积分:GET /api/credits/balance/simple - 返回可用,冻结,总计。 会话状态:GET /api/state/nemo_agent/me//latest - 关键字段:data.state.draft,data.state.video_infos,data.state.generated_media。 导出(免费,无需积分):POST /api/render/proxy/lambda - 正文{"id":"render_","sessionId":"","draft":,"output":{"format":"mp4","quality":"high"}}。每30秒轮询GET /api/render/proxy/lambda/,直到状态=完成。下载URL在output.url中。 支持的格式:mp4,mov,avi,webm,mkv,jpg,png,gif,webp,mp3,wav,m4a,aac。 阅读SSE流 文本事件直接发送给用户(在GUI翻译后)。工具调用保持内部。心跳和空数据:行意味着后端仍在工作 - 每2分钟显示“⏳仍在工作...”。 大约30%的编辑操作在没有任何文本的情况下关闭流。当这种情况发生时,轮询/api/state以确认时间线已更改,然后告诉用户什么已更新。 翻译GUI说明 后端响应就像有一个可视化界面一样。将其指令映射到API调用: “点击”或“点击”→通过相关端点执行操作 “打开”或“打开”→查询会话状态以获取数据 “拖拽/放置”或“拖拽”→通过SSE发送编辑命令 “预览时间线”→显示当前轨道的文本摘要 “导出”或“导出”→运行导出工作流 草稿JSON使用短键:t表示轨道,tt表示轨道类型(0=视频,1=音频,7=文本),sg表示段,d表示以毫秒为单位的持续时间,m表示元数据。 时间线摘要示例: 时间线(3个轨道):
- 视频:城市延时(0-10秒)
- BGM:Lo-fi(0-10秒,35%)
- 标题:“城市梦想”(0-3秒)