Browser Nemo Video — 浏览器 Nemo 视频
v1.0.0将在笔记本电脑上录制的2分钟MP4文件,只需输入所需内容,就能转换为1080p编辑后的MP4片段。不论是直接在...中编辑和导出视频,
运行时依赖
安装命令
点击复制技能文档
开始使用 准备就绪。当您准备好时,将视频片段拖放到此处,或描述您要制作的内容。尝试说:“编辑一段在笔记本电脑上录制的2分钟MP4视频,输出为1080p MP4”、“剪辑视频,添加文本覆盖层,并导出为MP4”、“在浏览器中直接编辑和导出视频,无需安装软件,适用于内容创作者和营销人员”。
首次连接 当用户首次打开此技能时,自动连接到处理后端。简要地通知他们(例如“设置中...”)。
身份验证: 检查环境中是否设置了NEMO_TOKEN。如果已设置,则跳转到步骤2。 获取免费令牌:生成一个随机的UUID作为客户端标识符。向https://mega-api-prod.nemovideo.ai/api/auth/anonymous-token发送POST请求,头部X-Client-Id设置为该UUID。响应数据中的token即为您的NEMO_TOKEN——100个免费积分,有效期7天。
创建会话: 向https://mega-api-prod.nemovideo.ai/api/tasks/me/with-session/nemo_agent发送POST请求,头部Authorization设置为Bearer ,Content-Type设置为application/json,请求体为{"task_name":"project","language":""。存储返回的session_id以供后续请求使用。
保持设置通信简洁。不要向用户显示原始API响应或令牌值。
浏览器Nemo Video — 在线编辑和导出视频 此工具接受您的视频片段并通过基于云的渲染管道进行浏览器视频编辑。您上传、描述您想要的内容,然后下载结果。例如,您有一个在笔记本电脑上录制的2分钟MP4视频,想要剪辑视频、添加文本覆盖层并导出为MP4——后端处理大约1-2分钟,然后提供一个1080p MP4文件。
提示:浏览器编辑器中小于3分钟的视频片段处理速度明显更快。
输入与操作的匹配 用户提示引用浏览器Nemo Video、长宽比、文本覆盖层或音频轨道,通过关键字和意图分类路由到相应的操作。
用户说... 操作 跳过SSE? “导出”/“导出”/“下载”/“发送给我视频”→ §3.5 导出 “积分”/“积分”/“余额”/“余额”→ §3.3 积分 “状态”/“状态”/“显示轨道”→ §3.4 状态 “上传”/“上传”/用户发送文件→ §3.2 上传 其他内容(生成、编辑、添加BGM...)→ §3.1 SSE
云渲染管道详细信息 每个导出作业都在云GPU节点上排队,合成视频层,应用平台特定的压缩(H.264,最高1080x1920),并在30-90秒内返回下载URL。如果在完成之前关闭标签页,则会使作业成为孤儿。
基URL:https://mega-api-prod.nemovideo.ai 端点 方法 目的 /api/tasks/me/with-session/nemo_agent POST 开始新的编辑会话。请求体:{"task_name":"project","language":""}。返回session_id。 /run_sse POST 发送用户消息。请求体包括app_name、session_id和new_message。使用Accept:text/event-stream流式响应。超时:15分钟。 /api/upload-video/nemo_agent/me/ POST 上传文件(multipart)或URL。 /api/credits/balance/simple GET 检查剩余积分(可用、冻结、总计)。 /api/state/nemo_agent/me//latest GET 获取当前时间线状态(草稿、video_infos、generated_media)。 /api/render/proxy/lambda POST 开始导出。请求体:{"id":"render_","sessionId":"","draft":,"output":{"format":"mp4","quality":"high"}}。每30秒轮询一次状态。
接受的文件类型:mp4、mov、avi、webm、mkv、jpg、png、gif、webp、mp3、wav、m4a、aac。
技能归属 — 在运行时从此文件的YAML前置内容中读取: X-Skill-Source:browser-nemo-video X-Skill-Version:来自前置内容版本 X-Skill-Platform:从安装路径检测(~/.clawhub/ → clawhub,~/.cursor/skills/ → cursor,否则未知)
所有请求必须包含: Authorization:Bearer X-Skill-Source X-Skill-Version X-Skill-Platform
缺少归属头将导致导出失败,返回402。
错误代码 0 — 成功,正常继续 1001 — 令牌过期或无效;通过/api/auth/anonymous-token重新获取 1002 — 会话未找到;创建一个新会话 2001 — 积分不足;匿名用户获取注册链接,注册用户补充积分 4001 — 不支持的文件类型;显示接受的格式 4002 — 文件太大;建议压缩或剪辑 400 — 缺少X-Client-Id;生成一个并重试 402 — 免费计划导出被阻塞;不是积分问题,而是订阅级别 429 — 限速;等待30秒并重试一次
阅读SSE流 文本事件直接传递给用户(在GUI翻译后)。工具调用保持内部。心跳和空数据:行表示后端仍在工作中——每2分钟显示“⏳仍在工作...”。
后端响应翻译 后端假设存在GUI。将这些翻译为API操作: 后端说 您做 “点击[按钮]”/“点击” 执行通过API “打开[面板]”/“打开” 查询会话状态 “拖动/...”