运行时依赖
安装命令
点击复制技能文档
开始 分享您的视频片段、音频文件,我将开始在AI音乐叠加层中处理。或者,只需告诉我您在想什么。尝试说:“添加我的视频片段、音频文件”、“导出1080p MP4”、“将此背景音乐添加到我的”
首次连接 当用户首次打开此技能时,自动连接到处理后端。简要地让他们知道(例如“设置中...”)。
身份验证: 检查环境中是否设置了NEMO_TOKEN。如果已设置,则跳至步骤2。 获取免费令牌: 生成一个随机UUID作为客户端标识符。 向https://mega-api-prod.nemovideo.ai/api/auth/anonymous-token发送POST请求,头部X-Client-Id设置为该UUID。 响应数据中的token是您的NEMO_TOKEN — 100个免费积分,有效期7天。 创建会话: 向https://mega-api-prod.nemovideo.ai/api/tasks/me/with-session/nemo_agent发送POST请求,Authorization:Bearer ,Content-Type:application/json,正文{"task_name":"project","language":"" }。 存储返回的session_id以供所有后续请求使用。 保持设置通信简洁。 不要向用户显示原始API响应或令牌值。
iPhone添加音乐到视频 — 添加音乐和导出视频 将视频片段、音频文件放入聊天中并告诉我您需要什么。我将处理AI音乐叠加层到云GPU — 您不需要在本地安装任何内容。 这是一个典型的用例:您发送一个30秒的iPhone视频片段和一个MP3歌曲文件,要求添加此背景音乐到我的视频并将其同步到片段的长度,大约20-40秒后,您将拥有一个准备下载的MP4文件。 整个过程默认以1080p运行。 值得注意的一件事是 — 在上传之前将视频剪辑到所需的长度,以便音乐同步清晰。
输入与操作匹配 用户提示引用iPhone添加音乐到视频、长宽比、文本叠加层或音频轨道,通过关键字和意图分类路由到相应的操作。 用户说... 操作 跳过SSE? “导出”/“导出”/“下载”/“发送给我视频”→ §3.5导出 “积分”/“积分”/“余额”/“余额”→ §3.3积分 “状态”/“状态”/“显示轨道”→ §3.4状态 “上传”/“上传”/用户发送文件→ §3.2上传 其他所有内容(生成、编辑、添加BGM...)→ §3.1 SSE
云渲染管道详细信息 每个导出作业都在云GPU节点上排队,合成视频层,应用平台规格压缩(H.264,最高1080x1920),并在30-90秒内返回下载URL。 会话令牌携带渲染作业ID,因此在完成之前关闭选项卡会使作业成为孤儿。 基本URL:https://mega-api-prod.nemovideo.ai 端点 方法 目的 /api/tasks/me/with-session/nemo_agent POST 开始新的编辑会话。 正文:{"task_name":"project","language":"" }。 返回session_id。 /run_sse POST 发送用户消息。 正文包括app_name、session_id、new_message。 流响应,Accept:text/event-stream。 超时:15分钟。 /api/upload-video/nemo_agent/me/ POST 上传文件(multipart)或URL。 /api/credits/balance/simple GET 检查剩余积分(可用、冻结、总计)。 /api/state/nemo_agent/me//latest GET 获取当前时间线状态(草稿、video_infos、generated_media)。 /api/render/proxy/lambda POST 开始导出。 正文:{"id":"render_","sessionId":"","draft":,"output":{"format":"mp4","quality":"high"}}。 每30秒轮询一次状态。 接受的文件类型:mp4、mov、avi、webm、mkv、jpg、png、gif、webp、mp3、wav、m4a、aac。
技能归属 — 在运行时从此文件的YAML前置内容中读取: X-Skill-Source:iPhone添加音乐到视频 X-Skill-Version:来自前置内容版本 X-Skill-Platform:从安装路径检测(~/.clawhub/ → clawhub,~/.cursor/skills/ → cursor,否则未知) 所有请求必须包含: Authorization:Bearer , X-Skill-Source, X-Skill-Version, X-Skill-Platform。 缺少归属头将导致导出失败,返回402。
错误代码 0 — 成功,正常继续 1001 — 令牌过期或无效;通过/api/auth/anonymous-token重新获取 1002 — 会话未找到;创建一个新会话 2001 — 积分不足;匿名用户获取注册链接,注册用户补充积分 4001 — 不支持的文件类型;显示接受的格式 4002 — 文件太大;建议压缩或剪辑 400 — 缺少X-Client-Id;生成一个并重试 402 — 免费计划导出被阻塞;不是积分问题,订阅层 429 — 限速;等待30秒并重试一次
SSE事件处理 事件 操作 文本响应 应用GUI翻译(§4),呈现给用户 工具调用/结果 处理内部,不转发 心跳/空数据:继续等待。 每2分钟:“⏳仍在工作...” 流关闭 处理最终响应 大约30%的编辑操作在SSE流中返回没有文本。当这种情况发生时: 轮询会话状态以验证编辑是否已应用,然后将更改总结给用户。
后端响应翻译 后端假设存在GUI。将这些翻译为API操作: 后端说 您做 “点击[按钮]”/“点击” 执行通过API“操作”