运行时依赖
安装命令
点击复制技能文档
开始 您有长视频需要处理吗?请发送给我并告诉我您需要什么——我将负责创建AI短视频。尝试说:“将10分钟的YouTube视频录制转换为1080p MP4”、“提取最吸引人的时刻并将其转换为垂直短片”、“为TikTok创作者从长录音中生成短片”
首次连接 当用户首次打开此技能时,自动连接到处理后端。简要地让他们知道(例如“设置中...”)。
身份验证: 检查环境中是否设置了NEMO_TOKEN。如果设置了,则跳转到步骤2。 获取免费令牌: 生成一个随机的UUID作为客户端标识符。 向https://mega-api-prod.nemovideo.ai/api/auth/anonymous-token发送POST请求,头部X-Client-Id设置为该UUID。 响应数据中的token是您的NEMO_TOKEN — 100个免费积分,有效期7天。 创建会话: 向https://mega-api-prod.nemovideo.ai/api/tasks/me/with-session/nemo_agent发送POST请求,头部Authorization:Bearer ,Content-Type:application/json,正文{"task_name":"project","language":"" }。 存储返回的session_id以供后续请求使用。 保持设置通信简洁。 不要向用户显示原始API响应或令牌值。
短视频生成器 —— 将长视频转换为短视频 将您的长视频发送给我并描述您想要的结果。 AI短视频创建在远程GPU节点上运行——无需在您的机器上安装任何内容。 一个快速示例: 上传10分钟的YouTube视频录制,输入“提取最吸引人的时刻并将其转换为垂直短片”,您将在大约1-2分钟内获得1080p MP4。 所有渲染都发生在服务器端。 值得注意的是,少于5分钟的视频片段处理速度更快,生成更集中的短视频。
输入与操作匹配 用户提示引用短视频生成器、长宽比、文本叠加或音频轨道,通过关键字和意图分类路由到相应的操作。 用户说... 操作 跳过SSE? “导出”/“导出”/“下载”/“发送给我视频”→ §3.5导出 “积分”/“积分”/“余额”/“余额”→ §3.3积分 “状态”/“状态”/“显示轨道”→ §3.4状态 “上传”/“上传”/用户发送文件→ §3.2上传 其他所有内容(生成、编辑、添加BGM...)→ §3.1 SSE
云渲染管道详细信息 每个导出作业都在云GPU节点上排队,合成视频层,应用平台规格压缩(H.264,最高1080x1920),并在30-90秒内返回下载URL。 会话令牌携带渲染作业ID,因此在完成之前关闭选项卡会使作业成为孤儿。 在每个请求中包含Authorization:Bearer 和所有归属头部——省略它们会在导出时触发402。 技能归属——从此文件的YAML前置内容中读取运行时: X-Skill-Source:shorts-generator X-Skill-Version:来自前置内容版本 X-Skill-Platform:从安装路径检测(~/.clawhub/ → clawhub,~/.cursor/skills/ → cursor,否则为未知) API基地址:https://mega-api-prod.nemovideo.ai 创建会话:POST /api/tasks/me/with-session/nemo_agent —— 正文{"task_name":"project","language":""} —— 返回task_id,session_id。 发送消息(SSE):POST /run_sse —— 正文{"app_name":"nemo_agent","user_id":"me","session_id":"","new_message":{"parts":[{"text":""}]}},Accept:text/event-stream。 最大超时:15分钟。 上传:POST /api/upload-video/nemo_agent/me/ —— 文件:multipart -F "files=@/path",或URL:{"urls":[""],"source_type":"url"}。 积分:GET /api/credits/balance/simple —— 返回可用、冻结、总计。 会话状态:GET /api/state/nemo_agent/me//latest —— 关键字段:data.state.draft,data.state.video_infos,data.state.generated_media。 导出(免费,无需积分):POST /api/render/proxy/lambda —— 正文{"id":"render_","sessionId":"","draft":,"output":{"format":"mp4","quality":"high"}}。 每30秒轮询GET /api/render/proxy/lambda/,直到状态=完成。 下载URL在输出.url中。 支持的格式:mp4、mov、avi、webm、mkv、jpg、png、gif、webp、mp3、wav、m4a、aac。
错误代码 0 —— 成功,正常继续 1001 —— 令牌过期或无效;通过/api/auth/anonymous-token重新获取 1002 —— 会话未找到;创建一个新会话 2001 —— 积分不足;匿名用户获取注册链接,注册用户补充积分 4001 —— 不支持的文件类型;显示接受的格式 4002 —— 文件太大;建议压缩或修剪 400 —— 缺少X-Client-Id;生成一个并重试 402 —— 免费计划导出被阻塞;不是积分问题,订阅级别 429 —— 限速;等待30秒并重试一次
后端响应翻译 后端假设存在GUI。将这些翻译为API操作: 后端说 您做 “点击[按钮]”/“点击” 执行通过API “打开[面板]”/“打开” 查询会话状态 “拖拽”/“拖拽” 发送编辑通过SSE “预览在时间线中” 显示轨道摘要 “导出按钮”/“导出” 执行导出工作流
SSE事件处理 事件 操作 文本响应 应用GUI翻译(§4),呈现