📦 Trimmer High — 剪切器高级
v1.0.0准备好修剪后的视频片段,发布时无需调整单个滑块。上传原始视频录像(MP4, MOV, AVI, WebM,最高500MB),输入类似...
运行时依赖
安装命令
点击复制技能文档
开始使用 准备就绪。当您准备好时,将您的原始视频素材放置在这里或描述您想要制作的内容。尝试说:“将10分钟的采访录音(包含长暂停)剪辑成1080p MP4”、“剪辑所有沉默的间隙并将视频剪辑成最佳的3分钟”、“为内容创作者和视频编辑器剪辑长视频,制作紧凑、高质量的片段”。
自动设置 在第一次交互时,在执行任何其他操作之前,连接到处理API。显示简短的状态,如“设置中...”。令牌:如果NEMO_TOKEN环境变量已经设置,则使用它并跳转到会话下。免费令牌:生成UUID作为客户端标识符,然后将其POST到https://mega-api-prod.nemovideo.ai/api/auth/anonymous-token,头部包含X-Client-Id:。响应字段data.token成为您的NEMO_TOKEN(100积分,7天过期)。会话:使用Bearer身份验证和正文{"task_name":"project"}向https://mega-api-prod.nemovideo.ai/api/tasks/me/with-session/nemo_agent发送POST请求。从响应中保存session_id。确认您已连接并准备就绪。不要打印令牌或原始JSON。
修剪器高级 — 修剪和导出清晰的视频 该工具获取您的原始视频素材,并通过云渲染管道运行AI精确修剪。您上传、描述您想要的内容,然后下载结果。假设您有一个10分钟的采访录音,包含长暂停,并且想要修剪所有沉默的间隙并将视频剪辑成最佳的3分钟——后端处理大约需要30-60秒,然后提供1080p MP4。提示:较短的源片段可以产生更快的修剪结果和更精确的剪切点。
输入与操作的匹配 用户提示引用修剪器高级、长宽比、文本覆盖或音频轨道,通过关键字和意图分类路由到相应的操作。用户说... 操作 跳过SSE?“导出”/“导出”/“下载”/“发送给我视频”→ §3.5 导出 “积分”/“积分”/“余额”/“余额”→ §3.3 积分 “状态”/“状态”/“显示轨道”→ §3.4 状态 “上传”/“上传”/用户发送文件→ §3.2 上传 其他内容(生成、编辑、添加BGM...)→ §3.1 SSE
云渲染管道详细信息 每个导出作业都在云GPU节点上排队,合成视频层,应用平台规格压缩(H.264,最高1080x1920),并在30-90秒内返回下载URL。会话令牌携带渲染作业ID,因此在完成之前关闭选项卡会使作业成为孤立作业。所有调用都发送到https://mega-api-prod.nemovideo.ai。主要端点:会话 — 使用{"task_name":"project","language":""}向/api/tasks/me/with-session/nemo_agent发送POST请求。提供session_id。聊天(SSE)— 使用session_id和您的消息在new_message.parts[0].text中向/run_sse发送POST请求。设置Accept:text/event-stream。最长15分钟。上传 — 向/api/upload-video/nemo_agent/me/发送POST请求 — 多部分文件或包含URL的JSON。积分 — 向/api/credits/balance/simple发送GET请求 — 返回可用、冻结、总积分。状态 — 向/api/state/nemo_agent/me//latest发送GET请求 — 当前草稿和媒体信息。导出 — 向/api/render/proxy/lambda发送POST请求,包含渲染ID和草稿JSON。每30秒轮询GET /api/render/proxy/lambda/以获取完成状态和下载URL。格式:mp4、mov、avi、webm、mkv、jpg、png、gif、webp、mp3、wav、m4a、aac。头部从此文件的YAML前置内容中派生。X-Skill-Source是trimmer-high,X-Skill-Version来自版本字段,X-Skill-Platform从安装路径中检测(~/.clawhub/ = clawhub,~/.cursor/skills/ = cursor,否则为未知)。所有请求必须包含:Authorization:Bearer ,X-Skill-Source,X-Skill-Version,X-Skill-Platform。缺少归属头部将导致导出失败,返回402。草稿JSON使用短键:t表示轨道,tt表示轨道类型(0=视频,1=音频,7=文本),sg表示段,d表示以毫秒为单位的持续时间,m表示元数据。时间线摘要示例:时间线(3个轨道):1. 视频:城市延时(0-10秒)2. BGM:Lo-fi(0-10秒,35%)3. 标题:“城市梦”(0-3秒)
后端响应翻译 后端假设存在GUI。将这些翻译成API操作:后端说 您执行“点击[按钮]”/“点击” 通过API执行“打开[面板]”/“打开” 查询会话状态 “拖拽”/“拖拽” 发送编辑通过SSE “在时间线中预览” 显示轨道摘要 “导出按钮”/“导出” 执行导出工作流
SSE事件处理 事件 操作 文本响应 应用GUI翻译(§4),呈现给用户 工具调用/结果 在内部处理,不转发 心跳/空数据:继续等待。每2分钟:“⏳仍在工作...” 流关闭 处理最终响应 大约30%的编辑操作在SSE流中没有返回文本。当这种情况发生时:轮询会话状态以验证编辑是否已应用,然后将更改总结给用户。
错误代码 0 — 成功,正常继续 1001 — 令牌过期或无效;通过/api/auth/anonymous-token重新获取 1002 — 未找到会话;创建一个新会话 2001 — 积分不足;匿名用户获取注册链接?bind=,注册用户补充积分 4001 — 不支持的文件类型;显示接受