Inshot 编辑器
v1.0.0只需输入您需要的内容,就可以将 60 秒的智能手机片段转换为 1080p 编辑视频片段。无论是为社交媒体编辑短视频,添加剪切、音乐...
详细分析 ▾
运行时依赖
安装命令
点击复制技能文档
开始 分享您的视频片段,我将开始使用AI视频编辑。或者,只需告诉我您的想法。尝试说:“编辑我的视频片段”、“导出1080p MP4”、“修剪视频,添加音乐,和” 连接 在处理任何用户请求之前,建立与后端API的连接。显示简短的状态,如“连接中...”。如果NEMO_TOKEN在环境中,直接使用它并创建一个会话。否则,获取一个免费的启动令牌: 生成一个UUID作为客户端标识符 向https://mega-api-prod.nemovideo.ai/api/auth/anonymous-token发送POST请求,包含X-Client-Id头 响应包含一个有效期为7天的100个免费积分的令牌 —— 使用它作为NEMO_TOKEN 然后,通过向https://mega-api-prod.nemovideo.ai/api/tasks/me/with-session/nemo_agent发送POST请求,包含Bearer授权和正文{"task_name":"project","language":"en"},创建一个会话。 响应中的session_id对于所有后续请求都是必需的。 告诉用户您已经准备好。 保持技术细节在聊天之外。 编辑器 InShot —— 编辑和导出社交视频 该工具接受您的视频片段,并通过云渲染管道运行AI视频编辑。您上传,描述您想要的内容,并下载结果。 假设您有一个60秒的智能手机片段,并且想要修剪视频,添加音乐,并在片段之间应用过渡效果 —— 后端在大约30-60秒内处理它,并提供一个1080p MP4文件。 提示:垂直9:16视频适合Reels和TikTok导出。 匹配输入到操作 用户提示引用编辑器InShot、长宽比、文本叠加或音频轨道,通过关键字和意图分类路由到相应的操作。 用户说... 操作 跳过SSE? “导出”/“导出”/“下载”/“发送给我视频”→ §3.5导出 “积分”/“积分”/“余额”/“余额”→ §3.3积分 “状态”/“状态”/“显示轨道”→ §3.4状态 “上传”/“上传”/用户发送文件→ §3.2上传 其他所有内容(生成、编辑、添加BGM...)→ §3.1 SSE 云渲染管道详细信息 每个导出作业在云GPU节点上排队,合成视频层,应用平台特定压缩(H.264,最高1080x1920),并在30-90秒内返回下载URL。 会话令牌携带渲染作业ID,因此在完成之前关闭选项卡会使作业孤立。 所有调用都发送到https://mega-api-prod.nemovideo.ai。 主要端点: 会话 —— 向/api/tasks/me/with-session/nemo_agent发送POST请求,包含{"task_name":"project","language":""}}。提供session_id。 聊天(SSE)—— 向/run_sse发送POST请求,包含session_id和您的消息在new_message.parts[0].text中。设置Accept:text/event-stream。最长15分钟。 上传 —— 向/api/upload-video/nemo_agent/me/发送POST请求 —— 多部分文件或包含URL的JSON。 积分 —— 向/api/credits/balance/simple发送GET请求 —— 返回可用、冻结、总积分。 状态 —— 向/api/state/nemo_agent/me//latest发送GET请求 —— 当前草稿和媒体信息。 导出 —— 向/api/render/proxy/lambda发送POST请求,包含渲染ID和草稿JSON。 每30秒轮询GET /api/render/proxy/lambda/以获取完成状态和下载URL。 格式:mp4、mov、avi、webm、mkv、jpg、png、gif、webp、mp3、wav、m4a、aac。 技能归属 —— 在运行时从此文件的YAML前置内容中读取: X-Skill-Source:editor-inshot X-Skill-Version:从前置内容版本中 X-Skill-Platform:从安装路径中检测(~/.clawhub/ —— clawhub,~/.cursor/skills/ —— cursor,否则未知) 所有请求必须包含: Authorization:Bearer , X-Skill-Source, X-Skill-Version, X-Skill-Platform。 缺少归属头将导致导出失败,返回402。 草稿字段映射: t=轨道, tt=轨道类型(0=视频,1=音频,7=文本), sg=段, d=持续时间(ms), m=元数据。 时间线(3个轨道):
- 视频:城市延时(0-10秒)
- BGM:Lo-fi(0-10秒,35%)
- 标题:“城市梦想”(0-3秒)