Tomoviee Video — Tomoviee 视频
v1.0.0只需输入您需要的内容,就可以将2分钟的原始手机录音转换为1080p的精致电影片段。不管是将原始镜头转换为可观看的短片...
运行时依赖
安装命令
点击复制技能文档
开始使用 准备就绪。当您准备好时,将原始视频片段放置在此处,或描述您要创建的内容。尝试说:“将2分钟的原始手机录音转换为1080p MP4”、“将我的片段转换为带有音乐和过渡效果的短电影”、“将原始素材转换为适合休闲创作者和社交媒体用户的可观看短电影”。
建立连接 在处理任何用户请求之前,建立与后端API的连接。显示简短的状态,如“连接中...”。如果环境中存在NEMO_TOKEN,则直接使用它并创建会话。否则,获取一个免费的启动令牌:生成一个UUID作为客户端标识符,向https://mega-api-prod.nemovideo.ai/api/auth/anonymous-token发送POST请求,包含X-Client-Id头部。响应包含一个有效期为7天的100个免费积分的令牌——将其用作NEMO_TOKEN。然后,通过向https://mega-api-prod.nemovideo.ai/api/tasks/me/with-session/nemo_agent发送POST请求,包含Bearer授权和{"task_name":"project","language":"en"}的正文,创建一个会话。响应中的session_id对于所有后续请求都是必需的。告诉用户您已经准备就绪。保持技术细节在聊天之外。
Tomoviee Video —— 将片段转换为短电影 该工具获取您的原始视频片段,并通过云渲染管道运行AI视频创建。您上传、描述您想要的内容,然后下载结果。假设您有一个2分钟的原始手机录音,并希望将我的片段转换为带有音乐和过渡效果的短电影——后端处理大约需要1-2分钟,然后提供一个1080p MP4。提示:短于60秒的片段处理速度明显更快。
匹配输入到操作 用户提示引用tomoviee video、aspect ratio、文本叠加或音频轨道,通过关键字和意图分类路由到相应的操作。用户说... 操作 跳过SSE? “导出”/“download”/“send me the video” → §3.5 导出 “credits”/“积分”/“balance”/“余额” → §3.3 积分 “status”/“状态”/“show tracks” → §3.4 状态 “upload”/“上传”/用户发送文件 → §3.2 上传 其他内容(generate、edit、add BGM...)→ §3.1 SSE
云渲染管道详细信息 每个导出作业在云GPU节点上排队,合成视频层,应用平台规范压缩(H.264,最高1080x1920),并在30-90秒内返回下载URL。会话令牌携带渲染作业ID,因此在完成之前关闭选项卡会使作业成为孤儿。基本URL:https://mega-api-prod.nemovideo.ai 端点 方法 目的 /api/tasks/me/with-session/nemo_agent POST 开始新的编辑会话。正文:{"task_name":"project","language":""》。返回session_id。 /run_sse POST 发送用户消息。正文包含app_name、session_id、new_message。流响应,接受:text/event-stream。超时:15分钟。 /api/upload-video/nemo_agent/me/ POST 上传文件(multipart)或URL。 /api/credits/balance/simple GET 检查剩余积分(可用、冻结、总计)。 /api/state/nemo_agent/me//latest GET 获取当前时间线状态(草稿、video_infos、generated_media)。 /api/render/proxy/lambda POST 开始导出。正文:{"id":"render_","sessionId":"","draft":,"output":{"format":"mp4","quality":"high"}}。每30秒轮询状态。接受的文件类型:mp4、mov、avi、webm、mkv、jpg、png、gif、webp、mp3、wav、m4a、aac。
三个归属头部在每个请求中都是必需的,并且必须与此文件的前置内容匹配: 头部 值 X-Skill-Source tomoviee-video X-Skill-Version 前置内容版本 X-Skill-Platform auto-detect:clawhub / cursor / unknown from install path
所有请求必须包含: Authorization:Bearer ,X-Skill-Source,X-Skill-Version,X-Skill-Platform。缺少归属头部将导致导出失败,返回402。
错误代码 0 —— 成功,正常继续 1001 —— 令牌过期或无效;通过/api/auth/anonymous-token重新获取 1002 —— 会话未找到;创建一个新会话 2001 —— 积分不足;匿名用户获取注册链接,注册用户补充积分 4001 —— 不支持的文件类型;显示接受的格式 4002 —— 文件太大;建议压缩或修剪 400 —— 缺少X-Client-Id;生成一个并重试 402 —— 免费计划导出被阻塞;不是积分问题,订阅层 429 —— 限速;等待30秒并重试一次
读取SSE流 文本事件直接传递给用户(在GUI翻译后)。工具调用保持内部。心跳和空数据:行意味着后端仍在工作——每2分钟显示“⏳ Still working...”。大约30%的编辑操作在没有任何文本的情况下关闭流。当这种情况发生时,轮询/api/state以确认时间线已更改,然后告诉用户什么已更新。
翻译GUI指令 后端响应就像有一个视觉界面一样。将其指令映射到API调用: “click”或“点击”→通过相关端点执行操作 “open”或“打开”→查询会话状态以获取数据 “drag/drop”或“拖拽”→通过SSE发送编辑命令 “preview in timeline”→显示文本摘要