Cartoon Video — 卡通视频
v1.0.0将一段30秒的真人对话视频转换成1080p卡通风格的视频,只需输入您需要的内容。无论是将真人视频转换成...
运行时依赖
安装命令
点击复制技能文档
开始使用 分享您的视频或图像,我将开始使用AI卡通风格化。或者,只需告诉我您在想什么。尝试说:“转换我的视频或图像”、“导出1080p MP4”、“将我的视频转换为动画”
快速启动设置 此技能连接到云处理后端。在首次使用时,自动设置连接并通知用户(“连接中...”)。令牌检查:查找环境中的NEMO_TOKEN。如果找到,跳转到会话创建。否则:生成UUID作为客户端标识符 POST https://mega-api-prod.nemovideo.ai/api/auth/anonymous-token,带有X-Client-Id头 从响应中提取数据。令牌 - 这是您的NEMO_TOKEN(100免费积分,7天过期) 会话:POST https://mega-api-prod.nemovideo.ai/api/tasks/me/with-session/nemo_agent,带有Bearer认证和正文{"task_name":"project"}。保留返回的session_id以进行所有操作。当设置完成时,通知用户“准备就绪!”。不要暴露令牌或原始API输出。
卡通视频 - 将视频转换为卡通风格 将您的视频或图像放入聊天中,并告诉我您需要什么。我将处理云GPU上的AI卡通风格化 - 您不需要在本地安装任何内容。典型的用法是:您发送一段30秒的真人视频,要求将其转换为带有粗体轮廓和平面颜色的卡通风格,并且大约1-2分钟后,您就可以下载MP4文件。整个过程默认以1080p运行。值得注意的是,短片(少于60秒)处理速度明显更快,卡通效果更一致。
匹配输入到操作 用户提示引用卡通视频、长宽比、文本叠加或音频轨道,通过关键字和意图分类路由到相应的操作。用户说... 操作 跳过SSE? “导出”/“导出”/“下载”/“发送给我视频”→ §3.5导出 “积分”/“积分”/“余额”/“余额”→ §3.3积分 “状态”/“状态”/“显示轨道”→ §3.4状态 “上传”/“上传”/用户发送文件→ §3.2上传 其他所有内容(生成、编辑、添加BGM...)→ §3.1 SSE
云渲染管道详细信息 每个导出作业都在云GPU节点上排队,合成视频层,应用平台特定压缩(H.264,最高1080x1920),并在30-90秒内返回下载URL。会话令牌携带渲染作业ID,因此在完成之前关闭选项卡会使作业成为孤儿。所有调用都转到https://mega-api-prod.nemovideo.ai。主要端点: 会话 - POST /api/tasks/me/with-session/nemo_agent,带有{"task_name":"project","language":""}}。给您一个session_id。 聊天(SSE)- POST /run_sse,带有session_id和您的消息new_message.parts[0].text。设置Accept:text/event-stream。最长15分钟。 上传 - POST /api/upload-video/nemo_agent/me/ - 多部分文件或带有URL的JSON。 积分 - GET /api/credits/balance/simple - 返回可用、冻结、总积分。 状态 - GET /api/state/nemo_agent/me//latest - 当前草稿和媒体信息。 导出 - POST /api/render/proxy/lambda,带有渲染ID和草稿JSON。每30秒轮询GET /api/render/proxy/lambda/以获取完成状态和下载URL。 格式:mp4、mov、avi、webm、mkv、jpg、png、gif、webp、mp3、wav、m4a、aac。
头部来自此文件的YAML前置内容。X-Skill-Source是cartoon-video,X-Skill-Version来自版本字段,X-Skill-Platform从安装路径检测(~/.clawhub/ = clawhub,~/.cursor/skills/ = cursor,否则为未知)。在每个请求中包含Authorization:Bearer 和所有归属头部 - 省略它们会在导出时触发402。草稿字段映射:t=轨道,tt=轨道类型(0=视频,1=音频,7=文本),sg=段,d=持续时间(毫秒),m=元数据。
时间线(3个轨道):
- 视频:城市延时(0-10秒)
- 背景音乐:Lo-fi(0-10秒,35%)
- 标题:“城市梦想”(0-3秒)
翻译GUI指令 后端响应就像有一个可视化界面。将其指令映射到API调用: “点击”或“点击”→通过相关端点执行操作 “打开”或“打开”→查询会话状态以获取数据 “拖拽”或“拖拽”→通过SSE发送编辑命令 “预览时间线”→显示当前轨道的文本摘要 “导出”或“导出”→运行导出工作流
SSE事件处理 事件 操作 文本响应 应用GUI翻译(§4),呈现给用户 工具调用/结果 处理内部,不转发 心跳/空数据:继续等待。每2分钟:“⏳仍在工作...” 流关闭 处理最终响应 大约30%的编辑操作在SSE流中返回无文本。当这种情况发生时: 轮询会话状态以验证编辑是否已应用,然后将更改总结给用户。
错误代码 0 - 成功,正常继续 1001 - 令牌过期或无效;通过/api/auth/anonymous-token重新获取 1002 - 未找到会话;创建一个新会话 2001 - 积分不足;匿名用户获取带有?bind=的注册链接,注册用户补充积分 4001 - 不支持的文件类型;显示接受的文件类型