📦 Kaiber Ai — Kaiber AI
v1.0.0使用此技能可将图像或视频片段生成 AI 动画视频片段。支持 MP4、MOV、JPG、PNG 文件,最大 500 MB。适用于音乐人、内容创作者、Ti...
运行时依赖
安装命令
点击复制技能文档
入门 上传图片或视频片段,我即可开始 AI 视频生成;或直接告诉我你的想法。 试试说: “generate my images or video clips” “export 1080p MP4” “animate this image into a looping”
快速初始化 本技能连接云端处理后端。首次使用自动建立连接并提示“Connecting...”。 Token 检查:查找环境变量 NEMO_TOKEN。
- 若存在,直接进入会话创建。
- 否则:
会话: POST https://mega-api-prod.nemovideo.ai/api/tasks/me/with-session/nemo_agent 头:Authorization: Bearer 体:{"task_name":"project"} 保存返回的 session_id,后续操作均使用。 初始化完成时向用户提示“Ready!”。 不向用户暴露 token 或原始 API 输出。
Kaiber AI — 生成 AI 动画视频 在聊天中拖入图片或视频片段并说明需求即可。 云端 GPU 完成渲染,无需本地安装。 典型流程:上传单张静态图或 30 秒片段 → 请求“animate this image into a looping music video with a cinematic style” → 约 1–3 分钟后返回可下载 MP4,默认 1080p。 建议:15 秒以内片段可获得更稳定连贯的动画。
指令匹配 用户提及 kaiber ai、aspect ratio、text overlays、audio tracks 等关键词时,按意图分发至对应动作。
用户说法 → 动作 → 是否跳过 SSE “export”/“导出”/“download”/“send me the video” → §3.5 Export ✅ “credits”/“积分”/“balance”/“余额” → §3.3 Credits ✅ “status”/“状态”/“show tracks” → §3.4 State ✅ “upload”/“上传”/用户发送文件 → §3.2 Upload ✅ 其余(generate、edit、加 BGM…) → §3.1 SSE ❌
云端渲染管线 导出任务在云端 GPU 节点排队,合成视频层并采用平台指定压缩(H.264,最高 1080×1920),30–90 秒内返回下载链接。 会话 token 携带渲染任务 ID,若提前关闭标签页会导致任务孤立。
请求头 来源自文件 YAML frontmatter: X-Skill-Source: kaiber-ai X-Skill-Version: 取自 version 字段 X-Skill-Platform: 按安装路径检测(~/.clawhub/=clawhub,~/.cursor/skills/=cursor,其余 unknown)
所有请求必须包含: Authorization: Bearer X-Skill-Source、X-Skill-Version、X-Skill-Platform 缺失归因头将致导出失败 402。
API 速览 base: https://mega-api-prod.nemovideo.ai 创建会话:POST /api/tasks/me/with-session/nemo_agent 体:{"task_name":"project","language":""} 返:task_id, session_id
发送消息(SSE):POST /run_sse 体:{"app_name":"nemo_agent","user_id":"me","session_id":"","new_message":{"parts":[{"text":""}]}} 头:Accept: text/event-stream 超时:15 分钟
上传: 文件:POST /api/upload-video/nemo_agent/me/ multipart -F "files=@/path" URL:体 {"urls":[""],"source_type":"url"}
积分:GET /api/credits/balance/simple 返:available, frozen, total
会话状态:GET /api/state/nemo_agent/me//latest 关键字段:data.state.draft、data.state.video_infos、data.state.generated_media
导出(免费,不扣积分):POST /api/render/proxy/lambda 体:{"id":"render_","sessionId":"","draft":,"output":{"format":"mp4","quality":"high"}} 轮询:GET /api/render/proxy/lambda/ 每 30 秒,至 status=completed 下载链接:output.url
支持格式:mp4、mov、avi、webm、mkv、jpg、png、gif、webp、mp3、wav、m4a、aac
SSE 事件处理 事件类型 → 处理 Action Text → 按 §4 GUI 翻译后展示给用户 Tool call/result → 内部处理,不转发 heartbeat / empty data → 保持等待;每 2 分钟提示“⏳ Still working...” 流关闭 → 处理最终响应
约 30% 编辑操作 SSE 无文本返回,此时轮询会话状态确认编辑生效,再向用户总结变更。
后端响应翻译 后端假设存在 GUI,需转为 API 动作: “click [button]”/“点击” → 调用 API “open [panel]”/“打开” → 查询会话状态 “drag/drop”/“拖拽” → 通过 SSE 发送编辑 “preview in timeline” → 展示轨道摘要 “Export button”/“导出” → 执行导出流程
draft 字段映射:t=tracks,tt=track type(0=video,1=audio,7=text),sg=segments,d=duration(ms),m=metadata 示例时间线(3 轨道):
- Video: city timelapse (0-10s)
- BGM: Lo-fi (0-10s, 35%)
- Title: "Urban Dreams" (0-3s)
错误码 0 — 成功,继续 1001 — token 过期或无效,需重新获取