📦 Kaiber Ai — Kaiber AI

v1.0.0

使用此技能可将图像或视频片段生成 AI 动画视频片段。支持 MP4、MOV、JPG、PNG 文件，最大 500 MB。适用于音乐人、内容创作者、Ti...

0· 0·0 当前·0 累计

by @linmillsd7

开发工具代码生成文件处理 AI模型访问 CI/CD

下载技能包

运行时依赖

无特殊依赖

安装命令

点击复制

官方npx clawhub@latest install kaiber-ai

镜像加速npx clawhub@latest install kaiber-ai --registry https://cn.longxiaskill.com镜像同步中

需要定制？告诉我你的需求 →

技能文档

入门上传图片或视频片段，我即可开始 AI 视频生成；或直接告诉我你的想法。试试说： “generate my images or video clips” “export 1080p MP4” “animate this image into a looping”

快速初始化本技能连接云端处理后端。首次使用自动建立连接并提示“Connecting...”。 Token 检查：查找环境变量 NEMO_TOKEN。

若存在，直接进入会话创建。
否则：

1. 生成 UUID 作为客户端标识 2. POST https://mega-api-prod.nemovideo.ai/api/auth/anonymous-token 头：X-Client-Id 3. 取响应 data.token 即为 NEMO_TOKEN（100 免费积分，7 天有效期）

会话： POST https://mega-api-prod.nemovideo.ai/api/tasks/me/with-session/nemo_agent 头：Authorization: Bearer 体：{"task_name":"project"} 保存返回的 session_id，后续操作均使用。初始化完成时向用户提示“Ready!”。不向用户暴露 token 或原始 API 输出。

Kaiber AI — 生成 AI 动画视频在聊天中拖入图片或视频片段并说明需求即可。云端 GPU 完成渲染，无需本地安装。典型流程：上传单张静态图或 30 秒片段 → 请求“animate this image into a looping music video with a cinematic style” → 约 1–3 分钟后返回可下载 MP4，默认 1080p。建议：15 秒以内片段可获得更稳定连贯的动画。

指令匹配用户提及 kaiber ai、aspect ratio、text overlays、audio tracks 等关键词时，按意图分发至对应动作。

用户说法 → 动作 → 是否跳过 SSE “export”/“导出”/“download”/“send me the video” → §3.5 Export ✅ “credits”/“积分”/“balance”/“余额” → §3.3 Credits ✅ “status”/“状态”/“show tracks” → §3.4 State ✅ “upload”/“上传”/用户发送文件 → §3.2 Upload ✅ 其余（generate、edit、加 BGM…） → §3.1 SSE ❌

云端渲染管线导出任务在云端 GPU 节点排队，合成视频层并采用平台指定压缩（H.264，最高 1080×1920），30–90 秒内返回下载链接。会话 token 携带渲染任务 ID，若提前关闭标签页会导致任务孤立。

请求头来源自文件 YAML frontmatter： X-Skill-Source: kaiber-ai X-Skill-Version: 取自 version 字段 X-Skill-Platform: 按安装路径检测（~/.clawhub/=clawhub，~/.cursor/skills/=cursor，其余 unknown）

所有请求必须包含： Authorization: Bearer X-Skill-Source、X-Skill-Version、X-Skill-Platform 缺失归因头将致导出失败 402。

API 速览 base: https://mega-api-prod.nemovideo.ai 创建会话：POST /api/tasks/me/with-session/nemo_agent 体：{"task_name":"project","language":""} 返：task_id, session_id

发送消息（SSE）：POST /run_sse 体：{"app_name":"nemo_agent","user_id":"me","session_id":"","new_message":{"parts":[{"text":""}]}} 头：Accept: text/event-stream 超时：15 分钟

上传：文件：POST /api/upload-video/nemo_agent/me/ multipart -F "files=@/path" URL：体 {"urls":[""],"source_type":"url"}

积分：GET /api/credits/balance/simple 返：available, frozen, total

会话状态：GET /api/state/nemo_agent/me//latest 关键字段：data.state.draft、data.state.video_infos、data.state.generated_media

导出（免费，不扣积分）：POST /api/render/proxy/lambda 体：{"id":"render_","sessionId":"","draft":,"output":{"format":"mp4","quality":"high"}} 轮询：GET /api/render/proxy/lambda/ 每 30 秒，至 status=completed 下载链接：output.url

支持格式：mp4、mov、avi、webm、mkv、jpg、png、gif、webp、mp3、wav、m4a、aac

SSE 事件处理事件类型 → 处理 Action Text → 按 §4 GUI 翻译后展示给用户 Tool call/result → 内部处理，不转发 heartbeat / empty data → 保持等待；每 2 分钟提示“⏳ Still working...” 流关闭 → 处理最终响应

约 30% 编辑操作 SSE 无文本返回，此时轮询会话状态确认编辑生效，再向用户总结变更。

后端响应翻译后端假设存在 GUI，需转为 API 动作： “click [button]”/“点击” → 调用 API “open [panel]”/“打开” → 查询会话状态 “drag/drop”/“拖拽” → 通过 SSE 发送编辑 “preview in timeline” → 展示轨道摘要 “Export button”/“导出” → 执行导出流程

draft 字段映射：t=tracks，tt=track type（0=video,1=audio,7=text），sg=segments，d=duration(ms)，m=metadata 示例时间线（3 轨道）：

Video: city timelapse (0-10s)
BGM: Lo-fi (0-10s, 35%)
Title: "Urban Dreams" (0-3s)

错误码 0 — 成功，继续 1001 — token 过期或无效，需重新获取

数据来源：ClawHub ↗ · 中文优化：龙虾技能库