📦 Pika Ai Video — Pika AI 视频

v1.0.0

用此技能将文本或图像生成 AI 视频片段,支持 MP4、PNG、JPG、WebM 文件,最大 200MB。适合 TikTok 创作者、营销人员、内容……

0· 18·0 当前·0 累计
0

运行时依赖

无特殊依赖

安装命令

点击复制
官方npx clawhub@latest install pika-ai-video
镜像加速npx clawhub@latest install pika-ai-video --registry https://cn.longxiaskill.com

技能文档

入门 有文字或图片?发给我并告诉我需求——我来搞定 AI 视频生成。 试试说: “把一张城市街景照片生成 1080p MP4” “把这张图做成 5 秒电影感短片” “为 TikTok 创作者、营销人员用图文生成短视频”

自动初始化 首次交互时,先连接处理 API,显示“正在初始化…”。 Token:若环境变量 NEMO_TOKEN 已存在,直接使用,跳到 Session。 免费 token:生成 UUID 作为客户端 ID,POST 至 https://mega-api-prod.nemovideo.ai/api/auth/anonymous-token,Header 带 X-Client-Id: ,取响应 data.token 作为 NEMO_TOKEN(100 积分,7 天有效期)。 Session:POST 至 https://mega-api-prod.nemovideo.ai/api/tasks/me/with-session/nemo_agent,Bearer 鉴权,body 为 {"task_name":"project"},保存返回的 session_id。 向用户确认已连接就绪,不打印 token 或原始 JSON。

Pika AI Video — 用图片生成视频 在聊天框丢文字或图片并说明需求,我调用云端 GPU 完成 AI 视频生成,本地无需安装。 典型流程:发一张城市街景,要求“做成 5 秒电影感短片”,30-90 秒后得到 1080p MP4 下载链接。 提示越短、动作描述越清晰,效果越稳定。

指令映射 用户提及 pika ai video、画幅、文字层、音轨等关键词,通过意图分类路由到对应动作: 用户说… → 动作 “export/导出/download/发我视频” → §3.5 导出 ✅ “credits/积分/balance/余额” → §3.3 积分 ✅ “status/状态/show tracks” → §3.4 状态 ✅ “upload/上传/发文件” → §3.2 上传 ✅ 其余(生成、编辑、加 BGM…)→ §3.1 SSE ❌

云端渲染流程 导出任务在云端 GPU 节点排队,合成视频层,按平台规格压缩(H.264,最大 1080×1920),30-90 秒内返回下载链接。 session token 携带渲染任务 ID,提前关闭页面会导致任务孤儿。 所有请求指向 https://mega-api-prod.nemovideo.ai。

主要端点 Session — POST /api/tasks/me/with-session/nemo_agent Chat (SSE) — POST /run_sse Upload — POST /api/upload-video/nemo_agent/me/ Credits — GET /api/credits/balance/simple State — GET /api/state/nemo_agent/me//latest Export — POST /api/render/proxy/lambda

格式:mp4、mov、avi、webm、mkv、jpg、png、gif、webp、mp3、wav、m4a、aac。 Header 来自 YAML frontmatter:X-Skill-Source=pika-ai-video,X-Skill-Version 取自 version 字段,X-Skill-Platform 按安装路径识别。 每次调用需 Authorization: Bearer 及上述三 header,缺失返回 402。

Draft 字段映射 t=tracks,tt=track 类型(0=视频,1=音频,7=文字),sg=segments,d=时长(ms),m=metadata。 时间轴示例:

  • 视频:城市延时(0-10s)
  • BGM:Lo-fi(0-10s,35%)
  • 标题:“Urban Dreams”(0-3s)

GUI 指令翻译 后端以可视化界面口吻返回,映射为 API 调用: “click/点击” → 调用对应端点 “open/打开” → 查询 session 状态 “drag/drop/拖拽” → 通过 SSE 发送编辑命令 “preview in timeline” → 文字摘要当前轨道 “Export/导出” → 执行导出流程

SSE 流处理 文本事件直接展示;工具调用内部处理。 心跳或空 data: 行表示仍在运行,每 2 分钟显示“⏳ 仍在处理…”。 约 30% 编辑操作无返回文本,此时轮询 /api/state 确认时间轴变化并告知用户。

错误码 0 — 成功 1001 — token 失效,重新获取 1002 — session 不存在,新建 2001 — 积分不足,匿名用户获注册链接 4001 — 不支持

数据来源ClawHub ↗ · 中文优化:龙虾技能库