🎬 Kling — 可灵
v1.0.0AI VideoSkip 跳过专业剪辑软件的学习曲线。只需描述你的需求——比如“将这张图片制作成 5 秒电影级短片”——即可获得 AI 生成的视频。
详细分析 ▾
运行时依赖
版本
- Kling AI Video 技能首次发布。 - 支持通过文本提示或上传图片/视频生成 AI 视频。 - 支持主流格式(JPG、PNG、MP4、MOV),单文件最大 200MB。 - 云端简化流程:上传 → 描述动画 → 几分钟内获得可下载 1080p MP4。 - 内置视频编辑(画幅、文字层、音轨),可用自然语言指令操作。 - 自动完成认证、会话创建与错误处理,体验流畅。
安装命令
点击复制技能文档
快速开始
发送文字提示或图片,我立即开始AI视频生成。或直接告诉我你的想法。试试说:
- “生成我的文字提示或图片”
- “导出1080p MP4”
- “把这张图变成5秒动画”
连接后端
处理用户请求前,先连接后端API,显示“连接中…”。 若环境变量存在NEMO_TOKEN,直接用它创建会话;否则获取免费试用token:
- 生成UUID作为客户端ID
- POST到
https://mega-api-prod.nemovideo.ai/api/auth/anonymous-token,带X-Client-Id头 - 返回含100积分、7天有效的
token——用作NEMO_TOKEN
随后创建会话:POST到https://mega-api-prod.nemovideo.ai/api/tasks/me/with-session/nemo_agent,Bearer授权,body为{"task_name":"project","language":"en"}。响应中的session_id后续请求均需使用。
告知用户已就绪,聊天中隐藏技术细节。
# Kling AI Video — 用图片或文字生成视频 把文字提示或图片发给我,并描述想要的效果。AI视频生成在远程GPU节点运行——本地无需安装。 示例:上传一张山景照片,输入“把这张图变成5秒电影级短片”,约1-3分钟返回1080p MP4。所有渲染在服务器完成。 提示:简短、动作清晰的描述结果更稳定。
输入与动作映射
用户提及kling ai video、画面比例、文字层、音轨等,按关键词与意图路由到对应动作。| 用户说法 | 动作 | 跳过SSE? | |-------------|--------|----------| | “export”/“导出”/“download”/“把视频发我” | → §3.5 导出 | ✅ | | “credits”/“积分”/“balance”/“余额” | → §3.3 积分 | ✅ | | “status”/“状态”/“show tracks” | → §3.4 状态 | ✅ | | “upload”/“上传”/用户发送文件 | → §3.2 上传 | ✅ | | 其他(生成、编辑、加BGM…) | → §3.1 SSE | ❌ |
云端渲染流程
每次导出任务在云端GPU节点排队,合成视频层、按平台规格压缩(H.264,最高1080×1920),30-90秒内返回下载链接。会话token携带渲染任务ID,提前关闭标签页会导致任务孤立。所有请求发往https://mega-api-prod.nemovideo.ai。主要端点:
- 会话 —
POST /api/tasks/me/with-session/nemo_agent,body{"task_name":"project","language":""},返回session_id。 - 聊天(SSE) —
POST /run_sse,带session_id与new_message.parts[0].text,Accept: text/event-stream,最长15分钟。 - 上传 —
POST /api/upload-video/nemo_agent/me/,支持multipart文件或JSON外链。 - 积分 —
GET /api/credits/balance/simple,返回available、frozen、total。 - 状态 —
GET /api/state/nemo_agent/me//latest,获取当前草稿与媒体信息。 - 导出 —
POST /api/render/proxy/lambda,提交渲染ID与草稿JSON;轮询GET /api/render/proxy/lambda/每30秒,直到completed获得下载链接。
技能归因——运行时读取YAML头:
X-Skill-Source:kling-ai-videoX-Skill-Version: 取自头信息versionX-Skill-Platform: 按安装路径检测(~/.clawhub/→clawhub,~/.cursor/skills/→cursor,否则unknown)
所有请求须带Authorization: Bearer 及上述归因头,缺失将触发402。
草稿JSON短键:t轨道,tt轨道类型(0=视频,1=音频,7=文字),sg片段,d时长(毫秒),m元数据。
时间线示例:
``
Timeline (3 tracks):
Video: city timelapse (0-10s)- BGM: Lo-fi (0-10s, 35%)
- Title: "Urban Dreams" (0-3s)
GUI指令转API
后端以可视化界面口吻返回,映射如下:- “click”或“点击” → 通过API执行对应动作