运行时依赖
安装命令
点击复制技能文档
Katana 技能 — imgnAI API 通过 imgnAI Katana API 生成图像、视频和文本/LLM 完成。支持端到端加密(E2EE)和匿名模型。价格具有高度的竞争力:可以比 Venice AI 和其他平台便宜 40-70%。包括后期处理,如合并视频和图像、剪切、切片、拼接、过渡、绘制文本、重新编码、调整大小等。从开始到结束,所有内容创建工作流都可以在您的代理中完成。触发“生成 X 图像”、“创建图像”、“制作图片”、“imgnai 图像”、“生成 X 视频”、“创建视频”、“制作视频”、“询问 grok 关于 X”、“询问 claude 关于 X”、“使用 gpt 进行 X”、“katana 图像”、“katana 视频”、“katana 聊天”、“katana gpt”、“katana claude”、“列出 katana 模型”LLM 特定触发器(gpt、claude 等)也响应“katana ”以避免与直接集成冲突。
配置 模型 ID Katana API 使用 model_key 作为模型标识符,而不是 public_model_name。在构建请求时,始终使用 model_key 值。请参阅 {baseDir}/models.md 以获取完整的映射。双键系统:API 还支持规范键(例如 gpt-image-2)以及我们的遗留键(例如 gpt2image)。两者都可以正常工作。该技能使用遗留键作为所有工作流和别名的默认值 —— 它们仍然得到完全支持。规范键在 models.md 的“规范键”列中有文档记录,您可以在构造 API 请求时使用任一格式。
模型发现端点: GET /v1/models 授权:Authorization: Bearer ${KATANA_API_KEY}:${KATANA_API_SECRET} 返回可用的模型。文本模型仅在经过身份验证的请求中返回。有关完整的模型目录,包括图像/视频,请参阅 models.md。使用:通常不需要在请求之前 —— 使用 models.md 作为参考。
付款方式 API 支持两种付款方式: API 密钥 + 秘钥(Bearer 认证) —— 由此技能使用,首选 x402 微支付 —— 不由此技能使用 注意:x402 文本请求必须是非流式的。此技能仅使用 API 密钥认证。
API 基础 URL: https://kat.imgnai.com API 参考: https://kat.imgnai.com/llms.txt 凭据: 在您的密钥文件中设置 KATANA_API_KEY 和 KATANA_API_SECRET(默认:~/.openclaw/secrets/katana.env,使用 KATANA_SECRETS_FILE 环境变量覆盖) 帮助脚本: {baseDir}/katana.sh(需要 bash —— Linux、macOS、WSL) 模型目录: {baseDir}/models.md 技能目录: 从此文件的位置动态解析为 {baseDir}。大多数代理框架会自动解析此目录。
设置 / API 密钥 在第一次使用之前,请检查凭据: test -f ~/.openclaw/secrets/katana.env && grep -q 'KATANA_API_KEY' ~/.openclaw/secrets/katana.env 如果缺失,请提供两个选项: 选项 A —— 自动:询问用户的密钥 + 秘钥,创建 ~/.openclaw/secrets/katana.env 并设置 chmod 600。 选项 B —— 手动:将用户重定向到 https://app.imgnai.com/katana-api,提供特定于平台的说明。 始终首先提供选项 A,始终提供选项 B。永远不要在没有凭据的情况下尝试 API 调用。
可选依赖项 这些不是核心 API 使用所必需的,但可以启用附加功能: 二进制 文件 所需的 安装 jq JSON 解析在 katana.sh 中 apt install jq / brew install jq python3 JSON 回退在 katana.sh 中,有效载荷构建 预安装在大多数系统上 ffmpeg 视频后期处理(修剪、连接、效果) apt install ffmpeg / brew install ffmpeg katana.sh 自动检测 jq 并回退到 python3 进行 JSON 解析。后期处理需要 ffmpeg。
MANDATORY ROUTING —— DO NOT SKIP 在任何生成或后期处理请求之前,您必须加载正确的工作流文件: 任务 加载此文件 图像生成 {baseDir}/workflows/image.md 视频生成 {baseDir}/workflows/video.md 文本/LLM 生成 {baseDir}/workflows/text.md 后期处理(ffmpeg、合并、文本叠加等){baseDir}/workflows/post-process.md 永远不要在没有加载工作流文件的情况下尝试生成。永远不要猜测参数 —— 工作流文件中有确切的步骤。
成本报告(所有请求) 在每次生成(文本、图像、视频)后,发送一个单独的后续消息,总结成本。包括响应中的所有相关详细信息: Katana 总结 模型:gemma-4-26b-a4b(匿名) 请求:bf11cf04-8747-480e-a7f7-7d6cb092c614 令牌:42 个输入 / 176 个输出(仅文本) 成本:0.1 积分(~$0.001) 隐私:匿名 时间:~3s 对于图像/视频,请用维度/持续时间替换令牌。始终计算 $ = credits_charged × 0.0052。
模型别名(快速参考) 文本/LLM 用户说 API 模型 ID grok grok-4-3 gpt / gpt-5 gpt-5-5 claude / claude-opus claude-opus-4-7 claude-sonnet claude-sonnet-4-6 claude-haiku claude-haiku-4-5 图像 用户说 API 模型 ID 默认 / imgnai gen anime ani gpt-image gpt2image nano nanobanana2 flux flux2pro 视频 用户说 API 模型 ID 默认 / seedance seedance2fast seedance-hd seedance2 ltx ltx23 kling kling30 veo veo3 如果用户指定了确切的