📦 Openclaw Media Gen — Openclaw 媒体生成器
v1.0.0使用AIsa生成图像和视频。四种图像模型(Google Gemini 3 Pro Image,Alibaba Wan 2.7 image + image-pro,ByteDance Seedream)和四种Wan视频...
运行时依赖
安装命令
点击复制技能文档
Media Gen 🎬 使用单个 AIsa API 密钥生成图像和视频。完全支持 AIsa 通过其 Unified LLM Gateway 路由的每个图像和视频模型,跨三个不同的端点路径。兼容性:与任何 agentskills.io 兼容的Harness一起工作,包括:Claude Code 和 Claude (Anthropic) OpenAI Codex Cursor Gemini CLI (Google) OpenCode、Goose、OpenClaw、Hermes 和任何其他实现 Agent Skills 规范的Harness。需要 Python 3、POSIX shell 和 AISA_API_KEY(在 aisa.one 获取)。 🔥 您可以做什么 图像 — Gemini (base64 内联) "生成一个赛博朋克风格的城市夜景,霓虹灯,雨夜,电影感" 图像 — Wan 2.7 (URL 在聊天响应中) "生成一个超详细的产品拍摄图像,红熊猫,工作室照明,清晰焦点" 图像 — Seedream (OpenAI 兼容,large 格式) "生成一个 2048×2048 的杂志封面:新黑色侦探肖像,电影颗粒" 视频 — 文本到视频 (Wan t2v) "生成一个霓虹赛博朋克天际线在日落时的扫描镜头,5 秒" 视频 — 图像到视频 (Wan i2v) "从这个参考图像开始,轻柔的相机推入和视差" 支持的模型 图像生成 — 4 个模型,3 个端点 模型 开发者 端点 备注 gemini-3-pro-image-preview Google POST /v1/models/{model}:generateContent 图像以 base64 格式返回在 candidates[].parts[].inline_data 中 wan2.7-image Alibaba POST /v1/chat/completions 图像以 URL 格式返回在 choices[].message.content[] 中(类型为 image)。$0.030/图像 wan2.7-image-pro Alibaba POST /v1/chat/completions 更高的保真度。$0.075/图像 seedream-4-5-251128 ByteDance POST /v1/images/generations OpenAI 兼容。最小 3,686,400 像素(例如 1920×1920)。$0.040/图像 视频生成 — 4 个 Wan 变体,1 个端点 模型 类型 图像字段 输出 SR wan2.6-t2v 文本到视频 无 1080 wan2.6-i2v 图像到视频 input.img_url (字符串) 720 wan2.7-t2v 文本到视频 无 720 wan2.7-i2v 图像到视频 input.media (数组) ⚠ 720 ⚠ Schema 陷阱在 wan2.7-i2v 上。它在 input.media(URL 数组)中获取参考图像,而不是 input.img_url,如 wan2.6-i2v。没有媒体的提交将返回 HTTP 200 和 task_id,然后在下游失败,InvalidParameter:字段必需:input.media。捆绑的客户端自动路由 — 只需传递 --img-url 并选择模型。 快速开始 export AISA_API_KEY="您的密钥" # 任何图像模型 — 客户端路由到正确的端点 python3 scripts/media_gen_client.py image \ --model gemini-3-pro-image-preview \ --prompt "一个可爱的红熊猫,电影照明" \ --out out.png python3 scripts/media_gen_client.py image \ --model wan2.7-image-pro \ --prompt "超详细的产品拍摄图像,红熊猫" \ --out out.png python3 scripts/media_gen_client.py image \ --model seedream-4-5-251128 \ --prompt "新黑色侦探肖像,电影颗粒" \ --size 2048x2048 \ --out out.png # 视频 — 文本到视频(无需图像) python3 scripts/media_gen_client.py video-create \ --model wan2.7-t2v \ --prompt "扫描霓虹赛博朋克天际线" # 视频 — 图像到视频在 wan2.7-i2v 上(客户端路由到 input.media[]) python3 scripts/media_gen_client.py video-create \ --model wan2.7-i2v \ --prompt "轻柔的相机推入和视差" \ --img-url "https://example.com/reference.jpg" \ --duration 5 # 等待和下载 python3 scripts/media_gen_client.py video-wait \ --task-id --download --out out.mp4 🖼️ 图像生成 — 端点参考 Gemini 家族 → POST /v1/models/{model}:generateContent 文档:Google Gemini Chat。 curl -X POST "https://api.aisa.one/v1/models/gemini-3-pro-image-preview:generateContent" \ -H "Authorization: Bearer $AISA_API_KEY" \ -H "Content-Type: application/json" \ -d '{ "contents":[ {"role":"user","parts":[{"text":"一个可爱的红熊猫,电影照明"}]} ] }' 响应包含 candidates[].parts[].inline_data 中的 {mime_type, data},其中 data 是 base64 PNG。 Wan 2.7 家族 → POST /v1/chat/completions 文档:图像生成通过聊天。关键规则:messages[].content 必须是类型化部分的数组。普通字符串返回 HTTP 400 invalid_parameter_error。 curl -X POST "https://api.aisa.one/v1/chat/completions" \ -H "Authorization: Bearer $AISA_API_KEY" \ -H "Content-Type: application/json" \ -d '{ "model": "wan2.7-image", "messages": [ {"role":"user","content":[ {"type":"text","text":"一个可爱的红熊猫,超详细,电影照明"} ]} ], "n": 1 }' 图像以 {type: "image", image: ""} 部分返回在 choices[].message.content[] 中。 Seedream → POST /v1/images/generations 文档:OpenAI 兼容图像生成。 curl -X POST "https://api.aisa.one/v1/images/generations" \ -H "Authorization: Bearer $AISA_API_KEY" \ -H "Content-Type: application/json" \ -d '{ "model": "seedream-4-5-251128", "prompt": "一个可爱的红熊猫,超详细,电影照明", "n": 1, "size": "2048x2048" }'