Openclaw Media Gen — Openclaw 媒体生成器

v1.0.0

使用AIsa生成图像和视频。四种图像模型（Google Gemini 3 Pro Image，Alibaba Wan 2.7 image + image-pro，ByteDance Seedream）和四种Wan视频...

0· 0·0 当前·0 累计

by @baofeng-tech·MIT

AI模型访问

使用场景：使用Openclaw Media Gen — Openclaw 媒体生成器进行AI模型访问使用Openclaw Media Gen — Openclaw 媒体生成器

下载技能包

License

MIT

License

MIT

查看条款 ↗

运行时依赖

无特殊依赖

安装命令

点击复制

官方npx clawhub@latest install openclaw-media-gen-aisa

镜像加速npx clawhub@latest install openclaw-media-gen-aisa --registry https://cn.longxiaskill.com 镜像可用

本土化适配说明

Openclaw Media Gen — Openclaw 媒体生成器安装说明：安装命令：["openclaw skills install openclaw-media-gen-aisa"]

需要定制？告诉我你的需求 →

技能文档

Media Gen 🎬 使用单个 AIsa API 密钥生成图像和视频。完全支持 AIsa 通过其 Unified LLM Gateway 路由的每个图像和视频模型，跨三个不同的端点路径。兼容性：与任何 agentskills.io 兼容的Harness一起工作，包括：Claude Code 和 Claude (Anthropic) OpenAI Codex Cursor Gemini CLI (Google) OpenCode、Goose、OpenClaw、Hermes 和任何其他实现 Agent Skills 规范的Harness。需要 Python 3、POSIX shell 和 AISA_API_KEY（在 aisa.one 获取）。 🔥 您可以做什么图像 — Gemini (base64 内联) "生成一个赛博朋克风格的城市夜景，霓虹灯，雨夜，电影感" 图像 — Wan 2.7 (URL 在聊天响应中) "生成一个超详细的产品拍摄图像，红熊猫，工作室照明，清晰焦点" 图像 — Seedream (OpenAI 兼容，large 格式) "生成一个 2048×2048 的杂志封面：新黑色侦探肖像，电影颗粒" 视频 — 文本到视频 (Wan t2v) "生成一个霓虹赛博朋克天际线在日落时的扫描镜头，5 秒" 视频 — 图像到视频 (Wan i2v) "从这个参考图像开始，轻柔的相机推入和视差" 支持的模型图像生成 — 4 个模型，3 个端点模型开发者端点备注 gemini-3-pro-image-preview Google POST /v1/models/{model}:generateContent 图像以 base64 格式返回在 candidates[].parts[].inline_data 中 wan2.7-image Alibaba POST /v1/chat/completions 图像以 URL 格式返回在 choices[].message.content[] 中（类型为 image）。$0.030/图像 wan2.7-image-pro Alibaba POST /v1/chat/completions 更高的保真度。$0.075/图像 seedream-4-5-251128 ByteDance POST /v1/images/generations OpenAI 兼容。最小 3,686,400 像素（例如 1920×1920）。$0.040/图像视频生成 — 4 个 Wan 变体，1 个端点模型类型图像字段输出 SR wan2.6-t2v 文本到视频无 1080 wan2.6-i2v 图像到视频 input.img_url (字符串) 720 wan2.7-t2v 文本到视频无 720 wan2.7-i2v 图像到视频 input.media (数组) ⚠ 720 ⚠ Schema 陷阱在 wan2.7-i2v 上。它在 input.media（URL 数组）中获取参考图像，而不是 input.img_url，如 wan2.6-i2v。没有媒体的提交将返回 HTTP 200 和 task_id，然后在下游失败，InvalidParameter：字段必需：input.media。捆绑的客户端自动路由 — 只需传递 --img-url 并选择模型。快速开始 export AISA_API_KEY="您的密钥" # 任何图像模型 — 客户端路由到正确的端点 python3 scripts/media_gen_client.py image \ --model gemini-3-pro-image-preview \ --prompt "一个可爱的红熊猫，电影照明" \ --out out.png python3 scripts/media_gen_client.py image \ --model wan2.7-image-pro \ --prompt "超详细的产品拍摄图像，红熊猫" \ --out out.png python3 scripts/media_gen_client.py image \ --model seedream-4-5-251128 \ --prompt "新黑色侦探肖像，电影颗粒" \ --size 2048x2048 \ --out out.png # 视频 — 文本到视频（无需图像） python3 scripts/media_gen_client.py video-create \ --model wan2.7-t2v \ --prompt "扫描霓虹赛博朋克天际线" # 视频 — 图像到视频在 wan2.7-i2v 上（客户端路由到 input.media[]） python3 scripts/media_gen_client.py video-create \ --model wan2.7-i2v \ --prompt "轻柔的相机推入和视差" \ --img-url "https://example.com/reference.jpg" \ --duration 5 # 等待和下载 python3 scripts/media_gen_client.py video-wait \ --task-id --download --out out.mp4 🖼️ 图像生成 — 端点参考 Gemini 家族 → POST /v1/models/{model}:generateContent 文档：Google Gemini Chat。 curl -X POST "https://api.aisa.one/v1/models/gemini-3-pro-image-preview:generateContent" \ -H "Authorization: Bearer $AISA_API_KEY" \ -H "Content-Type: application/json" \ -d '{ "contents":[ {"role":"user","parts":[{"text":"一个可爱的红熊猫，电影照明"}]} ] }' 响应包含 candidates[].parts[].inline_data 中的 {mime_type, data}，其中 data 是 base64 PNG。 Wan 2.7 家族 → POST /v1/chat/completions 文档：图像生成通过聊天。关键规则：messages[].content 必须是类型化部分的数组。普通字符串返回 HTTP 400 invalid_parameter_error。 curl -X POST "https://api.aisa.one/v1/chat/completions" \ -H "Authorization: Bearer $AISA_API_KEY" \ -H "Content-Type: application/json" \ -d '{ "model": "wan2.7-image", "messages": [ {"role":"user","content":[ {"type":"text","text":"一个可爱的红熊猫，超详细，电影照明"} ]} ], "n": 1 }' 图像以 {type: "image", image: ""} 部分返回在 choices[].message.content[] 中。 Seedream → POST /v1/images/generations 文档：OpenAI 兼容图像生成。 curl -X POST "https://api.aisa.one/v1/images/generations" \ -H "Authorization: Bearer $AISA_API_KEY" \ -H "Content-Type: application/json" \ -d '{ "model": "seedream-4-5-251128", "prompt": "一个可爱的红熊猫，超详细，电影照明", "n": 1, "size": "2048x2048" }'

License

运行时依赖

安装命令

本土化适配说明

技能文档

相关技能推荐