媒体生成(Media Gen)
v1.0.0使用AIsa生成图像和视频。支持四种图像模型(Google Gemini 3 Pro Image,Alibaba Wan 2.7 image + image-pro,ByteDance Seedream)和四种...
0· 0·0 当前·0 累计
下载技能包
License
MIT
运行时依赖
无特殊依赖
安装命令
点击复制官方npx clawhub@latest install media-gen-aisa-api
镜像加速npx clawhub@latest install media-gen-aisa-api --registry https://cn.longxiaskill.com 镜像可用
本土化适配说明
媒体生成(Media Gen) 安装说明: 安装命令:["openclaw skills install media-gen-aisa-api"]
技能文档
Media Gen 使用单个 AIsa API 密钥生成图像和视频。该技能涵盖了 AIsa 媒体生成路由,跨三个图像端点和一个异步视频端点。 scripts/media_gen_client.py 中的客户端代码会根据每个支持的模型选择正确的请求形状,包括 Wan 视频变体之间的模式差异。
使用场景:
- 您想要一个中立的技能用于 AIsa 图像和视频生成
- 您需要在 Gemini 图像、Wan 图像、Seedream 和 Wan 视频模型之间切换,而无需重写请求
- 您想要一个简单的 CLI 用于创建图像、提交异步视频作业、轮询任务状态和下载完成的视频输出
兼容性:
- 与任何 agentskills.io 兼容的Harness一起工作,包括:
- 需要 Python 3、POSIX shell 和来自 aisa.one 的 AISA_API_KEY
您可以做什么:
- 图像 — Gemini(内联 base64)"生成一个赛博朋克风格的城市夜景,霓虹灯,雨夜,电影感"
- 图像 — Wan 2.7(聊天响应中的 URL)"生成一个超详细的产品拍摄图像,红熊猫,工作室灯光,锐利焦点"
- 图像 — Seedream(OpenAI 兼容,大格式)"生成一个 2048×2048 的杂志封面:新黑色侦探肖像,电影颗粒"
- 视频 — 文本到视频(Wan t2v)"生成一个霓虹赛博朋克天际线的全景镜头,5 秒"
- 视频 — 图像到视频(Wan i2v)"从这个参考图像开始,轻柔的摄像机推入,视差"
支持的模型:
- 图像生成 — 4 个模型,3 个端点
- 视频生成 — 4 个 Wan 变体,1 个端点
重要:wan2.7-i2v 期望在 input.media 中作为数组的参考图像 URL,而不是像 wan2.6-i2v 中的 input.img_url。客户端代码会自动处理这个差异。
快速开始:
- export AISA_API_KEY="您的密钥"
- 任意图像模型 — 客户端会路由到正确的端点
- 视频 — 文本到视频
- 视频 — 图像到视频(Wan i2v)
- 等待并下载
图像生成 — 端点参考:
- Gemini 家族 → POST /v1/models/{model}:generateContent
- Wan 2.7 家族 → POST /v1/chat/completions
- Seedream → POST /v1/images/generations