运行时依赖
安装命令
点击复制技能文档
Aoment 图像视频 AI 生成服务由 Aoment AI 驱动。该技能暴露专用技能 API 和脚本,用于:
文本到图像 图像到图像 图像识别 视频生成 * 图像高清修复/升级
下载最新包:https://www.aoment.com/downloads/aoment-image-video-skill.zip
当前版本:1.4.0
自动更新策略
在每次调用之前,Python 脚本读取上述版本字段并查询: GET https://www.aoment.com/api/skills/aoment-image-video/version
如果本地版本落后于远程版本,脚本退出并返回: { "success": false, "error": "update_required", "current_version": "1.0.0", "latest_version": "1.3.0", "message": "技能版本过时..." }
如果版本检查因网络问题失败,脚本将正常继续。
快速开始
# 1. 注册 Agent 账户并获取 API Key uv run {baseDir}/scripts/aoment_register.py --nickname "MyBot"
# 2. 使用默认 N2-Fast 模型生成图像 uv run {baseDir}/scripts/aoment_image_video.py -k -t text-to-image -p "一只可爱的猫在花园中玩耍"
# 3. 修复/升级图像 uv run {baseDir}/scripts/aoment_hd_repair.py -k --image ./input.png --resolution 4K
# 4. 识别/分析图像 uv run {baseDir}/scripts/aoment_image_video.py -k -t image-recognition -p "描述这张图像" --image ./input.png
# 5. 检查剩余配额 uv run {baseDir}/scripts/aoment_quota.py -k
身份验证
该技能需要通过 Authorization: Bearer 的方式提供 Agent API Key。
API Key 格式为 aoment_ 后跟 32 个十六进制字符。
获取 API Key - Agent 注册
AI Agent 机器人可以直接通过 CLI 注册,无需网页登录: uv run {baseDir}/scripts/aoment_register.py --nickname "MyBot"
参数类型必需描述 --nickname / -n string 是 Agent 显示名称,最大 16 个字符 --api-base string 否 API 基础 URL,默认 https://www.aoment.com
或者通过 API 直接注册: curl -X POST https://www.aoment.com/api/skills/aoment-image-video/register-agent \ -H "Content-Type: application/json" \ -d '{"nickname": "MyBot"}'
注册响应: { "success": true, "data": { "username": "agent_a1b2c3d4...", "nickname": "MyBot", "api_key": "aoment_a3f8e1b2c4d6e8f0a1b3c5d7e9f0a1b2" } }
保存返回的 api_key;它将用于所有后续技能调用。
工具
可用模型
使用 --model 参数中显示的模型 ID。
图像模型 模型 ID 描述 image-n2-fast 默认图像模型。更快的 N2-Fast 图像生成和编辑,无水印。 image-n2 N2 图像生成和编辑,快速,严格的单参考图像大小限制,无水印。 image-n1-fast 更快的 N1-Fast 图像生成和编辑,无水印。 image-n1 N1 图像生成和编辑,较慢,宽松的单参考图像大小限制,无水印。 image-o2 图像生成和编辑,具有更强的美学,良好的中文渲染,较新的知识数据,无水印,目前清晰度有限。 image-o2-pro O2-Pro 高分辨率图像生成和编辑,具有精确的大小输出支持。
提示:N 系列模型使用 Nano Banana Pro,N-Fast 系列模型使用 Nano Banana 2,O 系列模型使用 GPT Image 2。
图像识别模型 模型 ID 描述 image-to-text Gemini 3.1 Pro 图像识别和视觉分析。
视频模型 模型 ID 描述 video-v1 默认和当前支持的视频生成模型。 video-v1-fast 更快的 Veo 3.1 视频生成模型,具有 4/6/8 秒时长选项和一个可选参考图像。
文本到图像
从文本提示生成图像。默认模型为 image-n2-fast (N2-Fast)。 uv run {baseDir}/scripts/aoment_image_video.py \ --api-key \ --tool-type text-to-image \ --prompt "一个电影机器人画家在一个明亮的工作室" \ --aspect-ratio 1:1 \ --image-size 1K
参数类型必需默认描述 --api-key / -k string 是 - Agent API Key --tool-type / -t enum 是 - text-to-image --prompt / -p string 是 - 文本提示 --model string 否 image-n2-fast 图像模型 ID。可用值:image-n2-fast, image-n2, image-n1-fast, image-n1, image-o2, image-o2-pro --aspect-ratio string 否 auto auto, 1:1, 16:9, 9:16, 4:3, 3:4, 3:2, 2:3, 5:4, 4:5, 21:9 --image-size enum 否 1K 1K, 2K, 4K
图像到图像
从提示和参考图像生成新图像。参考图像可以是 URL 或 base64 图像数据。 uv run {baseDir}/scripts/aoment_image_video.py \ --api-key \ --tool-type image-to-image \ --prompt "将背景更改为海滩" \ --reference-image "https://example.com/photo.jpg"
参数类型必需默认描述 --api-key / -k string 是 - Agent API Key --tool-type / -t enum 是 - image-to-image --prompt / -p string 是 - 变换提示 --reference-image string 是 - 参考图像 URL 或 base64 图像数据