📦 Nano Banana Pro — 图像生成编辑

v1.0.1

使用 Nano Banana Pro 生成或编辑图像,支持文本到图像和图像到图像,提供 1K、2K 和 4K 分辨率选项。适用于图像创建、修改和编辑请求。

337· 8.6万·1687 当前·1733 累计
steipete 头像by @steipete (Peter Steinberger)·MIT-0
下载技能包
License
MIT-0
最后更新
2026/4/9
0
安全扫描
VirusTotal
可疑
查看报告
OpenClaw
可疑
medium confidence
该技能实现了图像生成工具,但注册元数据缺少必要项(API 密钥和 'uv' 运行器),存在小不一致,应在信任前解决。
评估建议
技能行为与描述匹配,但元数据缺少关键要求:1. 需要 Gemini API 密钥(GEMINI_API_KEY 或 --api-key),2. SKILL.md 指令使用 'uv' 运行器但未列为必需二进制文件。建议在安装前核实这些要求,检查脚本在沙盒环境,避免暴露高权限凭据,确保从官方源安装依赖(google-genai、pillow)。...
详细分析 ▾
用途与能力
脚本与描述一致,使用 Google GenAI 客户端生成/编辑图像,使用 Pillow 保存 PNG。但注册元数据未声明必需环境变量或二进制文件,而脚本和 SKILL.md 明确依赖 API 密钥和 'uv' 运行器,这一不一致应被纠正。
指令范围
SKILL.md 指令专注于图像生成/编辑,包括运行脚本、分辨率映射、文件名约定和预飞检查。指令和脚本不请求无关文件、凭据或向 GenAI 客户端以外的意外端点发送数据。明确指示将输出保存到用户的当前工作目录,这是此用例的预期行为。
安装机制
未提供安装规范(仅指令和包含的 Python 脚本)。脚本在注释中列出依赖项(google-genai、pillow),但没有自动安装步骤,这降低了安装风险,但意味着环境必须单独安装这些包。没有从未知 URL 下载。
凭证需求
脚本需要 API 密钥(GEMINI_API_KEY 或 --api-key),但技能元数据未声明任何必需环境变量或主凭据。SKILL.md 也预期 'uv' 二进制存在,但注册表未列出任何必需二进制文件。这些遗漏可能会误导用户关于所需的秘密/集成。
持久化与权限
技能不请求 always:true,也不修改其他技能或全局设置。它将生成的图像写入当前工作目录(预期行为),但除了正常文件写入之外,没有额外的持久性或提升的权限。
安全有层次,运行前请审查代码。

License

MIT-0

可自由使用、修改和再分发,无需署名。

运行时依赖

无特殊依赖

版本

latestv1.0.12026/1/5
可疑

安装命令

点击复制
官方npx clawhub@latest install nano-banana-pro
镜像加速npx clawhub@latest install nano-banana-pro --registry https://cn.longxiaskill.com

技能文档

使用 Google 的 Nano Banana Pro API(Gemini 3 Pro Image)生成新图像或编辑现有图像。

使用方法

使用绝对路径运行脚本(请勿先 cd 到 skill 目录):

生成新图像:

uv run ~/.codex/skills/nano-banana-pro/scripts/generate_image.py --prompt "your image description" --filename "output-name.png" [--resolution 1K|2K|4K] [--api-key KEY]

编辑现有图像:

uv run ~/.codex/skills/nano-banana-pro/scripts/generate_image.py --prompt "editing instructions" --filename "output-name.png" --input-image "path/to/input.png" [--resolution 1K|2K|4K] [--api-key KEY]

重要提示: 请始终从用户的当前工作目录运行,以便图像保存在用户所在位置,而不是 skill 目录中。

默认工作流程(草稿 → 迭代 → 最终)

目标:在 prompt 正确之前快速迭代,避免在 4K 上浪费时间。

  • 草稿(1K):快速反馈循环
- uv run ~/.codex/skills/nano-banana-pro/scripts/generate_image.py --prompt "" --filename "yyyy-mm-dd-hh-mm-ss-draft.png" --resolution 1K
  • 迭代:小幅调整 prompt;每次运行使用新的文件名
- 如果是编辑:保持相同的 --input-image 进行每次迭代,直到满意为止。
  • 最终(4K):仅在 prompt 确定后使用
- uv run ~/.codex/skills/nano-banana-pro/scripts/generate_image.py --prompt "" --filename "yyyy-mm-dd-hh-mm-ss-final.png" --resolution 4K

分辨率选项

Gemini 3 Pro Image API 支持三种分辨率(K 必须大写):

  • 1K(默认)- 约 1024px 分辨率
  • 2K - 约 2048px 分辨率
  • 4K - 约 4096px 分辨率

将用户请求映射到 API 参数:

  • 未提及分辨率 → 1K
  • "低分辨率"、"1080"、"1080p"、"1K" → 1K
  • "2K"、"2048"、"正常"、"中等分辨率" → 2K
  • "高分辨率"、"high-res"、"hi-res"、"4K"、"ultra" → 4K

API 密钥

脚本按以下顺序检查 API 密钥:

  • --api-key 参数(如果用户在聊天中提供了密钥,请使用此项)
  • GEMINI_API_KEY 环境变量

如果两者都不可用,脚本将退出并显示错误消息。

预检 + 常见失败(快速修复)

  • 预检:
- command -v uv(必须存在) - test -n "$GEMINI_API_KEY"(或传递 --api-key) - 如果是编辑:test -f "path/to/input.png"
  • 常见失败:
- Error: No API key provided. → 设置 GEMINI_API_KEY 或传递 --api-key - Error loading input image: → 路径错误 / 文件不可读;验证 --input-image 指向真实的图像 - "quota/permission/403" 类型的 API 错误 → 密钥错误、无访问权限或配额超出;尝试使用不同的密钥/账户

文件名生成

使用以下模式生成文件名:yyyy-mm-dd-hh-mm-ss-name.png

格式: {timestamp}-{descriptive-name}.png

  • 时间戳:当前日期/时间,格式为 yyyy-mm-dd-hh-mm-ss(24 小时制)
  • 名称:描述性小写文本,使用连字符
  • 保持描述部分简洁(通常 1-5 个词)
  • 使用用户 prompt 或对话中的上下文
  • 如果不明确,使用随机标识符(例如 x9k2a7b3

示例:

  • Prompt "A serene Japanese garden" → 2025-11-23-14-23-05-japanese-garden.png
  • Prompt "sunset over mountains" → 2025-11-23-15-30-12-sunset-mountains.png
  • Prompt "create an image of a robot" → 2025-11-23-16-45-33-robot.png
  • 上下文不明确 → 2025-11-23-17-12-48-x9k2.png

图像编辑

当用户想要修改现有图像时:

  • 检查他们是否提供了图像路径或引用了当前目录中的图像
  • 使用 --input-image 参数,传入图像的路径
  • Prompt 应包含编辑指令(例如 "让天空更戏剧化"、"移除人物"、"改为卡通风格")
  • 常见编辑任务:添加/删除元素、更改风格、调整颜色、模糊背景等

Prompt 处理

对于生成: 将用户的图像描述原样传递给 --prompt。只有在明显不足时才重新修改。

对于编辑: 将编辑指令传递给 --prompt(例如 "在天空中添加彩虹"、"让它看起来像水彩画")

在两种情况下都保留用户的创意意图。

Prompt 模板(高命中率)

当用户表达模糊或编辑必须精确时使用模板。

  • 生成模板:
- “Create an image of: . Style:
数据来源ClawHub ↗ · 中文优化:龙虾技能库