Gemini Skill — 问答与图片生成

Name: Gemini Skill — 问答与图片生成
Rating: 1 (1 reviews)
Author: WJZ-P

WJZ-P

Gemini Skill — 问答与图片生成

v0.1.0

通过 Gemini 官网执行问答和图片生成。支持文本 Q&A 和图片生成，使用最强可用模型（默认 Gemini 3.1 Pro）。

1· 509·1 当前·1 累计

by @wjz-p (WJZ-P)·MIT-0

代码生成 AI模型访问

下载技能包

License

MIT-0

最后更新

2026/3/13

安全扫描

VirusTotal

无害

查看报告

OpenClaw

安全

high confidence

该技能的请求和指令与其声明的目的相符（自动化 Gemini 网页 UI 用于 Q&A 和图片生成）；仅包含一个小的页面注入辅助脚本，无不相关的凭据或安装要求。

评估建议

该技能内部一致，似乎仅执行使用 OpenClaw 浏览器配置文件的 Gemini UI 网页自动化。安装前，请确保理解：（1）它将使用指定的浏览器配置文件和该配置文件中的任何 Gemini 登录（cookie/账户），（2）可能下载图片到本地存储以返回给您，（3）自动化 UI 脚本与页面 DOM 选择器交互，如果网站更改可能会中断。如果您更喜欢额外的隔离，请使用辅助 Gemini 账户测试或确认 'openclaw' 配置文件仅限非敏感会话。如果您需要技能访问其他服务或凭据，请在授予之前要求理由。...

详细分析 ▾

✓ 用途与能力

名称和描述与实际行为匹配：打开 Gemini 网页 UI，选择模型，发送提示，并下载/返回生成的图片。没有不相关的云凭据、二进制文件或外部服务被请求。

✓ 指令范围

SKILL.md 将操作限制在通过内置浏览器配置文件的 Gemini 网站（检查登录、选择模型、输入文本、切换图片生成、下载结果）。它指示下载图片到本地磁盘以返回给用户，这与其目的一致，并且是暗示的主要文件 I/O。

✓ 安装机制

没有安装规格；该技能仅为指令加上一个小的页面注入辅助脚本（DOM 选择器、点击/填充实用程序）。没有外部下载或包安装被请求。

✓ 凭证需求

该技能不请求环境变量、凭据或配置路径。其使用 'openclaw' 浏览器配置文件的要求与自动化已登录的网页会话成比例（它依赖于该配置文件中存在的浏览器 cookie/身份验证）。

✓ 持久化与权限

使用 always:false 和默认调用模型。该技能不请求永久的平台级存在，也不修改其他技能或系统范围的设置。

安全有层次，运行前请审查代码。

License

MIT-0

可自由使用、修改和再分发，无需署名。

查看条款 ↗

运行时依赖

无特殊依赖

版本

latestv0.1.02026/3/13

Gemini Skill 初始发布，支持核心网页基于的 Gemini Q&A 和图片生成。- 支持通过 Gemini 网站使用最强可用模型（默认：Gemini 3.1 Pro）进行文本 Q&A 和图片生成。- 检测触发关键词以路由任务：为“问问Gemini”（文本 Q&A）和“生图/画图/nano banana”（图片生成）提供单独的流程。- 提供图片生成期间的用户反馈并相应地返回输出图片或答案。- 包括用于元素检测、模型可用性和超时处理的强固回退逻辑。- 通过快捷脚本和流线化 UI 操作优化低令牌消耗。

● 无害

安装命令点击复制

官方npx clawhub@latest install gemini-skill

镜像加速npx clawhub@latest install gemini-skill --registry https://cn.clawhub-mirror.com

技能文档

核心规则

使用 OpenClaw 内置浏览器，profile="openclaw"。
涉及生图关键词时，优先用无头浏览器流程执行。
文本问答任务走 Gemini 文本提问链路。
默认模型：可用列表中最强模型，优先 Gemini 3.1 Pro。
执行生图后先向用户回报“正在绘图中”，完成后回传图片。

任务分流

文本问答触发词：问问Gemini、让Gemini回答、去Gemini问。
生图任务触发词：生图、画、绘图、海报、nano banana、nanobanana、image generation。
若请求含糊，先确认：是文本回答还是要出图。

标准执行流程

A. 文本问答

打开 https://gemini.google.com。
校验登录态（头像/输入框可见）。
选择最强可用模型（优先 Gemini 3.1 Pro）。
将用户问题原样输入并发送。
等待完整输出，提炼后回传（必要时附原文要点）。

B. 生图流程

打开 Gemini 页面并确认登录。
选择最强可用模型（优先 Gemini 3.1 Pro）。
将用户提示词原样输入。
开启/勾选图片生成能力（若 UI 有“生成图片/图片”开关）。
发送后立即通知用户：正在绘图中。
结果出现后：

- 优先用“下载原图”按钮获取原图。 - 若无下载按钮或失败，可对图片右键另存（通常是标清图）。

把图片返回用户；若有多张，按顺序全部回传。

失败回退

元素定位失败：刷新页面后重试一次。
模型不可用：降级到次优 Gemini 模型并告知。
生成超时：回报“仍在生成中”，继续等待一次；再次超时则请用户换短提示词。

低 token 优先策略

优先使用 scripts/gemini_ui_shortcuts.js 的快捷选择器。
先 evaluate 批量动作，再 snapshot 精准兜底。
避免高频全量快照。

参考

详细执行与回退：references/gemini-flow.md
关键词与路由：references/intent-routing.md

数据来源：ClawHub ↗ · 中文优化：龙虾技能库

OpenClaw 技能定制 / 插件定制 / 私有工作流定制

免费技能或插件可能存在安全风险，如需更匹配、更安全的方案，建议联系付费定制

了解定制服务

License

运行时依赖

版本

安装命令 点击复制

技能文档

核心规则

任务分流

标准执行流程

A. 文本问答

B. 生图流程

失败回退

低 token 优先策略

参考

核心规则

任务分流

标准执行流程

A. 文本问答

B. 生图流程

失败回退

低 token 优先策略

参考

安装命令点击复制