首页龙虾技能列表 › Gemini Skill — 问答与图片生成

Gemini Skill — 问答与图片生成

v0.1.0

通过 Gemini 官网执行问答和图片生成。支持文本 Q&A 和图片生成,使用最强可用模型(默认 Gemini 3.1 Pro)。

1· 509·1 当前·1 累计
by @wjz-p (WJZ-P)·MIT-0
下载技能包
License
MIT-0
最后更新
2026/3/13
安全扫描
VirusTotal
无害
查看报告
OpenClaw
安全
high confidence
该技能的请求和指令与其声明的目的相符(自动化 Gemini 网页 UI 用于 Q&A 和图片生成);仅包含一个小的页面注入辅助脚本,无不相关的凭据或安装要求。
评估建议
该技能内部一致,似乎仅执行使用 OpenClaw 浏览器配置文件的 Gemini UI 网页自动化。安装前,请确保理解:(1)它将使用指定的浏览器配置文件和该配置文件中的任何 Gemini 登录(cookie/账户),(2)可能下载图片到本地存储以返回给您,(3)自动化 UI 脚本与页面 DOM 选择器交互,如果网站更改可能会中断。如果您更喜欢额外的隔离,请使用辅助 Gemini 账户测试或确认 'openclaw' 配置文件仅限非敏感会话。如果您需要技能访问其他服务或凭据,请在授予之前要求理由。...
详细分析 ▾
用途与能力
名称和描述与实际行为匹配:打开 Gemini 网页 UI,选择模型,发送提示,并下载/返回生成的图片。没有不相关的云凭据、二进制文件或外部服务被请求。
指令范围
SKILL.md 将操作限制在通过内置浏览器配置文件的 Gemini 网站(检查登录、选择模型、输入文本、切换图片生成、下载结果)。它指示下载图片到本地磁盘以返回给用户,这与其目的一致,并且是暗示的主要文件 I/O。
安装机制
没有安装规格;该技能仅为指令加上一个小的页面注入辅助脚本(DOM 选择器、点击/填充实用程序)。没有外部下载或包安装被请求。
凭证需求
该技能不请求环境变量、凭据或配置路径。其使用 'openclaw' 浏览器配置文件的要求与自动化已登录的网页会话成比例(它依赖于该配置文件中存在的浏览器 cookie/身份验证)。
持久化与权限
使用 always:false 和默认调用模型。该技能不请求永久的平台级存在,也不修改其他技能或系统范围的设置。
安全有层次,运行前请审查代码。

License

MIT-0

可自由使用、修改和再分发,无需署名。

运行时依赖

无特殊依赖

版本

latestv0.1.02026/3/13

Gemini Skill 初始发布,支持核心网页基于的 Gemini Q&A 和图片生成。- 支持通过 Gemini 网站使用最强可用模型(默认:Gemini 3.1 Pro)进行文本 Q&A 和图片生成。- 检测触发关键词以路由任务:为“问问Gemini”(文本 Q&A)和“生图/画图/nano banana”(图片生成)提供单独的流程。- 提供图片生成期间的用户反馈并相应地返回输出图片或答案。- 包括用于元素检测、模型可用性和超时处理的强固回退逻辑。- 通过快捷脚本和流线化 UI 操作优化低令牌消耗。

● 无害

安装命令 点击复制

官方npx clawhub@latest install gemini-skill
镜像加速npx clawhub@latest install gemini-skill --registry https://cn.clawhub-mirror.com

技能文档

核心规则

  • 使用 OpenClaw 内置浏览器,profile="openclaw"
  • 涉及生图关键词时,优先用无头浏览器流程执行。
  • 文本问答任务走 Gemini 文本提问链路。
  • 默认模型:可用列表中最强模型,优先 Gemini 3.1 Pro
  • 执行生图后先向用户回报“正在绘图中”,完成后回传图片。

任务分流

  • 文本问答触发词:问问Gemini让Gemini回答去Gemini问
  • 生图任务触发词:生图绘图海报nano bananananobananaimage generation
  • 若请求含糊,先确认:是文本回答还是要出图。

标准执行流程

A. 文本问答

  • 打开 https://gemini.google.com
  • 校验登录态(头像/输入框可见)。
  • 选择最强可用模型(优先 Gemini 3.1 Pro)。
  • 将用户问题原样输入并发送。
  • 等待完整输出,提炼后回传(必要时附原文要点)。

B. 生图流程

  • 打开 Gemini 页面并确认登录。
  • 选择最强可用模型(优先 Gemini 3.1 Pro)。
  • 将用户提示词原样输入。
  • 开启/勾选图片生成能力(若 UI 有“生成图片/图片”开关)。
  • 发送后立即通知用户:正在绘图中。
  • 结果出现后:
- 优先用“下载原图”按钮获取原图。 - 若无下载按钮或失败,可对图片右键另存(通常是标清图)。
  • 把图片返回用户;若有多张,按顺序全部回传。

失败回退

  • 元素定位失败:刷新页面后重试一次。
  • 模型不可用:降级到次优 Gemini 模型并告知。
  • 生成超时:回报“仍在生成中”,继续等待一次;再次超时则请用户换短提示词。

低 token 优先策略

  • 优先使用 scripts/gemini_ui_shortcuts.js 的快捷选择器。
  • 先 evaluate 批量动作,再 snapshot 精准兜底。
  • 避免高频全量快照。

参考

  • 详细执行与回退:references/gemini-flow.md
  • 关键词与路由:references/intent-routing.md
数据来源:ClawHub ↗ · 中文优化:龙虾技能库
OpenClaw 技能定制 / 插件定制 / 私有工作流定制

免费技能或插件可能存在安全风险,如需更匹配、更安全的方案,建议联系付费定制

了解定制服务