📦 Local Web Search — 本地网页搜索

v4.2.0

为任意 OpenClaw commander 模型提供实时网页搜索。默认路径为免费/私有的本地 SearXNG + Scrapling/browser-worker 搜索,无需 API 密钥;可选…

0· 0·0 当前·0 累计
psanger 头像by @psanger (Patrick)
0

运行时依赖

无特殊依赖

安装命令

点击复制
官方npx clawhub@latest install local-web-search
镜像加速npx clawhub@latest install local-web-search --registry https://cn.longxiaskill.com

技能文档

本地网页搜索 v4.2 模型无关。兼容 Claude、GPT-4、Gemini、Mistral、Llama、DeepSeek 及任何配置为 OpenClaw commander 的模型。 当 agent 需要当前或实时网络信息时使用。 默认采用 Scrapling(反爬)+ SearXNG(自建搜索):零 API key、零费用、默认本地。 用户明确要求 Google/Gemini 支持搜索、引用 Google grounding 或本地引擎被屏蔽/不足时,可启用可选的 Gemini API Google Search grounding 助手。

兼容性 本 skill 面向任何能通过 OpenClaw 工具接口运行 shell 命令的 LLM 设计,不依赖模型专属 API、函数调用格式或专有特性。 三个工具均为标准 Python 脚本,通过 python3 调用——任何可执行 shell 的模型均可使用。

Commander 模型兼容 Claude (Anthropic) ✅ GPT-4 / GPT-4o (OpenAI) ✅ Gemini 1.5 / 2.0 (Google) ✅ Mistral / Mixtral ✅ Llama 3 / 3.1 (Meta) ✅ DeepSeek ✅ Qwen ✅ 任何具备 shell 工具访问的模型 ✅

外部端点 端点 | 传输数据 | 用途 ---|---|--- http://192.168.2.169:8081(本地) | 仅搜索查询字符串 | 本地 SearXNG 实例 <默认禁用>(仅回退) | 仅搜索查询字符串 | 本地 SearXNG 宕机时的公共回退 Gemini API,仅通过 run_gemini_search.sh / gemini_google_search.py | 仅搜索查询字符串;API key 在 auth header | 可选 Google Search grounding browse_page.py 访问的任何 URL | 仅 HTTP GET 请求 | 获取搜索结果页面内容 verify_claim.py 交叉验证的 URL | 仅 HTTP GET 请求 | 多源交叉验证

默认本地搜索不向第三方端点发送任何个人数据、凭据或对话历史。 Gemini 模式会将查询发送至 Google 的 Gemini API,可能产生配额/费用。

安全与隐私 • 常规查询默认走本地 SearXNG,无第三方追踪 • 公共回退默认禁用,仅当显式设置 LOCAL_SEARCH_FALLBACK_URL 才启用,仅接收原始查询字符串 • Gemini 模式为可选且需显式启用,仅发送原始查询,需 GEMINI_API_KEY、GOOGLE_API_KEY 或 1Password 查找 • browse_page.py 仅对显式传入的 URL 发起标准 HTTP GET,不提交任何数据 • Scrapling/browser-worker 在本地或配置的 sidecar 运行,除非启用 Gemini 模式,否则无云端 API 调用 • 禁止向 Gemini 发送对话历史或个人数据,仅传递搜索问题

信任声明: 本 skill 将搜索查询发送至 LOCAL_SEARCH_URL 处的本地 SearXNG;回退默认禁用。页面内容通过标准 HTTP GET 获取,无个人数据传输。仅在你明确信任该提供商时,才配置 LOCAL_SEARCH_FALLBACK_URL。

代理支持 search_local_web.py 与 browse_page.py 均自动支持代理: • 若设置 LOCAL_SEARCH_PROXY、HTTPS_PROXY 或 ALL_PROXY 环境变量,则自动使用 • 未设置时,自动检测 127.0.0.1:7890、7897、1080 等常见本地代理 • stealth 与 dynamic 模式优先使用已安装的本地 Chrome 浏览器(检查 /Applications/Google Chrome.app),可在 Playwright 下载 Chromium 前工作 • browse_page.py 支持可选 BROWSER_WORKER_URL 环境变量,将自动/stealth/dynamic 抓取委托给兼容的远程 sidecar API,仅在该 worker 可被调用方访问时有用

工具 1 — 网页搜索

LOCAL_SEARCH_URL="http://192.168.2.169:8081"
LOCAL_SEARCH_FALLBACK_URL=""
python3 ~/.openclaw/workspace/skills/local-web-search/scripts/search_local_web.py \
  --query "YOUR QUERY" \
  --intent general \
  --limit 5
intent 选项(控制引擎选择 + 查询扩展): general 默认混合查询 factual 事实、定义、官方文档 news 最新事件、突发新闻 research 论文、GitHub、技术深度 tutorial 操作指南、代码示例 comparison A vs B、优缺点 privacy 敏感查询(仅 ddg/startpage/qwant)

附加标志: --engines bing,duckduckgo,... 手动指定引擎 --freshness hour|day|week|month|year 按时间过滤 --max-age-days N 降权早于 N 天的结果 --browse 自动用 browse_page.py 获取头条结果 --no-expand 禁用 Agent Reach 查询扩展 --json 可机读 JSON 输出

工具 2 — 浏览/查看(读取整页)

python3 ~/.openclaw/workspace/skills/local-web-search/scripts/browse_page.py \
  --url "https://example.com/article" \
  --max-words 600
获取模式(--mode): auto 默认,Tier 1→2→3 fast 普通站点 stealth 反爬/Cloudflare 站点 dynamic 重 JS/SPA 站点

返回:标题、发布日期、词数、置信度(HIGH/MEDIUM/LOW)

数据来源ClawHub ↗ · 中文优化:龙虾技能库