详细分析 ▾
运行时依赖
版本
- 仅更新内部元数据(_meta.json变更) - 未改动用户可见功能或文档 - 功能及工作流与上一版本保持一致
安装命令
点击复制技能文档
# 16 个搜索引擎的无 API key 网络抓取集成 ## 工作流程 1. 准备阶段:AI Agent 初始化一个空的内存 cookie 容器。仅在访问被拒绝时才在搜索过程中动态获取 cookie 2. 语言判断:检测搜索查询的语言属性。若查询为中文,使用国内搜索引擎(百度、必应中国、必应国际、360、搜狗、微信、神马)。若查询为非中文,使用国际搜索引擎(Google、Google 香港、DuckDuckGo、Yahoo、Startpage、Brave、Ecosia、Qwant、WolframAlpha)。根据查询相关性与引擎可用性进行选择。 3. 受控搜索:使用 web_fetch 执行搜索请求并限速: - 请求间隔 1–2 秒,减轻服务器负载 - 每批 3–4 个引擎,批次间顺序执行 - 附带标准浏览器标头,模拟正常用户 - 若访问被拒(403/429),先访问引擎首页获取新会话 cookie 4. Cookie 管理: - Cookie 仅保存在运行时的内存中 - 仅在搜索请求失败时按需获取 - 不会从 config.json 或任何文件读取/写入 Cookie - 搜索会话结束后立即清除 - 仅捕获搜索引擎域的会话 cookie 5. 重试机制:若因 cookie/会话问题失败,等待 2 秒后重新获取 cookie 并重试一次 6. 结果聚合:整合各搜索引擎的成功结果,组织并汇总为核心搜索报告 ## 搜索引擎 ### 国内(7 个) - 百度: https://www.baidu.com/s?wd={keyword} - 必应中国: https://cn.bing.com/search?q={keyword}&ensearch=0 - 必应国际: https://cn.bing.com/search?q={keyword}&ensearch=1 - 360: https://www.so.com/s?q={keyword} - 搜狗: https://sogou.com/web?query={keyword} - 微信: https://wx.sogou.com/weixin?type=2&query={keyword} - 神马: https://m.sm.cn/s?q={keyword} ### 国际(9 个) - Google: https://www.google.com/search?q={keyword} - Google 香港: https://www.google.com.hk/search?q={keyword} - DuckDuckGo: https://duckduckgo.com/html/?q={keyword} - Yahoo: https://search.yahoo.com/search?p={keyword} - Startpage: https://www.startpage.com/sp/search?query={keyword} - Brave: https://search.brave.com/search?q={keyword} - Ecosia: https://www.ecosia.org/search?q={keyword} - Qwant: https://www.qwant.com/?q={keyword} - WolframAlpha: https://www.wolframalpha.com/input?i={keyword} ## 快速示例 ``javascript // Basic search web_fetch({"url": "https://www.google.com/search?q=python+tutorial"}) // Site-specific web_fetch({"url": "https://www.google.com/search?q=site:github.com+react"}) // File type web_fetch({"url": "https://www.google.com/search?q=machine+learning+filetype:pdf"}) // Time filter (past week) web_fetch({"url": "https://www.google.com/search?q=ai+news&tbs=qdr:w"}) // Privacy search web_fetch({"url": "https://duckduckgo.com/html/?q=privacy+tools"}) // DuckDuckGo Bangs web_fetch({"url": "https://duckduckgo.com/html/?q=!gh+tensorflow"}) // Knowledge calculation web_fetch({"url": "https://www.wolframalpha.com/input?i=100+USD+to+CNY"}) ` ## 高级运算符 | 运算符 | 示例 | 说明 | |----------|---------|-------------| | site: | site:github.com python | 站内搜索 | | filetype: | filetype:pdf report | 指定文件类型 | | "" | "machine learning" | 精确匹配 | | - | python -snake | 排除关键词 | | OR | cat OR dog | 任一关键词 | ## 时间过滤 | 参数 | 说明 | |-----------|-------------| | tbs=qdr:h | 过去一小时 | | tbs=qdr:d | 过去一天 | | tbs=qdr:w | 过去一周 | | tbs=qdr:m | 过去一月 | | tbs=qdr:y | 过去一年 | ## 隐私引擎 - DuckDuckGo: 不追踪 - Startpage: Google 结果 + 隐私保护 - Brave: 独立索引 - Qwant: 符合欧盟 GDPR ## Bang 快捷方式(DuckDuckGo) | Bang | 目标站点 | |------|-------------| | !g | Google | | !gh | GitHub | | !so | Stack Overflow | | !w | Wikipedia | | !yt | YouTube | ## WolframAlpha 查询 - 数学: integrate x^2 dx - 换算: 100 USD to CNY - 股票: AAPL stock - 天气: weather in Beijing ## 文档 - references/advanced-search.md - 国内搜索指南 - references/international-search.md - 国际搜索指南 - CHANGELOG.md` - 版本历史 ## 许可证 MIT ## 安全与隐私声明 ### Cookie 处理 - 目的:Cookie 仅用于在访问被拒(403/429)时维持搜索会话状态 - 存储:Cookie 严格保存在运行时内存中,永不写入磁盘或配置文件 - 获取:仅在搜索请求失败时,从搜索引擎首页按需获取 - 范围:仅捕获特定搜索引擎域的会话 cookie - 生命周期:搜索会话结束后立即清除 - 无预配置:启动时不会从 config.json 或任何外部文件加载 cookie - 无需 API 密钥:工具使用标准搜索 URL,无需身份验证 ### 抓取伦理 - 限速:请求间实施合理延迟(建议 1–2 秒) - 遵守 robots.txt:尊重搜索引擎抓取政策 - 服务条款:用户需自行遵守各搜索引擎 ToS - 用途:设计用于合法搜索聚合,而非大规模数据抓取 ### 数据处理 - 不收集个人数据:工具不收集或传输用户个人信息 - 本地执行:所有操作均在本地完成,无外部数据传输 - 会话隔离:Cookie 仅针对当前会话,用后立即清除