首页龙虾技能列表 › Auto Tech Research

Auto Tech Research

v1.0.0

全自动化技术深度调研 Skill。通过 Chrome DevTools Protocol 操控浏览器, 模拟真人搜索行为,在国内外主流平台检索内容,确保搜索结果与人工操作一致。 输出 HTML 格式的结构化调研报告。 核心原则: - 不使用 web_fetch,全程使用 browser(CDP 协议) - 搜索行...

0· 34·1 当前·1 累计
by @huayang0704·MIT-0
下载技能包
License
MIT-0
最后更新
2026/4/14
安全扫描
VirusTotal
无害
查看报告
OpenClaw
可疑
medium confidence
The skill's stated purpose (browser-driven research) is plausible, but there are inconsistencies and privacy/operational risks — notably implicit access to a user's logged-in Chrome profile (chrome-relay) and a substantial executable Python script included but not declared in the install/requirements.
评估建议
Before installing or running this skill: (1) Review scripts/auto-research.py fully — any included Python can run network requests or exfiltrate data. (2) Verify how the agent will access 'chrome-relay' and whether you are comfortable allowing snapshots of pages accessed while logged into your accounts (this can expose cookies, messages, private profiles). (3) If you only need public-web scraping, avoid enabling chrome-relay or run the skill in an isolated/browser profile with no logins. (4) Ask ...
详细分析 ▾
用途与能力
The skill claims to perform CDP/browser-driven research and the SKILL.md instructions match that purpose (navigate, snapshot, extract, generate HTML). However the package includes a large Python script (scripts/auto-research.py) and README usage examples that run it, while the registry metadata describes this as instruction-only with no install spec — this mismatch (embedded runnable code but no declared install/run guidance) should be clarified.
指令范围
The runtime instructions explicitly instruct using a 'chrome-relay' profile (the user's logged-in Chrome) for platforms that require login. That implies access to cookies, sessions, and any signed-in accounts. The SKILL.md does not document consent, limits, or which data is read from those profiles, and it instructs broad navigation/snapshotting across many third-party sites — a real privacy surface that should be declared and controlled.
安装机制
No install spec (instruction-only) is lower risk, but the repo contains a ~27KB Python script and examples that run python3 scripts/auto-research.py. It's unclear whether the agent or user is expected to execute that script; the presence of executable code increases the attack surface and should be explained even if no installer is provided.
凭证需求
The skill declares no required env vars or credentials, yet its behavior depends on access to browser profiles (openclaw and chrome-relay). Accessing chrome-relay effectively gives the skill access to session cookies and logged-in accounts (WeChat, Zhihu, Bilibili, Google, etc.). That level of access is significant and is not declared as a required credential/config entry.
持久化与权限
always is false and there are no claims of permanent presence or modifying other skills/configs. The agent-autonomous invocation default applies but is not by itself a new concern in this package.
安全有层次,运行前请审查代码。

License

MIT-0

可自由使用、修改和再分发,无需署名。

运行时依赖

无特殊依赖

版本

latestv1.0.02026/4/14

auto-tech-research v4.0.0 - 全面弃用 web_fetch,所有自动化搜索均通过 browser(Chrome DevTools Protocol)模拟真人操作完成。 - 浏览器自动选择独立 profile 或 chrome-relay(带登录态)以应对不同平台需求,如知乎、B站等需登录内容。 - 支持 JS 渲染页面,搜索和内容获取与人工操作一致,极大提升反爬绕过能力和内容一致性。 - 各平台采集过程与结果透明:HTML 报告中输出获取成功/失败/原因等诊断信息。 - 优化浏览器资源管理和操作效率,减少无效页面打开与超时失败。

● 无害

安装命令 点击复制

官方npx clawhub@latest install auto-tech-research
镜像加速npx clawhub@latest install auto-tech-research --registry https://cn.clawhub-mirror.com

技能文档

核心变更(v4.0)

v3.0 → v4.0 最大变化:全面弃用 web_fetch,改用 browser(CDP 协议)

维度v3.0v4.0
搜索工具web_fetch 优先,browser 降级browser 唯一工具
搜索体验程序式 HTTP 请求模拟真人浏览器操作
JS 渲染不支持完整支持
登录态不支持支持(chrome-relay)
反爬绕过经常 403与真人一致,极少被拦
搜索结果API 返回格式与人工搜索完全一致

工作流程概览

输入技术主题(+ 可选的用户补充链接)
    ↓
[Phase 1] 关键词扩展(中英双语)
    ↓
[Phase 2] 平台相关性评估 + 动态数量分配
    ↓
[Phase 3] 浏览器搜索(CDP 操控,模拟真人)
    ├─ 启动浏览器(独立 openclaw 实例 或 chrome-relay)
    ├─ 逐平台搜索:打开搜索页 → 输入关键词 → 获取结果列表
    ├─ 逐条打开:点击链接 → 等待加载 → snapshot 提取内容
    ├─ 记录每个平台的获取状态和原因
    └─ 用户补充链接:直接 navigate → snapshot
    ↓
[Phase 4] 内容分级整理(L1-L4)
    ↓
[Phase 5] 生成 HTML 报告
    ├─ 技术概览(200-1000字)
    ├─ 分级资源(带平台标签和可点击链接)
    ├─ 平台获取诊断面板
    └─ 平台统计明细

浏览器策略

浏览器选择

场景浏览器 Profile说明
默认openclaw(省略 profile)独立受控浏览器,无登录态,适合公开内容
需要登录态chrome-relay用户已登录的 Chrome,适合知乎、B站等

启动顺序

1. 优先使用 openclaw 默认浏览器(独立、干净)
  • 如果平台需要登录(知乎文章、B站视频详情等),切换 chrome-relay
  • 每个平台搜索完成后,关闭标签页释放资源

Phase 1: 关键词扩展

与 v3.0 一致,中英双语扩展:

示例:Kubernetes
中文:
  核心: ["Kubernetes", "K8s", "容器编排"]
  教程: ["Kubernetes入门", "K8s教程"]
  深度: ["Kubernetes架构", "K8s原理"]
英文:
  core: ["Kubernetes", "K8s", "container orchestration"]
  tutorial: ["Kubernetes tutorial", "K8s getting started"]
  advanced: ["Kubernetes architecture", "K8s deep dive"]

Phase 2: 平台相关性评估

与 v3.0 一致,根据主题动态评估每个平台的相关性和获取数量。

Phase 3: 浏览器搜索(核心变更)

3.1 搜索引擎策略

目标平台搜索方式URL 模板
通用英文Google 搜索https://www.google.com/search?q={关键词}
通用中文百度搜索https://www.baidu.com/s?wd={关键词}
知乎知乎站内搜索https://www.zhihu.com/search?type=content&q={关键词}
CSDNCSDN 搜索https://so.csdn.net/so/search?q={关键词}
B站B站站内搜索https://search.bilibili.com/all?keyword={关键词}
GitHubGitHub 搜索https://github.com/search?q={关键词}&type=repositories
arXivarXiv 搜索https://arxiv.org/search/?query={关键词}
YouTubeYouTube 搜索https://www.youtube.com/results?search_query={关键词}
HackerNewsHN 搜索https://hn.algolia.com/?q={关键词}
微信公众号搜狗微信搜索https://weixin.sogou.com/weixin?query={关键词}
小宇宙小宇宙搜索https://www.xiaoyuzhoufm.com/search?q={关键词}

3.2 每个平台的搜索步骤

对于每个平台:
  1. browser(action="navigate", url=搜索URL)
  2. browser(action="snapshot") → 获取搜索结果列表
  3. 从 snapshot 中提取 Top N 个结果的标题和链接
  4. 对每个结果:
     a. browser(action="navigate", url=结果链接)
     b. browser(action="snapshot") → 获取文章内容
     c. 提取:标题、作者、发布时间、正文摘要
  5. 记录获取状态(成功条数、失败原因)
  6. 关闭多余标签页

3.3 关键操作示例

Google 搜索

browser(action="navigate", url="https://www.google.com/search?q=Kubernetes+tutorial")
browser(action="snapshot")  → 获取搜索结果
# 从 snapshot 中提取链接
browser(action="navigate", url="第一个结果链接")
browser(action="snapshot")  → 获取文章内容

知乎搜索(需要 chrome-relay):

browser(action="navigate", url="https://www.zhihu.com/search?type=content&q=Kubernetes",
        profile="chrome-relay")
browser(action="snapshot", profile="chrome-relay")  → 获取搜索结果
# 提取知乎文章链接(zhuanlan.zhihu.com/p/xxx)
browser(action="navigate", url="https://zhuanlan.zhihu.com/p/xxx",
        profile="chrome-relay")
browser(action="snapshot", profile="chrome-relay")  → 获取文章内容

B站搜索

browser(action="navigate", url="https://search.bilibili.com/all?keyword=Kubernetes")
browser(action="snapshot")  → 获取视频列表(标题、播放量、UP主)
# 提取视频链接(bilibili.com/video/BVxxx)

3.4 内容提取策略

内容类型提取方式提取目标
文章snapshot → 解析文本标题、作者、正文前500字
视频snapshot → 解析元数据标题、UP主、播放量、简介
论文snapshot → 解析摘要标题、作者、Abstract
仓库snapshot → 解析 README名称、Stars、描述
讨论snapshot → 解析帖子标题、分数、评论数

3.5 获取诊断(每个平台必须输出)

📊 平台获取诊断
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
✅ Google搜索    | 10条 | 独立浏览器,搜索结果正常
✅ 知乎          | 8条  | chrome-relay,站内搜索 + zhuanlan 直链
✅ GitHub        | 12条 | 独立浏览器,仓库搜索+API
✅ arXiv         | 5条  | 独立浏览器,搜索结果正常
✅ B站           | 6条  | 独立浏览器,视频列表正常
⚠️ CSDN          | 3条  | 独立浏览器,部分文章需VIP,跳过
❌ YouTube        | 0条  | 独立浏览器,地区限制无法加载
✅ HackerNews    | 4条  | 独立浏览器,Algolia搜索正常
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
总计: 48条 (7/8 平台成功)

3.6 用户补充链接处理

当用户发送额外链接时:

1. 识别 URL 的平台来源
  • browser(action="navigate", url=用户链接)
  • browser(action="snapshot") → 提取内容
  • 分类到对应 Level
  • 更新 HTML 报告(增量)

Phase 4: 内容分级

与 v3.0 一致:L1入门 / L2实践 / L3深度 / L4前沿

Phase 5: HTML 报告生成

与 v3.0 一致,使用 references/report-template.html 模板生成自包含 HTML。

性能优化

减少浏览器操作次数

  • 批量提取:一次 snapshot 提取搜索页面的所有结果,而不是逐个点击
  • 标签复用:在同一标签页中 navigate 不同页面,减少标签开关
  • 跳过低质量:搜索结果中明显低质量的跳过不打开
  • 并行标签:如果浏览器支持,可同时打开多个标签

超时和错误处理

- 页面加载超时(>15s)→ 标记失败,继续下一个
  • 页面内容为空 → 尝试等待 2s 后重新 snapshot
  • 弹窗/登录拦截 → 尝试关闭弹窗,或切换 chrome-relay
  • 验证码 → 标记为"需人工干预",跳过

与 v3.0 的完整对比

维度v3.0v4.0
搜索工具web_fetch 优先browser(CDP)唯一
搜索体验HTTP 请求模拟真人浏览器
JS 渲染
知乎403 失败✅ chrome-relay 搜索
B站空内容✅ JS 渲染后提取
CSDN404 频繁✅ 浏览器正常加载
YouTube超时⚠️ 可能地区限制
搜索结果一致性低(API格式)高(与人工一致)
输出格式HTMLHTML(不变)
失败诊断✅(不变)

注意事项

  • 浏览器资源管理:搜索完一个平台后关闭多余标签页,避免内存泄漏
  • 搜索频率控制:不要短时间内对同一平台发起过多请求,间隔 2-3 秒
  • 内容提取精度:snapshot 返回的是 accessibility tree,需要从中筛选有效内容
  • cookie/登录态:需要登录的平台使用 chrome-relay,公开内容用独立浏览器
  • 隐私保护:不在独立浏览器中输入任何账号密码

版本:v4.0.0 更新日期:2026-03-27 核心变更:全面弃用 web_fetch,改用 browser CDP 协议模拟真人搜索

数据来源:ClawHub ↗ · 中文优化:龙虾技能库
OpenClaw 技能定制 / 插件定制 / 私有工作流定制

免费技能或插件可能存在安全风险,如需更匹配、更安全的方案,建议联系付费定制

了解定制服务