首页龙虾技能列表 › Ai Research Scraper — AI研究信息爬取器

Ai Research Scraper — AI研究信息爬取器

v1.8.14

用于抓取AI领域最新研究信息的技能,重点关注AI产品发展。从知名AI网站获取信息,提供简洁概括和链接,限制数据量以便快速阅读。

1· 2,271·7 当前·7 累计
by @kernix0421 (Kernix0421)·MIT-0
下载技能包
License
MIT-0
最后更新
2026/3/1
安全扫描
VirusTotal
无害
查看报告
OpenClaw
可疑
medium confidence
该技能声称为简单的AI研究爬取器,但其代码调用了另一个技能的Node脚本,引用了未声明的外部搜索/翻译API(和API密钥),并且一些脚本引用了缺失的函数——这些不匹配之处令人担忧。
评估建议
该技能内部不一致,应谨慎对待。安装或运行前:- 检查引用的tavily-search技能(位于/root/.openclaw/workspace/skills/tavily-search/scripts/search.mjs),确保信任该代码并确认Node是预期的运行时。- 在技能明确文档和元数据中声明之前,不提供API密钥或其他凭据。- 注意到一些脚本引用了缺失的函数(如translate_text)或依赖可能不存在的文件——该包可能破坏或不完整。- 先在沙盒(非root容器)中运行脚本并审查网络调用(出站端点),确认它们联系到预期的服务(官方博客、已知的翻译端点或tavily API),而不是未知的域。- 如果需要此功能,请要求维护者在授予任何凭据或在生产环境中运行技能之前提供明确的依赖项列表(node、所需技能)、环境变量清单和缺失/未使用函数的修复。...
详细分析 ▾
用途与能力
SKILL.md 表示它从AI网站抓取信息并提供简洁摘要。代码确实实现了抓取和摘要,但也依赖于外部的tavily-search技能(通过子进程调用指定路径的search.mjs)并引用多个翻译API客户端/测试。技能的注册元数据未声明任何必需的环境变量或二进制文件,但代码暗示需要Node存在,并可能需要外部API密钥。这些依赖未声明,与简单的描述不成比例。
指令范围
SKILL.md 运行时指令是运行scripts/scraper.py。脚本确实调用子进程运行另一个技能的Node脚本,并对翻译/搜索端点进行网络调用。一些脚本(如simple_scraper.py)从scraper.py导入translate_text,但scraper.py没有定义translate_text——指示指令破坏或不一致。指令未提及tavily-search依赖、Node要求或所需API密钥。
安装机制
没有安装规范(仅指令),因此注册表不会自动下载或安装任何内容。然而,包中包含可运行的Python脚本,假设有运行时(node)和另一个技能的文件存在;运行它们将执行本地代码并生成外部进程。缺乏安装步骤降低了供应链风险,但在运行脚本时并不能消除执行风险。
凭证需求
技能未声明任何必需的环境变量或凭据,但在文档和测试中引用了翻译API和Tavily Search(预期API密钥,如TAVILY_API_KEY、Google/Microsoft/Baidu/Youdao凭据)。测试和api_reference.md显示了明确的API密钥使用。这种不匹配(代码/文档预期秘密但元数据未声明)是一个红旗:运行测试或启用翻译/搜索回退可能会提示您添加敏感凭据,而技能未声明原因。
持久化与权限
技能不请求always:true,只能由用户调用。它不修改提供的代码中的其他技能或系统范围设置。然而,它生成子进程执行工作空间中的另一个技能的脚本,有效地授予它运行位于其他技能目录的代码的能力——这增加了运行时爆炸半径,即使技能本身不持久安装或提升权限。
安全有层次,运行前请审查代码。

License

MIT-0

可自由使用、修改和再分发,无需署名。

运行时依赖

无特殊依赖

版本

latestv1.8.142026/2/12

此版本无用户可见变化。- 内部更新:仅修改了_meta.json文件;文档、功能和使用方式未变。

● 无害

安装命令 点击复制

官方npx clawhub@latest install ai-research-scraper
镜像加速npx clawhub@latest install ai-research-scraper --registry https://cn.clawhub-mirror.com

技能文档

概述

这个技能专门用于从知名AI领域网站抓取最新研究信息,重点关注AI产品发展方面。它会限制抓取的数据量和token使用,提供简洁的信息概括,并包含原始网页链接,方便用户进一步查阅详细内容。

使用场景

  • 当您需要快速了解AI领域最新产品动态时
  • 当您想跟踪特定AI产品的发展信息时
  • 当您需要获取AI技术发展的最新研究成果摘要时

支持的网站

当前支持的AI领域知名网站包括:
  • TechCrunch AI板块
  • VentureBeat AI板块
  • MIT Technology Review AI板块
  • Google AI Blog
  • Microsoft AI Blog
  • NVIDIA Blog

功能特点

  • 数据量控制:限制摘要长度,确保信息简洁
  • 重点突出:聚焦AI产品发展信息
  • 链接完整:每个摘要都包含原始网页链接
  • 定时更新:支持定期抓取最新信息
  • 可配置性:支持添加或修改目标网站
  • 网络优化:增加超时时间和重试机制,提高抓取成功率
  • 缓存机制:添加1小时缓存,避免重复抓取相同内容
  • 稳定源:优化网站列表,使用更稳定的AI领域网站源
  • 备用搜索:支持使用tavily-search技能替代,避免网络超时问题
  • 简化处理:暂时移除翻译功能,避免API错误和网络超时问题

使用方法

快速开始

使用默认配置抓取AI产品发展相关信息:
python3 /root/.openclaw/workspace/skills/ai-research-scraper/scripts/scraper.py

配置选项

自定义网站列表

编辑 references/websites.txt 文件,添加或删除目标网站。每行格式:
网站名称|网站URL|RSS/Feed URL(可选)

控制摘要长度

python3 /root/.openclaw/workspace/skills/ai-research-scraper/scripts/scraper.py --max-tokens 500

指定时间范围

python3 /root/.openclaw/workspace/skills/ai-research-scraper/scripts/scraper.py --days 7

指定主题重点

python3 /root/.openclaw/workspace/skills/ai-research-scraper/scripts/scraper.py --topic product-development

脚本和资源

Scripts

  • scripts/scraper.py: 主要的网页抓取和信息提取脚本
  • scripts/example.py: 示例脚本(可删除或修改)

References

  • references/websites.txt: 包含要抓取的网站列表
  • references/api_reference.md: API参考文档(待完善)

Assets

  • assets/: 资源文件夹(可用于存放模板或其他静态资源)
数据来源:ClawHub ↗ · 中文优化:龙虾技能库
OpenClaw 技能定制 / 插件定制 / 私有工作流定制

免费技能或插件可能存在安全风险,如需更匹配、更安全的方案,建议联系付费定制

了解定制服务