Jina Web Fetcher - 网页抓取 — Jina Web Fetcher — 网页抓取与搜索引擎限制绕过
v1.0.0使用 Jina AI 通过代理抓取任意网页内容,包括绕过搜索引擎限制获取内容。支持任意 URL 和 Google 搜索结果抓取,但请注意隐私和法律风险。
0· 1,426·10 当前·10 累计
安全扫描
OpenClaw
可疑
medium confidence技能指令与其目的(使用 r.jina.ai 作为 web 代理)一致,但指令启用了通过第三方代理的隐式数据外泄和 SSRF 风险,缺乏对隐私、合法性或范围的警告,风险较高。
评估建议
["隐私/数据外泄 — 所有请求的 URL 和页面内容将被转发到 r.jina.ai(包括潜在敏感的内部端点)。","SSRF 风险 — 通过代理获取内部 URL 可能会暴露内部服务。","法律/服务条款风险 — 使用代理绕过搜索引擎限制可能违反网站服务条款。","如果必须使用,请避免发送凭据或私人/内部 URL,并验证 r.jina.ai 的隐私政策或使用您自己的可信代理。对于简单的公共页面抓取,优先使用本地控制的方法。"]...详细分析 ▾
ℹ 用途与能力
名称/描述声称通过 Jina AI 获取任意网页(包括 Google 结果)。SKILL.md 显示了这一点:curl 到 r.jina.ai/http://<目标>。这与声明的目的一致,尽管“绕过搜索引擎限制”的明确声明引发了法律/服务条款问题,而不是技术不一致。
⚠ 指令范围
指令直接告诉代理通过 https://r.jina.ai 代理任意 URL。这意味着任何请求的 URL(包括内部/私有地址或需要身份验证的页面)和获取的页面内容将被发送到第三方。SKILL.md 没有警告这一点,也没有限制范围(仅限公共 URL),因此运行时行为可以收集和传输敏感数据。
✓ 安装机制
这是一个仅有指令的技能,没有安装步骤或代码文件,因此没有磁盘安装风险。
⚠ 凭证需求
技能不请求凭据,但其通过远程代理获取任意 URL 的能力是不成比例的:它可以用于访问内部网络端点(SSRF)或将私人内容外泄到 r.jina.ai。没有需要或声明的环境变量,SKILL.md 也没有披露数据将被发送到第三方。
✓ 持久化与权限
没有请求持久安装或“始终”权限;技能是用户可调用,并使用正常的自主调用默认值。
安全有层次,运行前请审查代码。
运行时依赖
无特殊依赖
版本
latestv1.0.02026/2/26
Jina Web Fetcher 1.0.0 — 初始发布 - 通过 Jina AI 代理抓取网页内容。 - 支持抓取 Google 搜索结果。 - 通过 curl 命令简单使用,无需安装。 - 提供流行网站的示例命令。
● 可疑
安装命令 点击复制
官方npx clawhub@latest install jina-web-fetcher
镜像加速npx clawhub@latest install jina-web-fetcher --registry https://cn.clawhub-mirror.com
技能文档
使用 Jina AI 服务抓取网页内容。
安装
无需安装,直接使用 curl。使用
# 抓取任意网页
curl -s "https://r.jina.ai/http://目标URL"
# 抓取 Google 搜索结果
curl -s "https://r.jina.ai/http://www.google.com/search?q=搜索词"
示例
# 抓取 GitHub Trending
curl -s "https://r.jina.ai/http://github.com/trending"
# 抓取 Hacker News
curl -s "https://r.jina.ai/http://news.ycombinator.com"
# 抓取特定文章
curl -s "https://r.jina.ai/http://example.com/article"
注意
- Google 被封锁时使用 r.jina.ai 仍可能被拦截
- 大部分网站都可以正常抓取
数据来源:ClawHub ↗ · 中文优化:龙虾技能库
OpenClaw 技能定制 / 插件定制 / 私有工作流定制
免费技能或插件可能存在安全风险,如需更匹配、更安全的方案,建议联系付费定制