加载中…

Scrape — 合规网页爬取

v?

Scrape 技能提供合法的网页爬取功能，遵守 robots.txt 规则，实现请求率限制，并确保数据处理符合 GDPR 和 CCPA 规范，保护用户隐私。

7· 6.2k·0 当前·0 累计

by @ivangdavila

网络工具 API工具安全

下载技能包

运行时依赖

无特殊依赖

安装命令

点击复制

官方npx clawhub@latest install scrape

镜像加速npx clawhub@latest install scrape --registry https://cn.longxiaskill.com 镜像可用

需要定制？告诉我你的需求 →

技能文档

简介

Scrape 技能用于合规的网页爬取，遵守 robots.txt，限制请求率，且数据处理符合 GDPR 和 CCPA。

用法

# 示例命令，实际使用可能有所不同
scrape --url=https://example.com --rate=1

配置选项

选项	描述
--url	目标 URL
--rate	请求间隔（秒）

# 原始 YAML frontmatter 保留，不翻译 title: Scrape Skill version: 1.0

注意

始终检查 robots.txt（如 https://example.com/robots.txt）
避免过快请求以不被封禁

相关技能推荐

self-improving-agent — 自我改进代理

捕获学习成果、错误和修正以实现持续改进。适用于命令/操作失败、用户纠正AI、请求新功能、API/工具失败、知识过时或发现更好方法等场景。

Skill Vetter — 技能安全审查

安全优先的 AI 技能审查工具，用于在安装 ClawHub、GitHub 等来源的技能前检查红旗标志、权限范围和可疑模式。

Weather — 实时天气和预报

获取当前天气和预报，无需 API 密钥。通过 wttr.in 和 Open-Meteo 使用 curl 获取天气信息，不需要安装软件或提供凭据。

Gog — Google Workspace CLI — Gog工具

Gog 是一个 Google Workspace 的命令行接口（CLI），支持 Gmail、日历、Drive、联系人、表格和文档的操作。它允许用户通过命令行管理 Google 服务，包括发送邮件、创建事件、文件管理等。需要配置 OAuth 凭据以授权访问。

Notion — 笔记管理

Notion 笔记和知识库管理工具，支持文档创建、数据库和项目管理。

OpenAI Whisper — 本地语音转文本

使用 OpenAI Whisper 的 CLI 实现本地语音转文本功能，无需 API 密钥。支持通过 Homebrew 安装，仅依赖本地 `whisper` 二进制文件，适用于开发者快速转换音频文件。

数据来源：ClawHub ↗ · 中文优化：龙虾技能库