web-data-extractor（网页数据采集器，支持 CSS/XPath 选择器、批量抓取、自动分页、数据导出（CSV/JSON）。适用于市场调研、竞品分析、内容聚合。） — 网页-data-提取器（网页数据采集器，支持 CSS/XPath 选择器、批量抓取、自动分页、数据导出（CSV/JSON）。适用于市场调研、竞品分析、内容聚合。）

v1.0.0

网页数据采集器，支持 CSS 选择器/XPath 提取、批量抓取、自动分页、数据导出（CSV/JSON/Markdown）。

0· 346·0 当前·0 累计

by @careytian-ai (careytian)·MIT-0

文档工具数据分析数据可视化网络工具浏览器自动化

下载技能包

License

MIT-0

License

MIT-0

可自由使用、修改和再分发，无需署名。

查看条款 ↗

运行时依赖

无特殊依赖

安装命令

点击复制

官方npx clawhub@latest install web-data-extractor

镜像加速npx clawhub@latest install web-data-extractor --registry https://cn.longxiaskill.com 镜像可用

需要定制？告诉我你的需求 →

技能文档

网页数据采集器 v1.0.0

从网页批量提取结构化数据，支持多种选择器和导出格式。

功能特性

CSS 选择器提取

// 提取所有标题网页_fetch({"url": "https://example.com"}) // 使用 CSS 选择器提取特定元素

XPath 提取

// 支持 XPath 路径提取复杂结构

批量抓取

自动分页处理 URL 列表批量处理并发控制

数据导出

CSV 格式 JSON 格式 Markdown 表格快速使用示例 // 提取文章列表 const articles = 提取Data({ url: "https://b记录.example.com", selector: ".article-card", fields: { title: "h2.title", link: "a[href]", date: ".publish-date" } })

// 导出为 CSV 导出ToCSV(articles, "输出.csv")

// 导出为 JSON 导出ToJSON(articles, "输出.json")

// 批量抓取多页 const allData = scrapeMultiple({ baseUrl: "https://example.com/page/", pages: 10, selector: ".item" })

使用场景市场调研 - 抓取竞品价格、产品信息内容聚合 - 收集多源内容数据分析 - 提取公开数据集舆情监控 - 追踪 mentions、评论 SEO 分析 - 抓取关键词排名注意事项遵守目标网站的 ro机器人s.txt 控制抓取频率，避免被封仅抓取公开数据定制开发

需要定制化数据采集、清洗或自动化工作流？

📧 联系：careytian-AI@github

许可证

MIT-0

License

运行时依赖

安装命令

技能文档

相关技能推荐