web-data-extractor(网页数据采集器,支持 CSS/XPath 选择器、批量抓取、自动分页、数据导出(CSV/JSON)。 适用于市场调研、竞品分析、内容聚合。) — 网页-data-提取器(网页数据采集器,支持 CSS/XPath 选择器、批量抓取、自动分页、数据导出(CSV/JSON)。 适用于市场调研、竞品分析、内容聚合。)
v1.0.0网页数据采集器,支持 CSS 选择器/XPath 提取、批量抓取、自动分页、数据导出(CSV/JSON/Markdown)。
0· 346·0 当前·0 累计
下载技能包
License
MIT-0
运行时依赖
无特殊依赖
安装命令
点击复制官方npx clawhub@latest install web-data-extractor
镜像加速npx clawhub@latest install web-data-extractor --registry https://cn.longxiaskill.com 镜像可用
技能文档
网页数据采集器 v1.0.0
从网页批量提取结构化数据,支持多种选择器和导出格式。
功能特性
- CSS 选择器提取
- XPath 提取
- 批量抓取
- 数据导出
// 导出为 CSV 导出ToCSV(articles, "输出.csv")
// 导出为 JSON 导出ToJSON(articles, "输出.json")
// 批量抓取多页 const allData = scrapeMultiple({ baseUrl: "https://example.com/page/", pages: 10, selector: ".item" })
使用场景 市场调研 - 抓取竞品价格、产品信息 内容聚合 - 收集多源内容 数据分析 - 提取公开数据集 舆情监控 - 追踪 mentions、评论 SEO 分析 - 抓取关键词排名 注意事项 遵守目标网站的 ro机器人s.txt 控制抓取频率,避免被封 仅抓取公开数据 定制开发
需要定制化数据采集、清洗或自动化工作流?
📧 联系:careytian-AI@github
许可证
MIT-0