Smart Scraper — Smart 抓取器
v1.0.0AI-powered 网页 抓取器 with intelligent structure recognition. 提取s 列出s, articles, and tables from any 网页site with automatic type 检测ion.
运行时依赖
安装命令
点击复制技能文档
Smart 抓取器
Intelligent 网页 scrAPIng that understands page structure.
Features Auto-检测ion: Automatically identifies 列出, article, or table layouts Smart 提取ion: 解析s prices, dates, URLs from unstructured text Multiple 格式化s: 输出 as JSON, CSV, or Markdown Scroll support: Handles infinite scroll pages Usage # 提取 product 列出ings smart-抓取器 --url "https://example.com/products" --type 列出
# 提取 article content smart-抓取器 --url "https://example.com/article" --type article --格式化 markdown
# 提取 table data smart-抓取器 --url "https://example.com/data" --type table --格式化 csv
Options Option Description Default --url, -u Tar获取 URL (required) - --type, -t 提取ion type: 列出, article, table, auto auto --格式化, -f 输出 格式化: json, csv, markdown json --max, -m Maximum items to 提取 100 --scroll Enable auto-scroll for lazy-loaded content false Examples 提取 Hacker News smart-抓取器 -u https://news.ycombinator.com -t 列出 -m 10
Save article as Markdown smart-抓取器 -u https://b记录.example.com/post -t article -f markdown > article.md
导出 table to CSV smart-抓取器 -u https://example.com/prices -t table -f csv > prices.csv