首页龙虾技能列表 › Web Site or Domain Name Basic Information Scanner — Web Site or Domain Name Basic Information Scanner — 网站基本信息扫描

Web Site or Domain Name Basic Information Scanner — Web Site or Domain Name Basic Information Scanner — 网站基本信息扫描

v1.0.0

综合性网站分析扫描工具,可分析IP(IPv4/IPv6)、DNS记录、WHOIS数据、网站内容(包括Schema.org JSON-LD、robots.txt、llms.txt、sitemap.xml)、SEO指标和第三方数据。支持使用Playwright进行深度扫描以处理客户端渲染页面,生成详细的技术报告。

0· 72·0 当前·0 累计
by @hugogu (Hugo Gu)·MIT-0
下载技能包
License
MIT-0
最后更新
2026/4/2
安全扫描
VirusTotal
无害
查看报告
OpenClaw
安全
medium confidence
该技能及其代码与网站扫描工具的功能一致:所需工具(dig、whois)、Python库和网络请求都符合所述目的;没有明显迹象表明存在误导或隐藏的凭证泄露,但一些第三方网络调用和深度爬取行为值得谨慎。
评估建议
该技能似乎能够实现其声称的功能:DNS/WHOIS查询、内容解析和可选的深度爬取。在安装/运行之前:(1)查看完整的脚本/scan.py(分发的文件很大,在清单中被截断)以确保没有意外的远程端点或遥测;(2)注意扫描器将发出出站HTTP请求(包括向ipapi.co获取地理定位)并可能抓取搜索引擎——除非您信任该环境,否则不要将其指向内部、敏感或私有网络地址;(3)通过Playwright进行的深度扫描可以执行站点JavaScript并产生大量流量——使用速率限制和最大页面数标志;(4)如果您对数据泄露有任何疑问,请在隔离/测试环境中运行;(5)在抓取第三方服务(Google)或扫描非您所有的网站之前,确认任何法律/服务条款约束。...
详细分析 ▾
用途与能力
名称/描述与随附的SKILL.md和scripts/scan.py相匹配。代码使用DNS(dig)、WHOIS、HTTP请求和内容解析——这些都是网站扫描器的预期功能。requirements.txt和SKILL.md中的依赖项(requests、bs4、lxml)与声称的功能相称。
指令范围
SKILL.md指示代理运行dig和whois,并获取robots.txt、sitemap.xml、llms.txt等,代码实现了这些功能。技能执行外部网络调用(向目标站点和第三方服务发出HTTP请求),并可能通过Playwright(可选)深度扫描客户端渲染页面。这些行为在扫描器的声明范围内,但使该工具能够获取多个页面并执行远程JavaScript——因此用户在扫描私有/内部主机或敏感环境时应小心。
安装机制
没有自动安装规范;该技能仅是指令性的,包含requirements.txt。风险较低,因为安装程序不会自动下载/执行任何东西;用户必须手动pip-install并运行脚本。
凭证需求
技能不请求环境变量或凭证。它确实调用外部API(例如ipapi.co用于IP地理定位),并可能抓取第三方服务(Google索引近似),这与其目的相符。没有请求隐藏的凭证访问或无关的环境变量。
持久化与权限
always:false且该技能不请求持久的系统级特权。它确实使用subprocess调用dig/whois(预期)并运行HTTP请求;没有迹象表明修改了其他技能或全局代理设置。
安全有层次,运行前请审查代码。

License

MIT-0

可自由使用、修改和再分发,无需署名。

运行时依赖

无特殊依赖

版本

latestv1.0.02026/4/2

网站扫描器技能的首次发布。综合网站分析:扫描IP、DNS记录、WHOIS、内容(Schema.org、robots.txt、llms.txt、sitemap.xml)、SEO和第三方数据。支持使用Playwright进行深度扫描以处理客户端渲染页面。生成控制台、JSON和markdown格式的详细技术报告。包括可操作的SEO审计、结构化数据提取和技术栈检测。专为与OpenClaw轻松集成而设计,可在审计中处理多个页面。

● 无害

安装命令 点击复制

官方npx clawhub@latest install website-scanner
镜像加速npx clawhub@latest install website-scanner --registry https://cn.clawhub-mirror.com

技能文档

综合性网站分析工具,可扫描域名并生成详细的技术报告。

适用场景

在需要以下操作时使用此技能:

  • 分析网站的技术基础设施(IP、DNS、WHOIS)
  • 审计网站内容和SEO
  • 提取结构化数据(Schema.org JSON-LD)
  • 检查robots.txt、llms.txt、sitemap.xml
  • 对多个页面进行深度扫描
  • 生成综合性网站报告

前置条件

必需的系统工具

  • dig - DNS查询工具
  • whois - WHOIS查询工具

Python依赖

pip install requests beautifulsoup4 aiohttp

可选(用于深度扫描)

  • Playwright(用于JavaScript渲染的页面)
pip install playwright
playwright install chromium

使用方法

基本扫描

python3 scripts/scan.py example.com

深度扫描(跟随sitemap)

python3 scripts/scan.py example.com --deep --max-pages 10

保存报告

python3 scripts/scan.py example.com --output report.json --markdown report.md

功能特性

1. 网络分析

  • IP解析:IPv4和IPv6地址
  • 地理定位:服务器位置、ASN、组织
  • DNS记录:A、AAAA、MX、NS、TXT、CNAME、SOA
  • WHOIS数据:注册商、创建/到期日期、状态

2. 内容分析

  • 首页元数据:标题、描述、视口、字符集
  • 标题结构:H1-H6分布
  • 链接:内部与外部计数
  • 图片:Alt文本覆盖率
  • 脚本/样式:资源计数

3. 结构化数据

  • Schema.org JSON-LD:提取所有结构化数据模式
  • Open Graph:元标签分析
  • Twitter Cards:社交媒体元数据

4. SEO分析

  • SEO评分:0-100评级
  • 问题:缺失标签、优化问题
  • 建议:可操作的改进措施

5. 爬虫文件

  • robots.txt:获取并解析
  • llms.txt:AI/LLM指令
  • sitemap.xml:解析URL结构

6. 第三方数据

  • Google索引:检查索引页面(近似值)
  • 服务器检测:技术栈识别

7. 深度扫描

  • 跟随sitemap URL
  • 分析多个页面
  • 客户端渲染支持(使用Playwright)

输出格式

控制台输出

人类可读的markdown报告,包含:
  • IP和网络信息
  • DNS记录摘要
  • WHOIS详情
  • 内容统计
  • SEO评分和问题
  • 第三方指标

JSON导出

{
  "scan_info": {
    "url": "https://example.com",
    "domain": "example.com",
    "scan_date": "2026-04-02T10:00:00"
  },
  "ip_info": {
    ...
  },
  "dns_info": {
    ...
  },
  "whois_info": {
    ...
  },
  "content_analysis": {
    ...
  },
  "seo": {
    ...
  },
  ...
}

Markdown导出

格式化的报告,适合文档或分享使用。

示例

示例1:快速扫描

python3 scripts/scan.py hugogu.cn

输出包括:

  • IP地址和位置
  • DNS配置
  • WHOIS注册信息
  • 首页SEO分析

示例2:完整审计

python3 scripts/scan.py hugogu.cn --deep --max-pages 20 \
  --output audit.json --markdown audit.md

执行全面分析,包括:

  • 所有网络信息
  • 深度页面爬取
  • SEO审计
  • 结构化数据提取
  • 完整报告导出

限制说明

  • 速率限制:某些查询(WHOIS、DNS)可能有速率限制
  • JavaScript渲染:基本扫描不执行JS(使用--deep配合Playwright)
  • 第三方API:流量估算需要付费API密钥
  • Google索引:仅为近似值(抓取搜索结果)

故障排除

"dig command not found"

# Ubuntu/Debian
sudo apt-get install dnsutils

# macOS brew install bind

# CentOS/RHEL sudo yum install bind-utils

"whois command not found"

# Ubuntu/Debian
sudo apt-get install whois

# macOS brew install whois

DNS解析失败

检查域名是否可访问:
nslookup example.com
dig example.com

架构

┌─────────────────┐
│ WebsiteScanner │
└────────┬────────┘
         │
┌────┴────┬──────────┬──────────┐
│         │          │          │
┌───▼───┐ ┌──▼────┐ ┌───▼───┐ ┌──▼────┐
│  IP   │ │  DNS  │ │WHOIS  │ │Content│
│Analyzer│ │Analyzer│ │Analyzer│ │Analyzer│
└───────┘ └───────┘ └───────┘ └───────┘
         │
┌────────┼────────┐
│        │        │
┌───▼───┐ ┌─▼────┐ ┌─▼────┐
│  SEO  │ │ JSON │ │ Deep │
│Analyzer│ │ -LD  │ │ Scan │
└───────┘ └──────┘ └──────┘

与OpenClaw集成

此技能可以从OpenClaw调用,用于:

  • 扫描竞争对手网站
  • 审计您自己的网站
  • 研究域名基础设施
  • 生成技术文档

示例OpenClaw工作流:

用户:“扫描hugogu.cn并告诉我其基础设施情况”
→ 运行扫描器
→ 分析结果
→ 生成摘要
数据来源:ClawHub ↗ · 中文优化:龙虾技能库
OpenClaw 技能定制 / 插件定制 / 私有工作流定制

免费技能或插件可能存在安全风险,如需更匹配、更安全的方案,建议联系付费定制

了解定制服务