安全扫描
OpenClaw
安全
medium confidence技能代码与描述基本一致,爬取妈妈网文章存入指定目录,无第三方数据发送。但存在未声明的依赖(curl)、禁用 SSL 验证以及未遵守 robots.txt/速率限制的问题。
评估建议
技能功能如声称,但注意:未声明的 curl 依赖、禁用 SSL 证书验证(增加中间人攻击风险)、未遵守网站政策。大量抓取前请确认网站条款,考虑安全性和合规性。详细分析 ▾
✓ 用途与能力
技能功能与描述一致,抓取文章转换为 Markdown 存储,无额外权限请求,但依赖未声明的 curl。
ℹ 指令范围
脚本仅访问妈妈网,写入本地目录,但未验证 SSL 证书,未遵守 robots.txt,存在合规和安全风险。
ℹ 安装机制
无安装风险,但依赖系统的 curl,如果未安装 curl,脚本将失败。
✓ 凭证需求
不请求任何凭据,写入仅限本地目录,安全。
✓ 持久化与权限
默认不强制包含,仅在运行时写入自己的目录,权限适当。
安全有层次,运行前请审查代码。
运行时依赖
无特殊依赖
版本
latestv1.1.02026/3/28
切换至妈妈网 PC 端、统一用词、细化命令、更新安全措施。
● 可疑
安装命令 点击复制
官方npx clawhub@latest install mama-crawler
镜像加速npx clawhub@latest install mama-crawler --registry https://cn.clawhub-mirror.com
技能文档
命令
python3 scripts/mama_crawler.py --category <分类> --max-pages <页数> --max-articles <数量>
按分类爬取妈妈网文章(PC端)。
分类选项:
baby— 亲子yingyang— 营养disease— 疾病lady— 女性yongpin— 用品life— 生活
python3 scripts/mama_crawler.py --search <关键词> --max-articles <数量>
通过PC端搜索爬取相关文章。
python3 scripts/mama_crawler.py --all --max-pages 3 --max-articles 30
爬取所有分类(慎用,会花较长时间)。
输出
文章保存到~/.yuzhi/crawls/mama_cn/<分类名>/ 目录下,每个文章一个 .md 文件,包含标题、来源、日期和正文。
反爬机制
- 每次请求间隔 2-5 秒随机延迟
- 使用桌面浏览器 User-Agent
- 不验证 SSL 证书
技术说明
- 默认 PC 端(www.mama.cn),结构稳定
- 文章 URL 格式:
https://www.mama.cn/z/art// - PC 端分类页面文章较少,建议使用
--search关键词搜索模式获取更多内容
数据来源:ClawHub ↗ · 中文优化:龙虾技能库
OpenClaw 技能定制 / 插件定制 / 私有工作流定制
免费技能或插件可能存在安全风险,如需更匹配、更安全的方案,建议联系付费定制