首页龙虾技能列表 › 妈妈网爬虫 — 妈妈网育儿知识爬虫(PC端)

妈妈网爬虫 — 妈妈网育儿知识爬虫(PC端)

v1.1.0

爬取妈妈网(www.mama.cn)育儿文章,输出 Markdown 格式并存入御知库(~/.yuzhi/crawls/mama_cn/)。支持按分类或关键词搜索,使用 PC 端 User-Agent。

0· 81·0 当前·0 累计
by @zton100·MIT-0
下载技能包
License
MIT-0
最后更新
2026/3/28
安全扫描
VirusTotal
可疑
查看报告
OpenClaw
安全
medium confidence
技能代码与描述基本一致,爬取妈妈网文章存入指定目录,无第三方数据发送。但存在未声明的依赖(curl)、禁用 SSL 验证以及未遵守 robots.txt/速率限制的问题。
评估建议
技能功能如声称,但注意:未声明的 curl 依赖、禁用 SSL 证书验证(增加中间人攻击风险)、未遵守网站政策。大量抓取前请确认网站条款,考虑安全性和合规性。
详细分析 ▾
用途与能力
技能功能与描述一致,抓取文章转换为 Markdown 存储,无额外权限请求,但依赖未声明的 curl。
指令范围
脚本仅访问妈妈网,写入本地目录,但未验证 SSL 证书,未遵守 robots.txt,存在合规和安全风险。
安装机制
无安装风险,但依赖系统的 curl,如果未安装 curl,脚本将失败。
凭证需求
不请求任何凭据,写入仅限本地目录,安全。
持久化与权限
默认不强制包含,仅在运行时写入自己的目录,权限适当。
安全有层次,运行前请审查代码。

License

MIT-0

可自由使用、修改和再分发,无需署名。

运行时依赖

无特殊依赖

版本

latestv1.1.02026/3/28

切换至妈妈网 PC 端、统一用词、细化命令、更新安全措施。

● 可疑

安装命令 点击复制

官方npx clawhub@latest install mama-crawler
镜像加速npx clawhub@latest install mama-crawler --registry https://cn.clawhub-mirror.com

技能文档

命令

python3 scripts/mama_crawler.py --category <分类> --max-pages <页数> --max-articles <数量>

按分类爬取妈妈网文章(PC端)。 分类选项:
  • baby — 亲子
  • yingyang — 营养
  • disease — 疾病
  • lady — 女性
  • yongpin — 用品
  • life — 生活

python3 scripts/mama_crawler.py --search <关键词> --max-articles <数量>

通过PC端搜索爬取相关文章。

python3 scripts/mama_crawler.py --all --max-pages 3 --max-articles 30

爬取所有分类(慎用,会花较长时间)。

输出

文章保存到 ~/.yuzhi/crawls/mama_cn/<分类名>/ 目录下,每个文章一个 .md 文件,包含标题、来源、日期和正文。

反爬机制

  • 每次请求间隔 2-5 秒随机延迟
  • 使用桌面浏览器 User-Agent
  • 不验证 SSL 证书

技术说明

  • 默认 PC 端(www.mama.cn),结构稳定
  • 文章 URL 格式:https://www.mama.cn/z/art//
  • PC 端分类页面文章较少,建议使用 --search 关键词搜索模式获取更多内容
数据来源:ClawHub ↗ · 中文优化:龙虾技能库
OpenClaw 技能定制 / 插件定制 / 私有工作流定制

免费技能或插件可能存在安全风险,如需更匹配、更安全的方案,建议联系付费定制

了解定制服务