微信公众号文章抓取

v1.1.1

在搜狗微信搜索指定关键词，抓取相关文章（标题、摘要、发布日期、来源公众号），生成PDF报告。触发场景：用户要求"搜索微信文章关键字数量"

0· 447·0 当前·0 累计

by @strugglejia (StruggleJia)·MIT-0

微信生态即时通讯内容创作

使用场景：发微信消息管理微信联系人微信支付微信机器人管理公众号发布公众号文章

下载技能包

License

MIT-0

License

MIT-0

可自由使用、修改和再分发，无需署名。

查看条款 ↗

运行时依赖

无特殊依赖

安装命令

点击复制

官方npx clawhub@latest install wechat-article-scraper

镜像加速npx clawhub@latest install wechat-article-scraper --registry https://cn.longxiaskill.com 镜像可用

本土化适配说明

微信公众号文章抓取安装说明：安装命令：["openclaw skills install wechat-article-scraper"] 该技能用于微信、公众号相关操作，可能需要相应的平台账号或API密钥

需要定制？告诉我你的需求 →

技能文档

微信公众号文章抓取功能概述

通过搜狗微信搜索指定关键词，抓取最新文章，生成带本地PDF的行业报告。

触发方式

用户说：

"搜索微信文章脑机接口" "搜索微信文章人工智能 5" "搜索微信文章光伏 10" 完整工作流程第1步：搜索文章 cd ~/.OpenClaw/workspace python3 ~/.OpenClaw/workspace/技能s/wechat-article-抓取器/scripts/wechat_搜索.py <关键词> [数量]

输出：articles.json 包含字段：title, text, url, date, source 默认搜索90天内文章第2步：生成摘要（聊天窗口）

⚠️ 重要：summary必须在聊天窗口用当前会话模型生成！

读取 articles.json 中的文章用当前模型逐篇生成100-200字摘要写入 articles_new.json（包含title, text, url, date, source, summary字段）第3步：抓取原文PDF cd ~/.OpenClaw/workspace python3 ~/.OpenClaw/workspace/技能s/wechat-article-抓取器/scripts/wechat_fetch.py <关键词>

输出：wechat_pages/ 目录下的PDF文件每篇文章保存为独立的PDF，保留完整样式第4步：生成行业报告 cd ~/.OpenClaw/workspace python3 ~/.OpenClaw/workspace/技能s/wechat-article-抓取器/scripts/wechat_pdf.py <关键词>

输出：<关键词>_行业动态.pdf

报告包含：

标题、日期行业动态精选（每篇文章）：文章标题来源公众号 | 发布日期摘要（LLM生成，100-200字）链接1：微信原文（有时效限制） → 原始微信文章链接链接2：点我看原文(PDF) → 本地PDF文件脚本说明 scripts/wechat_搜索.py 输入：关键词、数量（默认10）输出：articles.json 功能：使用 Playwright 访问搜狗微信搜索，解析搜索结果并抓取文章正文 scripts/wechat_fetch.py 输入：关键词输出：wechat_pages/*.pdf 功能：读取 articles_new.json，抓取每篇文章原文保存为PDF scripts/wechat_pdf.py 输入：关键词输出：<关键词>_行业动态.pdf 功能：读取 articles_new.json，生成带双链接的行业报告PDF 依赖 # 安装 Python 依赖 pip 安装 playwright 请求s

# 安装 Playwright 浏览器 playwright 安装 chromium

注意事项摘要必须用LLM生成 - 不能在pdf.py中自动生成链接格式 - 微信原文（有时效限制）+ 点我看原文(PDF) 日期过滤 - 目前默认搜索90天内文章，暂无14天过滤选项

License

运行时依赖

安装命令

本土化适配说明

技能文档

相关技能推荐