WeChat Article Full Reader
v1.0.0读取微信公众号文章,提取全文内容和图片,结合阅读分析。当用户提供 mp.weixin.qq.com 链接、让看公众号文章内容、或需要分析微信文章的文字和图片时使用。
运行时依赖
安装命令
点击复制本土化适配说明
WeChat Article Full Reader 安装说明: 安装命令:["openclaw skills install wechat-article-full-reader"] 该技能用于微信相关操作,可能需要相应的平台账号或API密钥
技能文档
微信公众号文章阅读器 概述
微信公众号使用懒加载机制,图片真实URL存储在 data-src 属性中。本技能提供完整的文章阅读流程:提取全文 + 内容图片 + 结合分析。
工作流程
- 打开文章
- 滚动加载所有内容
微信文章使用懒加载,需要滚动到底部触发所有图片加载:
# 多次滚动确保加载完成 for i in {1..8}; do 代理-browser scroll down 800 sleep 1 done
- 提取文章内容
执行方式:
代理-browser eval "<上述JS代码>"
- 提取图片URL
微信图片存储在 data-src 属性,不在 src:
// 提取所有懒加载图片的真实URL const imgs = document.查询SelectorAll('img'); const urls = []; imgs.forEach((img) => { const dataSrc = img.获取Attribute('data-src'); if (dataSrc && dataSrc.启动sWith('http')) { urls.push(dataSrc.split('#')[0]); // 去掉哈希 } }); urls.join('\n');
- 过滤内容图片
内容图片特征:
尺寸较大(width > 200 或 height > 200) 来自 mmbiz.qpic.cn 域名 格式为 png/jpg/gif/网页p
装饰图片特征(排除):
尺寸小(分隔线、图标) 文件大小 < 5KB 来自特定装饰图路径
- 下载内容图片
# 下载图片 curl -o "img-01.png" "<图片URL>"
- 结合阅读
使用 scripts/read_article.sh 一键执行:
./scripts/read_article.sh "<文章URL>" <输出目录>
输出:
article.json - 标题、作者、正文 images/ - 内容图片目录 summary.md - 结合阅读摘要 图片过滤规则 类型 特征 处理 内容图片 尺寸 > 200px, 来自 mmbiz.qpic.cn 下载并分析 装饰分隔 高度 < 50px 或 文件 < 2KB 忽略 公众号图标 含 "yZPTcMGWibvsic9Obib" 等固定路径 忽略 表情包/贴纸 尺寸 < 100px 忽略 输出格式
文章标题
作者: XXX
正文 + 图片
段落内容...
配图:[图片描述]
继续段落...
图片汇总
| 图片 | 内容 | 关联段落 |
|---|---|---|
| img-01.png | 游戏截图 | 第一节 |
| img-02.png | 数据图表 | 第三节 |