微信公众号文章导出

Name: 微信公众号文章导出
Rating: 4

v1.0.0

将微信公众号文章导出为 Markdown 格式。当用户提供微信公众号链接 (mp.weixin.qq.com) 或要求下载/导出/保存微信文章时触发。默认保存到工作空间的 source 目录。

4· 1.4k·0 当前·0 累计

by @8421bit·Downloads

微信生态即时通讯内容创作

使用场景：发微信消息管理微信联系人微信支付微信机器人管理公众号发布公众号文章

下载技能包项目主页

License

Downloads

License

Downloads

请查看许可证条款了解详情。

查看条款 ↗

运行时依赖

无特殊依赖

安装命令

点击复制

官方npx clawhub@latest install wechat-article-reader

镜像加速npx clawhub@latest install wechat-article-reader --registry https://cn.longxiaskill.com 镜像可用

本土化适配说明

微信公众号文章导出安装说明：安装命令：["openclaw skills install wechat-article-reader"] 支持国内镜像加速，使用 --registry https://cn.longxiaskill.com 参数可加速下载该技能用于微信、公众号相关操作，可能需要相应的平台账号或API密钥

需要定制？告诉我你的需求 →

技能文档

微信公众号文章导出技能 (WeChat-Article-Reader) 触发条件

当以下情况时触发此技能：

用户提供微信公众号文章链接 (mp.weixin.qq.com) 用户要求"下载"、"导出"或"保存"微信文章用户要求将微信文章转换为 Markdown 用户提到"公众号文章"、"微信文章"、"下载微信"、"导出公众号"

触发示例：

"下载这篇文章 https://mp.weixin.qq.com/s/xxx" "把这篇公众号文章导出为 markdown" "保存微信文章到本地" "帮我保存这篇微信文章" 工作原理

此技能使用 Python 脚本执行以下操作：

获取微信文章 HTML 页面从 Open Graph 元标签提取元数据（标题、作者、发布时间）从 #js_content div 提取正文内容使用 markdownify 将 HTML 转换为 Markdown 保存为带 YAML Front Matter 的 Markdown 文件脚本目录

基础目录：~/.npm-global/lib/node_模块s/OpenClaw/技能s/WeChat-article-reader

脚本位置：scripts/导出.py

安装设置首次安装检查 Python 依赖： python3 -c "导入请求s, bs4, markdownify" 2>/dev/null || echo "需要安装依赖"

如需安装依赖： pip3 安装请求s beautifulsoup4 lxml markdownify

无需配置

此技能开箱即用，无需 API Key 或额外配置。使用带浏览器头部的 HTTP 请求来获取微信文章。

执行步骤

当此技能被触发时，按以下步骤执行：

步骤 1：提取 URL

从用户请求中识别微信文章 URL。有效 URL 以以下开头：

https://mp.weixin.qq.com/s/ https://mp.weixin.qq.com/... 步骤 2：确定输出目录

默认输出目录：~/.OpenClaw/workspace-qiming/source

用户可以指定自定义输出目录。

步骤 3：运行导出脚本 # 如需要则创建输出目录 mkdir -p "$输出_DIR"

# 运行导出脚本 python3 ~/.npm-global/lib/node_模块s/OpenClaw/技能s/WeChat-article-reader/scripts/导出.py "$URL" "$输出_DIR"

步骤 4：报告结果

告知用户：

成功或失败状态输出文件路径文章标题和元数据任何错误或警告命令示例 # 基本导出 python3 ~/.npm-global/lib/node_模块s/OpenClaw/技能s/WeChat-article-reader/scripts/导出.py "https://mp.weixin.qq.com/s/xxx" ~/.OpenClaw/workspace-qiming/source

# 指定自定义输出目录 python3 ~/.npm-global/lib/node_模块s/OpenClaw/技能s/WeChat-article-reader/scripts/导出.py "$URL" "/path/to/输出"

输出格式

导出的 Markdown 文件包含：

title: 文章标题 author: 作者名称 publish_time: 发布时间 source_url: 原文链接导出ed_at: 导出时间戳 description: 文章描述

# 文章标题

原文链接: URL

作者: XXX 发布时间: XXX

-----

文章正文内容...

文件命名

生成的文件遵循格式：YYYYMMDD_HHMMSS_文章标题.md

标题中的特殊字符会被清理以确保文件系统兼容性。

常见问题与限制常见问题问题原因解决方案 "无法找到文章正文内容" 文章需要登录或已被删除尝试在浏览器中打开，或使用浏览器工具连接超时网络问题或限流等待后重试，检查网络连接编码问题特殊字符脚本自动处理 UTF-8 已知限制需要登录的文章：部分文章需要微信登录才能查看反爬虫：微信有反机器人措施，可能阻止频繁请求图片：不下载文章图片，仅保存 Markdown 文本复杂格式：可能无法完全保留所有格式依赖项包名版本用途请求s >=2.31.0 HTTP 请求 beautifulsoup4 >=4.12.0 HTML 解析 lxml >=4.9.0 XML/HTML 解析器 markdownify >=0.11.6 HTML 转 Markdown 错误处理

脚本会：

打印清晰的中文错误信息使用正确的状态码退出优雅处理缺失的依赖处理前验证 URL 格式来源

基于 wechat-article-导出项目：

GitHub: https://github.com/wechat-article/wechat-article-导出er 本技能由启明创建开源协议

MIT License

License

运行时依赖

安装命令

本土化适配说明

技能文档

相关技能推荐