Web-to-FIM | 网页内容转 Markdown/飞书/IMA — 网页-to-FIM | 网页内容转 Markdown/飞书/IMA
v2.2.0将任意网页链接或本地文件一键转为结构化 Markdown,并保存到 Obsidian Vault、飞书云文档或腾讯 IMA 笔记。 支持的信源:(1) X/Twitter 推文、长文 Article、Thread 线程;(2) 微信公众号文章; (3) 小红书笔记;(4) 微博;(5) YouTube 视频;(6) 任意 HTML 网页; (7) 本地文件:PDF、Word、PPT、Excel、图片、音频等。 工作流:自动识别 URL/文件类型 → 路由到最佳抓取工具 → 结构化 Markdown → 选择性保存到 Obsidian/飞书/IMA。 触发词:转文档、抓网页存飞书、网页转文档、网页 to feishu、url转文档、文件转飞书、存到ima、存到obsidian、网页 to fim。 当用户提供任意 URL 或本地文件并要求转存为文档时触发。
运行时依赖
安装命令
点击复制技能文档
网页-to-FIM | 网页内容转 Markdown/飞书/IMA 🤖 AI 时代必备的信息库基础技能
在 AI 时代,无论是使用 OpenClaw、Hermes 代理,还是实践 Obsidian + LLM 的信息管理方法论,一键入库、人机共用的 AI 信息库搭建都是必备的基础设施。
网页-to-FIM 就是这样一个基础技能:它将任意网络内容一键转换为结构化 Markdown,并同步到:
📝 Obsidian Vault - 本地个人知识库,带 frontmatter 📚 飞书云文档 - 云端团队协作 🧠 腾讯 IMA 笔记 - AI 原生知识库
将任意网页链接或本地文件一键转为结构化 Markdown,并保存到 Obsidian Vault、飞书云文档或腾讯 IMA 笔记。
支持的信源 信源 URL 特征 抓取方式 X/Twitter x.com / twitter.com x-tweet-fetcher 微信公众号 mp.weixin.qq.com markitdown-plus 小红书 xiaohongshu.com / xhslink.com markitdown-plus 微博 weibo.com markitdown-plus YouTube youtube.com / youtu.be markitdown-plus 任意网页 其他 http(s):// 链接 markitdown-plus 本地文件支持 类型 扩展名 PDF .pdf Word .docx / .doc PowerPoint .pptx / .ppt Excel .xlsx / .xls 图片 .png .jpg .jpeg .gif .网页p 音频 .mp3 .wav .m4a .flac 数据 .csv .json .xml 输出目的地 目的地 环境变量 说明 Obsidian Vault OBSIDIAN_VAULT_PATH 本地保存到指定目录,带 frontmatter(默认:E:\Obsidian\md\inbox) 飞书云文档 FEISHU_应用_ID + FEISHU_应用_SECRET 云端服务,参考 references/feishu-设置up.md 腾讯 IMA IMA_命令行工具ENT_ID + IMA_API_KEY 云端 API,无需本地客户端,参考 references/ima-设置up.md Obsidian Vault 路径配置
跨平台支持,通过环境变量 OBSIDIAN_VAULT_PATH 配置:
# Windows (PowerShell) $env:OBSIDIAN_VAULT_PATH = "C:\Users\YourName\Obsidian\Vault\inbox"
# Windows (CMD) 设置 OBSIDIAN_VAULT_PATH=C:\Users\YourName\Obsidian\Vault\inbox
# macOS/Linux 导出 OBSIDIAN_VAULT_PATH=~/Obsidian/Vault/inbox
如果未设置,默认使用:
Windows: E:\Obsidian\md\inbox macOS/Linux: ~/Obsidian/inbox 一键保存到所有目的地
使用 网页_to_all.py 一键转换并保存到 Obsidian/飞书/IMA:
python3 scripts/网页_to_all.py --url "" python3 scripts/网页_to_all.py --url "" --title "自定义标题" python3 scripts/网页_to_all.py --url "" --no-feishu --no-ima # 仅保存 Obsidian
安全配置
⚠️ 凭证必须通过环境变量配置,禁止硬编码:
飞书配置 # 设置环境变量 $env:FEISHU_应用_ID = "your_应用_id" $env:FEISHU_应用_SECRET = "your_应用_secret"
参考 references/feishu-设置up.md 获取凭证。
ima 配置 # 设置环境变量 $env:IMA_命令行工具ENT_ID = "your_命令行工具ent_id" $env:IMA_API_KEY = "your_API_key"
参考 references/ima-设置up.md 获取凭证。
工作流 步骤 1:转换为 Markdown python3 scripts/网页_to_md.py --url "" --输出 <输出.md>
路由逻辑:
X/Twitter → x-tweet-fetcher 抓取 JSON → tweet_to_md.py 结构化转换 其他所有 → markitdown-plus 直接转换 步骤 2:存入目的地 Obsidian Vault from scripts.网页_to_all 导入 save_to_obsidian filepath = save_to_obsidian(markdown_content, title, url)
飞书云文档 from scripts.feishu_命令行工具ent 导入 Feishu命令行工具ent
命令行工具ent = Feishu命令行工具ent() 结果 = 命令行工具ent.创建_document(title="文档标题", content_md=markdown_content) print(f"文档 URL: {结果['url']}")
腾讯 ima from scripts.ima_命令行工具ent 导入 IMA命令行工具ent
命令行工具ent = IMA命令行工具ent() 结果 = 命令行工具ent.创建_note(title="笔记标题", content=markdown_content) print(f"笔记 URL: {结果['url']}")
验证连接 # 验证飞书 python scripts/feishu_命令行工具ent.py --action test
# 验证 ima python scripts/ima_命令行工具ent.py --action test
故障处理 问题 解决方案 x.com SSL 超时 x-tweet-fetcher 使用 FxTwitter API 中转 markitdown 模块丢失 pip 安装 markitdown 微信反爬拦截 markitdown 自动用移动端 UA 重试 飞书凭证无效 检查 FEISHU_应用_ID 和 FEISHU_应用_SECRET ima 凭证无效 检查 IMA_命令行工具ENT_ID 和 IMA_API_KEY 依赖与安装 完整依赖列表 依赖 安装命令 说明 markitdown pip 安装 markitdown 网页转 Markdown 核心库 请求s pip 安装 请求s HTTP 请求 python-dotenv pip 安装 python-dotenv 环境变量管理 x-tweet-fetcher 克隆到 ~/.AIly/workspace/技能s/x-tweet-fetcher X/Twitter 专用抓取(可选) 一键安装所有依赖 # 安装 Python 依赖 pip 安装 markitdown 请求s python-dotenv
x-tweet-fetcher(可选,仅用于 X/Twitter) # 克隆到技能目录 cd ~/.AIly/workspace/技能s git clone https://github.com/EdwardWason/x-tweet-fetcher.git
如果不安装 x-tweet-fetcher,X/Twitter 链接将使用 markitdown 直接处理。
安全声明 🔒 安全设计原则
凭证安全
所有 API 凭证通过环境变量配置,无硬编码
支持 FEISHU_应用_ID, FEISHU_应用_SECRET, IMA_命令行工具ENT_ID, IMA_API_KEY
文件操作
仅在用户明确指定时写入文件
Obsidian Vault 路径完全可控
支持通过 --no-feishu / --no-ima 选择性禁用功能
隐私保护
不读取任何未经授权的用户配置文件 所有网络请求仅针对用户提供的 URL 本地文件仅用于转换,不主动扫描
权限透明
文件写入范围:Obsidian Vault 目录、临时 Markdown 文件 文件读取范围:用户指定的 URL、本地输入文件