飞书文档智能转换Markdown — 飞书文档支持将文档智能转换为Markdown格式。
v1.0.0智能转换飞书文档为高可用Markdown格式,自动处理私有资源、无效占位符、冗余引用,生成多版本满足不同场景需求。 可以更简洁地翻译为: 智能转换飞书文档为高可用Markdown格式,自动处理私有资源、无效占位符和冗余引用,满足不同场景需求。
运行时依赖
安装命令
点击复制本土化适配说明
飞书文档智能转换Markdown — 飞书文档支持将文档智能转换为Markdown格式。 安装说明: 安装命令:["openclaw skills install feishu-doc-to-markdown"] 该技能用于飞书相关操作,可能需要相应的平台账号或API密钥
技能文档
技能:飞书文档智能转换Markdown 技能描述:自动将飞书文档转换为高可用、高信息密度的Markdown文档,智能处理飞书私有资源、无效占位符、冗余引用,生成不同纯净度的版本满足不同场景需求。
适用场景: 飞书文档归档存储 飞书内容导入知识库 提取飞书文档核心信息 批量转换飞书文档为通用格式 飞书内容知识蒸馏
核心能力: ✅ 多版本输出:支持3种不同处理等级的版本,满足不同需求 ✅ 智能内容提取:自动识别图片、图表、白板、表格等非文本内容的核心信息,转换为结构化文本 ✅ 冗余自动清理:自动移除无效占位符、无法访问的内部引用、重复内容、无意义标签 ✅ 自动分类归档:转换后的文档自动按「日期/项目」分类保存到原始资源库 ✅ 知识自动关联:自动提取核心要点,关联到对应项目/领域标签,纳入知识库
处理流程: 内容获取:通过飞书API获取完整的文档原始内容和元信息 元信息识别:自动识别文档所属项目、领域、类型,生成分类标签 多版本处理:按照3种等级分别处理生成对应版本 自动归档:所有版本自动保存到raw_sources/YYYY-MM-DD/[项目名称]/目录下 知识入库:在LEARNINGS.md中记录文档摘要、核心要点、关联文件路径,纳入知识体系
版本处理规则: 版本1:原始备份版 处理规则:不做任何修改,完整保留所有原始内容和格式 保留内容:所有文本、飞书私有标签( 、、等)、格式标记 用途:作为原始凭证永久留存,确保可追溯,不对外提供
版本2:纯文本增强版 处理规则:移除所有无效资源占位标签(图片、白板、文件、视频等嵌入标签) 提取非文本内容的上下文信息、标题、说明文字、数据,转换为结构化文本(要点列表、markdown表格、文字描述等)补充到对应位置 保留可访问的外部链接,移除无法访问的内部引用链接 保留内容:所有有效文本信息、可访问链接、提取的非文本核心信息 用途:完整保留所有有效信息,适合需要完整上下文的场景、需要二次编辑的场景
版本3:最终优化版(默认输出) 处理规则:在纯文本增强版基础上进一步精炼 移除所有无法访问的内部引用、无效链接、冗余说明文字 精简重复内容,优化文档结构,合并相似要点 移除无意义的符号、占位符、格式标记 保留内容:仅保留最核心的有效信息,信息密度最高 用途:适合直接阅读、快速掌握核心要点、知识提炼入库
调用方式: # 基础调用,默认生成最终优化版 feishu_doc_convert <飞书文档链接> # 指定输出版本 feishu_doc_convert <飞书文档链接> --version raw|enhanced|optimized # 指定保存目录 feishu_doc_convert <飞书文档链接> --output <目录路径> # 自动入库到知识库 feishu_doc_convert <飞书文档链接> --sync-to-knowledgebase
最佳实践: 默认对外提供「最终优化版」,同时静默保存另外两个版本归档 特殊需求可根据用户要求调整处理规则(如保留图片、保留所有引用等) 所有转换后的文档必须关联到对应的Project和Domain标签,方便后续检索 核心价值高的文档自动提炼关键经验到知识库的结构化知识层