Document Pro

Name: Document Pro
Rating: 14

v1.0.0

文档处理技能 - 让 AI 能够读取、解析、提取 PDF、DOCX、PPT 等文档的关键信息。当用户要求分析文档、提取内容、总结报告时触发此技能。

14· 1.2万·0 当前·0 累计

by @jackeven02 (Jackeven02)·MIT-0

AI模型访问

使用场景：使用Document Pro进行AI模型访问使用Document Pro

下载技能包

License

MIT-0

License

MIT-0

可自由使用、修改和再分发，无需署名。

查看条款 ↗

运行时依赖

无特殊依赖

安装命令

点击复制

官方npx clawhub@latest install document-pro

镜像加速npx clawhub@latest install document-pro --registry https://cn.longxiaskill.com 镜像可用

本土化适配说明

Document Pro 安装说明：安装命令：["openclaw skills install document-pro"] 支持国内镜像加速，使用 --registry https://cn.longxiaskill.com 参数可加速下载

需要定制？告诉我你的需求 →

技能文档

Document Pro - 文档处理技能概述

赋予 AI 强大的文档处理能力：

PDF 读取与提取 Word 文档解析 PowerPoint 提取 Excel 数据提取文档格式转换触发场景用户发送文档并要求"分析"、"总结" 用户要求"提取文档内容" 用户要求"转换成 PDF" 用户询问文档中的具体信息用户要求"从报告/论文中提取要点" 支持的格式格式读取写入工具 PDF ✅ ✅ pdfplumber, PyPDF2 DOCX ✅ ✅ python-docx PPTX ✅ ❌ python-pptx XLSX ✅ ✅ openpyxl TXT ✅ ✅ 内置 Markdown ✅ ✅ 内置工具使用 PDF 处理 # 提取文本导入 pdfplumber

with pdfplumber.open("document.pdf") as pdf: for page in pdf.pages: text = page.提取_text() print(text)

# 提取表格 with pdfplumber.open("document.pdf") as pdf: table = pdf.pages[0].提取_tables()

Word 文档 from docx 导入 Document

doc = Document("document.docx") for para in doc.paragraphs: print(para.text)

# 提取表格 for table in doc.tables: for row in table.rows: print([cell.text for cell in row.cells])

PowerPoint from pptx 导入 Presentation

prs = Presentation("presentation.pptx") for slide in prs.slides: for shape in slide.shapes: if shape.has_text_frame: print(shape.text)

工作流

识别文档类型 → 选择正确的工具
读取内容 → 提取文本、表格、图片
分析信息 → 理解结构、提取要点
总结呈现 → 用中文总结给用户

进阶功能文档摘要提取文档主要观点生成简短摘要列出关键要点表格处理识别表格结构提取表格数据转换为 CSV/Excel 关键词提取找出重要名词/术语识别主题提取关键信息输出格式

向用户呈现文档时：

文档类型和页数主要内容摘要关键要点（3-5条）建议的后续操作限制扫描版 PDF 需要 OCR 复杂格式可能丢失图片/图表无法完全理解

License

运行时依赖

安装命令

本土化适配说明

技能文档

相关技能推荐