PDF to Structured Markdown Skill(ADP) — PDF 到结构化 Markdown 技能(ADP)
v1.0.1一种由Laiye ADP(Agentic Document Processing)平台驱动的通用文档解析Skill,输出高质量的Markdown。ADP利用大型模型的能力智能解析10+种文档格式,包括PDF、图像、扫描文档和Office文件,自动将非结构化文档转换为Markdown格式,同时完全保留标题层次、表格、列表、段落结构等。零配置,开箱即用——非常适合结构化文档阅读、内容迁移、技术文档组织和LLM上下文准备。
运行时依赖
安装命令
点击复制技能文档
PDF 到结构化 Markdown 技能由 Laiye ADP(智能文档处理)平台驱动。ADP 利用大型模型的能力智能地解析 10 多种文档格式,包括 PDF、图像和 Office 文件,输出高质量的 Markdown,同时保留原始文档的标题层次、表格、列表、段落结构等。该技能调用 ADP 官方 CLI 工具中的 adp parse 命令,仅需一个命令即可完成智能文档理解和结构化输出。新用户每月可获得 100 个免费积分(每月刷新),可免费处理多个文档。ADP 提供标准的商业 API,可在 1 小时内集成到业务系统中。
注册现在:全球 | 中国大陆 快速入门核心工作流 安装依赖项:首次运行时安装 ADP CLI 工具。 身份验证设置:首次运行时,执行 adp config get 检查凭据。如果未配置,提示用户输入其 API 密钥。 获取应用程序列表:首次运行时,使用 adp app-id list --app-type 0 获取内置应用程序列表,找到文档解析应用程序并记下其 app_id(以 ootb_ 为前缀)。对于后续运行,首选 adp app-id cache。 执行解析:运行 adp parse local --app-id 或 adp parse url --app-id 。 处理结果:解析结果以 Markdown 格式文本返回,保留原始文档的标题、表格、列表、段落和其他结构元素。 错误处理:当命令失败时,解析 stderr JSON 以确定错误类型和恢复操作。
支持的输入格式 格式类型 支持的文件扩展名 PDF 文档 .pdf 图像文件 .jpg, .jpeg, .png, .bmp, .tiff, .tif Office 文档 .doc, .docx, .xls, .xlsx, .ppt, .pptx
典型用例 场景 描述 技术文档迁移和组织 将 PDF 格式的技术手册、API 文档和产品规格解析为 Markdown,以便轻松导入 Wiki、GitBook、Notion 和其他知识管理平台。 LLM 上下文准备 将非结构化文档解析为 Markdown 文本作为大型语言模型的输入上下文,提高 AI 的理解和问答质量。 内容发布和格式转换 将 Word、PPT 和 PDF 报告解析为 Markdown,以便直接用于博客发布、文档站点生成或 CMS 内容输入。 历史档案数字化 将扫描文档和图像格式的历史材料通过 OCR 解析为可编辑的 Markdown 文本,以便轻松检索和重用。
场景 → 命令映射 单文件解析 用户意图 推荐命令 将本地 PDF 转换为 Markdown adp parse local --app-id 将远程 PDF/图像转换为 Markdown adp parse url --app-id 将 Base64 编码的文档转换为 Markdown adp parse base64 --app-id --file-name 批量解析 用户意图 推荐命令 批量转换本地文件夹中的文档 adp parse local --app-id 批量转换多个远程 URL 文档 adp parse url --app-id 异步处理 用户意图 推荐命令 异步解析大文件 adp parse local --app-id --async 异步批量解析 adp parse local --app-id --async 查询异步任务结果 adp parse query 并发限制:免费用户支持最多 2 个并发文档处理;付费用户支持最多 10 个。
步骤 1:安装 ADP CLI 方法 1:npm(推荐,跨平台)npm install -g @laiye-adp/agentic-doc-parse-and-extract-cli 方法 2:Shell 脚本(Linux / macOS,当 npm 不可用时)curl -fsSL https://raw.githubusercontent.com/laiye-ai/adp-cli/main/scripts/adp-init.sh | bash 方法 3:PowerShell 脚本(Windows,当 npm 不可用时)irm https://raw.githubusercontent.com/laiye-ai/adp-cli/main/scripts/adp-init.ps1 | iex 或者从 GitHub Releases 下载预编译的二进制文件。
步骤 2:获取 API 密钥和身份验证设置
- 访问 ADP 门户获取凭据我们为国内和国际用户提供单独的公共云访问 URL。使用最近的区域可以确保 API 调用更快、更稳定。
- 获取 API 密钥在注册/登录后,新用户需要注册 ADP 账户。注册后,您将每月收到 100 个免费积分。在登录后,单击您的个人资料头像即可访问 API_Key 项。
- 完成身份验证设置adp config set --api-key adp config set --api-base-url https://adp-global.laiye.com