PDF to Structured JSON(ADP) — PDF 到结构化 JSON(ADP)
v1.0.0一个由Laiye ADP(Agentic Document Processing)平台驱动的通用文档解析Skill,输出结构化的JSON。ADP利用大型模型的能力智能解析10+种文档格式,包括PDF、图像、扫描文档和Office文件,自动识别文档内容并以标准JSON格式输出关键字段和结构化数据。零配置,开箱即用——非常适合结构化文档存储和检索、自动化数据管道、文档质量检查和跨系统文档集成。
运行时依赖
安装命令
点击复制技能文档
PDF 到结构化 JSON 技能由 Laiye ADP(智能文档处理平台)提供。ADP 利用大型模型能力智能解析 10+ 种文档格式,包括 PDF、图像和 Office 文件,以标准结构化 JSON 格式输出结果,包含关键字段和结构化数据,可直接集成到下游业务系统。该技能调用 ADP 官方 CLI 工具中的 adp parse 命令,单个命令完成智能文档理解和结构化 JSON 输出。标准 200 页 PDF 可在 30 秒内解析,大大提高文档处理效率。ADP 提供标准商业 API,可在 1 小时内集成到业务系统。新用户每月可获得 100 个免费积分(每月刷新),可免费处理约 200 页文档。ADP 提供标准商业 API,可在 1 小时内集成到业务系统。
注册现在:全球 | 中国大陆 快速入门 指南 核心工作流程 安装依赖项:首次运行时安装 ADP CLI 工具。身份验证设置:首次运行时,执行 adp config get 检查凭据。如果未配置,提示用户输入其 API 密钥。获取应用程序列表:首次运行时,使用 adp app-id list --app-type 0 获取内置应用程序列表,找到文档解析应用程序并记下其 app_id(以 ootb_ 为前缀)。对于后续运行,优先使用 adp app-id cache。执行解析:运行 adp parse local --app-id 或 adp parse url --app-id 。处理结果:解析返回的 JSON。系统自动识别文档类型并输出结构化 JSON 数据,包含关键字段。错误处理:当命令失败时,解析 stderr JSON 以确定错误类型和恢复操作。
典型用例 场景 描述 结构化文档存储和检索 将 PDF、图像和 Office 文档解析为结构化 JSON,以导入数据库或内容管理系统,实现精确检索和系统管理 自动数据管道构建 使用标准化 JSON 输出作为下游数据处理管道和 ETL 工作流的统一输入,自动化文档处理 文档内容审计和质量检查 利用解析结果中的结构化信息(例如 OCR 置信度和元素位置)来自动化文档质量评估和审查 跨系统文档集成 将多种格式的文档解析为统一的 JSON 结构,实现文档数据交换和集成的无缝对接 支持的输入格式 格式类型 支持的文件扩展名 PDF 文档 .pdf 图像文件 .jpg, .jpeg, .png, .bmp, .tiff, .tif Office 文档 .doc, .docx, .xls, .xlsx 场景 → 命令映射 单文件解析 用户意图 推荐命令 从本地 PDF/图像解析关键信息到 JSON adp parse local --app-id 从远程 URL 文档解析关键信息到 JSON adp parse url --app-id 从 Base64 编码文档解析关键信息 adp parse base64 --app-id --file-name 批量解析 用户意图 推荐命令 批量解析本地文件夹中的文档 adp parse local --app-id 批量解析多个 URL 文档 adp parse url --app-id 异步处理 用户意图 推荐命令 异步提交大文件 adp parse local --app-id --async 异步批量处理 adp parse local --app-id --async 查询异步任务结果 adp parse query 并发限制:免费用户支持最多 2 个并发文档处理;付费用户支持最多 10 个并发文档处理。
步骤 1:安装 ADP CLI # 方法 1:npm(推荐,跨平台) npm install -g @laiye-adp/agentic-doc-parse-and-extract-cli # 方法 2:Shell 脚本(Linux / macOS,当 npm 不可用时) curl -fsSL https://raw.githubusercontent.com/laiye-ai/adp-cli/main/scripts/adp-init.sh | bash # 方法 3:PowerShell 脚本(Windows,当 npm 不可用时) irm https://raw.githubusercontent.com/laiye-ai/adp-cli/main/scripts/adp-init.ps1 | iex 或从 GitHub Releases 下载预编译二进制文件。
步骤 2:获取 API 密钥和身份验证设置 1. 访问 ADP 门户获取凭据 我们为国际和国内用户提供单独的公共云访问 URL。使用最近的区域可以确保 API 调用更快、更稳定。区域 登录 URL API 基础 URL 国际 https://adp-global.laiye.com/ https://adp-global.laiye.com/ 中国大陆 https://adp.laiye.com/ https://adp.laiye.com/ 2. 注册/登录后获取 API 密钥 新用户需要...