龙虾技能库

技能插件模型教程下载加速定制

技能插件模型教程下载加速定制

加载中…

Token供应商

ToAPIs · 量大好价

新手入门下载 OpenClaw 技能/插件定制服务常见问题加速服务

邮箱：longxiaskill@qq.com ｜ AI 智能体可直接发送定制需求到邮箱

免责声明 | 隐私政策 | 鄂ICP备19007528号

龙虾技能库 — OpenClaw 中文 AI 资源库 | 免费资源 + 付费定制

© 2026 龙虾技能库

首页 › 技能 › pdf-ocr-layout

pdf-ocr-layout

v1.0.2

基于智谱 GLM-OCR、GLM-4.7 及 GLM-4.6V 的多模态文档深度解析工具。 Use when: - 需要高精度提取文档（PDF/图片）中的表格并转换为 Markdown 格式 - 需要从文档页面中自动裁剪并提取插图、图表为独立文件 - 需要对提取的图表进行深度语义理解（基于 GLM-4.6V 视觉分析） - 需要对提取的表格数据进行逻辑分析（基于 GLM-4.7 文本分析）核心架构： 1. 视觉提取：GLM-OCR 2. 语义理解：GLM-4.7 (纯文本/表格) + GLM-4.6V (多模态/图像)

1· 1.8k·0 当前·0 累计

by @baokui·MIT-0

文档工具文件处理

下载技能包

License

MIT-0

License

MIT-0

可自由使用、修改和再分发，无需署名。

查看条款 ↗

运行时依赖

无特殊依赖

安装命令

点击复制

官方npx clawhub@latest install pdf-ocr-layout

镜像加速npx clawhub@latest install pdf-ocr-layout --registry https://cn.longxiaskill.com 镜像可用

需要定制？告诉我你的需求 →

相关技能推荐

Gog — Google Workspace CLI — Gog工具

Gog 是一个 Google Workspace 的命令行接口（CLI），支持 Gmail、日历、Drive、联系人、表格和文档的操作。它允许用户通过命令行管理 Google 服务，包括发送邮件、创建事件、文件管理等。需要配置 OAuth 凭据以授权访问。

Obsidian — 笔记库自动化

通过 obsidian-cli 操作 Obsidian 笔记库（纯 Markdown 笔记），支持创建、移动、删除笔记等自动化操作。

OpenAI Whisper — 本地语音转文本

使用 OpenAI Whisper 的 CLI 实现本地语音转文本功能，无需 API 密钥。支持通过 Homebrew 安装，仅依赖本地 `whisper` 二进制文件，适用于开发者快速转换音频文件。

Gifgrep — GIF搜索下载

命令行/TUI 一站式搜索 GIF 图库，支持批量下载、提取静帧与精灵图，方便素材快速收集与二次创作。

OpenAI Whisper API — 语音转写

通过 OpenAI Audio Transcriptions API（Whisper）转录音频文件，需要 OPENAI_API_KEY。

Baidu Search — 百度AI搜索

使用百度 AI 搜索引擎（BDSE）进行网页搜索，适用于实时信息、文档查找或研究主题。

数据来源：ClawHub ↗ · 中文优化：龙虾技能库