首页龙虾技能列表 › Ocr Pro — 专业级PDF和图像OCR

Ocr Pro — 专业级PDF和图像OCR

v?

利用MinerU提供专业级OCR服务,支持PDF和图像。通过集成VLM(视觉语言模型),能够高精度识别复杂布局和混合内容的文本,适用于需要高准确率文本识别的开发场景。

0· 122·0 当前·0 累计

运行时依赖

无特殊依赖

安装命令 点击复制

官方clawhub install ocr-pro
镜像加速clawhub install ocr-pro --registry https://cn.clawhub-mirror.com

技能文档

概述

Ocr Pro 为您提供专业级的 PDF 和图像 OCR 服务,通过 MinerU 和 VLM 支持高精度文本识别。

使用场景

  • 高精度文本识别:适用于需要高准确率的文本识别任务。
  • 复杂布局处理:通过 VLM,能够有效识别复杂布局和混合内容的文本。

快速开始

# 示例命令,实际命令根据技能提供的API或工具而定
ocr-pro-recognize -i input.pdf -o output.txt

高级用法

启用 VLM 支持

ocr-pro-recognize -i complex_layout.pdf -o output.txt --enable-vlm


# 以下为原有 YAML frontmatter,不翻译 layout: skill slug: ocr-pro

数据来源:ClawHub ↗ · 中文优化:龙虾技能库
OpenClaw 技能定制 / 插件定制 / 私有工作流定制

免费技能或插件可能存在安全风险,如需更匹配、更安全的方案,建议联系付费定制

了解定制服务