📝 OCR Local V2 — 本地图像文本识别(支持中英)

v1.0.0

使用 Tesseract.js 实现 100% 本地图像文本识别,无需 API 密钥。支持简体中文、繁体中文和英文。首次运行下载语言模型数据(约每语言 20MB),后续运行使用本地缓存。支持语言选择和 JSON 输出。

0· 555·1 当前·1 累计
15914355527 头像by @15914355527·MIT-0
下载技能包
License
MIT-0
最后更新
2026/3/21
0
安全扫描
VirusTotal
无害
查看报告
OpenClaw
安全
high confidence
该技能的代码、指令和依赖项与本地 Tesseract.js OCR 工具一致,无意外的凭证请求或隐藏的网络端点(仅有预期的语言数据下载)。
评估建议
此技能似乎是一款合法的本地 OCR 工具。安装前请注意:(1) npm 将安装 tesseract.js(检查依赖项/版本)。(2) 首次运行时,Tesseract.js 将从远程主机下载语言训练数据(约每语言 20MB)- 如果需要避免网络请求或控制数据源,请在可以审查或预置训练数据的环境中运行。 (3) 元数据包中 _meta.json 与注册元数据之间存在一个小的所有者/Slug 不匹配 — 可能无害,但如果来源重要,请确认技能源(仓库 URL)。 (4) 如果需要额外的谨慎,请在沙盒中运行;否则,代码直观,只处理您提供的图像。...
详细分析 ▾
用途与能力
名称/描述、package.json、SKILL.md 和 scripts/ocr.js 全部一致:一个基于 Node 的 Tesseract.js OCR 工具,用于中文/英文。所需的二进制文件(node)和 tesseract.js 依赖项都是适当的和预期的。
指令范围
运行时指令和脚本仅读取用户提供的图像路径并产生文本/JSON 输出。SKILL.md 和 README 明确警告:首次运行将下载语言数据(约每语言 20MB)——这意味着为了获取训练数据将有网络活动,这对于 Tesseract.js 是预期的,但这是用户应该了解的外部网络副作用。
安装机制
注册表条目没有正式的安装规范,但 SKILL.md 元数据和 package.json 声明通过 npm 安装 tesseract.js。这是一个标准的安装路径(npm 依赖项)。技能包本身没有任意 URL 下载或存档提取;运行时的训练数据获取由 tesseract.js 执行(预期的)。
凭证需求
该技能不请求环境变量或凭证。它不访问系统配置路径。未发现任何不成比例的秘密或凭证请求。
持久化与权限
always 为 false(默认)。该技能不请求持久的系统范围权限或修改其他技能。它可以由用户调用,也可能由代理调用(这是平台默认设置)。
安全有层次,运行前请审查代码。

License

MIT-0

可自由使用、修改和再分发,无需署名。

运行时依赖

无特殊依赖

版本

latestv1.0.02026/3/21

- 首次发布 ocr-local 技能,使用 Tesseract.js 进行 OCR。 - 100% 本地从图像提取文本,无需 API 密钥。 - 支持简体中文、繁体中文和英文。 - 提供语言选择和 JSON 输出选项。 - 首次运行下载语言数据;后续运行使用缓存文件。

无害

安装命令

点击复制
官方npx clawhub@latest install ocr-local-v2
镜像加速npx clawhub@latest install ocr-local-v2 --registry https://cn.longxiaskill.com

技能文档

# OCR - 图像文本识别(本地) 使用 Tesseract.js 实现图像文本识别。 100% 本地运行,无需 API 密钥。 支持中文和英文。 ## 快速开始 ``bash node {baseDir}/scripts/ocr.js /path/to/image.jpg node {baseDir}/scripts/ocr.js /path/to/image.png --lang chi_sim node {baseDir}/scripts/ocr.js /path/to/image.jpg --lang chi_tra+eng ` ## 选项 - --lang :语言代码(默认:chi_sim+eng) - chi_sim - 简体中文 - chi_tra - 繁体中文 - eng - 英文 - 结合使用 +chi_sim+eng - --json:以 JSON 格式输出而非纯文本 ## 示例 `bash # 识别中文截图 node {baseDir}/scripts/ocr.js screenshot.png # 识别英文文档 node {baseDir}/scripts/ocr.js document.jpg --lang eng # 混合中文 + 英文 node {baseDir}/scripts/ocr.js mixed.png --lang chi_sim+eng `` ## 注意事项 - 首次运行下载语言数据(约每语言 20MB) - 后续运行使用本地缓存 - 适用于清晰、高对比度的图像 - 手写体文本的识别准确度可能有所不同

数据来源ClawHub ↗ · 中文优化:龙虾技能库