📝 OCR Local V2 — 本地图像文本识别(支持中英)
v1.0.0使用 Tesseract.js 实现 100% 本地图像文本识别,无需 API 密钥。支持简体中文、繁体中文和英文。首次运行下载语言模型数据(约每语言 20MB),后续运行使用本地缓存。支持语言选择和 JSON 输出。
详细分析 ▾
运行时依赖
版本
- 首次发布 ocr-local 技能,使用 Tesseract.js 进行 OCR。 - 100% 本地从图像提取文本,无需 API 密钥。 - 支持简体中文、繁体中文和英文。 - 提供语言选择和 JSON 输出选项。 - 首次运行下载语言数据;后续运行使用缓存文件。
安装命令
点击复制技能文档
# OCR - 图像文本识别(本地)
使用 Tesseract.js 实现图像文本识别。 100% 本地运行,无需 API 密钥。 支持中文和英文。
## 快速开始
``bash
node {baseDir}/scripts/ocr.js /path/to/image.jpg
node {baseDir}/scripts/ocr.js /path/to/image.png --lang chi_sim
node {baseDir}/scripts/ocr.js /path/to/image.jpg --lang chi_tra+eng
`
## 选项
- --lang :语言代码(默认:chi_sim+eng)
- chi_sim - 简体中文
- chi_tra - 繁体中文
- eng - 英文
- 结合使用 +:chi_sim+eng
- --json:以 JSON 格式输出而非纯文本
## 示例
`bash
# 识别中文截图
node {baseDir}/scripts/ocr.js screenshot.png
# 识别英文文档
node {baseDir}/scripts/ocr.js document.jpg --lang eng
# 混合中文 + 英文
node {baseDir}/scripts/ocr.js mixed.png --lang chi_sim+eng
``
## 注意事项
- 首次运行下载语言数据(约每语言 20MB)
- 后续运行使用本地缓存
- 适用于清晰、高对比度的图像
- 手写体文本的识别准确度可能有所不同