image-reader-xytest — 本地OCR识图

v1.0.0

调用OCR.space免费接口，一键识别本地图片中的中英混合文字，自动生成同名txt结果，支持CLI，仅需Python3与Pillow。

0· 145·0 当前·0 累计

by @xytest

数据与API AI模型访问

使用场景：使用image-reader-xytest — 本地OCR识图进行数据与API使用image-reader-xytest — 本地OCR识图

下载技能包

最后更新

2026/3/25

安全扫描

VirusTotal

无害

查看报告

OpenClaw

安全

high confidence

该技能的代码与说明均围绕“通过OCR.space对本地图片进行OCR”展开；文件未请求无关密钥或安装意外组件，但会将图片数据发送至第三方API并把结果写入磁盘。

评估建议

该技能内部逻辑与其目的相符。安装前请考虑：1) 隐私——图片会上传至第三方服务api.ocr.space，请勿发送敏感图像；2) 输出文件——识别结果以<image_name>_ocr.txt保存在技能scripts目录，需检查写入权限；3) API密钥——脚本使用公开演示密钥'helloworld'（额度有限），生产环境请替换为自己的OCR.space密钥，并改为从环境变量读取，避免硬编码；4) 依赖——确保已安装Python 3与Pillow。如需更高安全保障，可审查/修改脚本，避免发送敏感图像或改用本地OCR方案。...

详细分析 ▾

✓ 用途与能力

名称/描述（使用OCR.space进行本地OCR）与所含Python脚本及SKILL.md一致。脚本执行图片缩放、base64编码并发送至api.ocr.space，符合该功能预期。

ℹ 指令范围

指令仅运行所提供脚本处理本地图片路径，并依赖Pillow；不会读取无关文件或环境变量。注意：脚本会将图片内容发送至第三方端点OCR.space，并在技能scripts目录写入识别文本，用户应知晓相关隐私行为。

✓ 安装机制

无安装规范；本技能仅含指令，需用户自备Python与Pillow（pip安装）。安装器不会下载或写入任何内容。

✓ 凭证需求

未请求环境变量或凭证。脚本硬编码OCR.space公开演示密钥'helloworld'，符合演示用途但额度有限且非敏感信息；未发现无关凭证。

✓ 持久化与权限

技能未请求常驻/始终运行，也未修改其他技能或系统级设置。仅在自身scripts目录写入输出文件，符合本地OCR助手预期。

安全有层次，运行前请审查代码。

运行时依赖

无特殊依赖

版本

latestv1.0.02026/3/25

- 首次发布image-reader技能。 - 使用免费OCR.space API识别本地图片内容（含中文）。 - 附带Python脚本，用于提交图片并返回提取文本。 - 简易CLI用法；需Python 3与Pillow。

● 无害

安装命令

点击复制

官方npx clawhub@latest install image-reader-xytest

镜像加速npx clawhub@latest install image-reader-xytest --registry https://cn.longxiaskill.com 镜像可用

本土化适配说明

image-reader-xytest — 本地OCR识图安装说明：安装命令：npx clawhub@latest install image-reader-xytest

需要定制？告诉我你的需求 →

技能文档

# image-reader Skill 识别本地图片内容（支持中文），通过 OCR.space 免费 API 实现。 ## 工作流程 1. 接收图片路径 2. 调用 OCR.space API 进行识别 3. 返回识别结果 ## Python 脚本保存到 {skill_root}/scripts/ocr_image.py： ``python import urllib.request, urllib.parse, base64, io, json, sys from PIL import Image img_path = sys.argv[1] if len(sys.argv) > 1 else sys.stdin.read().strip() img = Image.open(img_path) img_small = img.resize((1600, 2400), Image.LANCZOS) buf = io.BytesIO() img_small.save(buf, format='JPEG', quality=80) b64_data = base64.b64encode(buf.getvalue()).decode() url = 'https://api.ocr.space/parse/image' params = urllib.parse.urlencode({ 'base64Image': 'data:image/jpeg;base64,' + b64_data, 'language': 'chs', 'isOverlayRequired': 'false', 'detectOrientation': 'true', 'scale': 'true', 'OCREngine': '2', }) data = params.encode('utf-8') req = urllib.request.Request(url, data=data) req.add_header('Content-Type', 'application/x-www-form-urlencoded') req.add_header('apikey', 'helloworld') # OCR.space free demo key with urllib.request.urlopen(req, timeout=30) as resp: raw = resp.read() result = json.loads(raw.decode('utf-8', errors='replace')) if 'ParsedResults' in result: for r in result['ParsedResults']: print(r['ParsedText']) else: print('OCR识别失败:', result) ` ## 使用方式 `bash python {skill_root}/scripts/ocr_image.py "F:/1.jpg" ` ## 依赖 - Python 3 - Pillow (pip install pillow`)

运行时依赖

版本

安装命令

本土化适配说明

技能文档

相关技能推荐