📦 image-reader-xytest — 本地OCR识图

v1.0.0

调用OCR.space免费接口,一键识别本地图片中的中英混合文字,自动生成同名txt结果,支持CLI,仅需Python3与Pillow。

0· 145·0 当前·0 累计
下载技能包
最后更新
2026/3/25
0
安全扫描
VirusTotal
无害
查看报告
OpenClaw
安全
high confidence
该技能的代码与说明均围绕“通过OCR.space对本地图片进行OCR”展开;文件未请求无关密钥或安装意外组件,但会将图片数据发送至第三方API并把结果写入磁盘。
评估建议
该技能内部逻辑与其目的相符。安装前请考虑:1) 隐私——图片会上传至第三方服务api.ocr.space,请勿发送敏感图像;2) 输出文件——识别结果以<image_name>_ocr.txt保存在技能scripts目录,需检查写入权限;3) API密钥——脚本使用公开演示密钥'helloworld'(额度有限),生产环境请替换为自己的OCR.space密钥,并改为从环境变量读取,避免硬编码;4) 依赖——确保已安装Python 3与Pillow。如需更高安全保障,可审查/修改脚本,避免发送敏感图像或改用本地OCR方案。...
详细分析 ▾
用途与能力
名称/描述(使用OCR.space进行本地OCR)与所含Python脚本及SKILL.md一致。脚本执行图片缩放、base64编码并发送至api.ocr.space,符合该功能预期。
指令范围
指令仅运行所提供脚本处理本地图片路径,并依赖Pillow;不会读取无关文件或环境变量。注意:脚本会将图片内容发送至第三方端点OCR.space,并在技能scripts目录写入识别文本,用户应知晓相关隐私行为。
安装机制
无安装规范;本技能仅含指令,需用户自备Python与Pillow(pip安装)。安装器不会下载或写入任何内容。
凭证需求
未请求环境变量或凭证。脚本硬编码OCR.space公开演示密钥'helloworld',符合演示用途但额度有限且非敏感信息;未发现无关凭证。
持久化与权限
技能未请求常驻/始终运行,也未修改其他技能或系统级设置。仅在自身scripts目录写入输出文件,符合本地OCR助手预期。
安全有层次,运行前请审查代码。

运行时依赖

无特殊依赖

版本

latestv1.0.02026/3/25

- 首次发布image-reader技能。 - 使用免费OCR.space API识别本地图片内容(含中文)。 - 附带Python脚本,用于提交图片并返回提取文本。 - 简易CLI用法;需Python 3与Pillow。

无害

安装命令

点击复制
官方npx clawhub@latest install image-reader-xytest
镜像加速npx clawhub@latest install image-reader-xytest --registry https://cn.longxiaskill.com

技能文档

# image-reader Skill 识别本地图片内容(支持中文),通过 OCR.space 免费 API 实现。 ## 工作流程 1. 接收图片路径 2. 调用 OCR.space API 进行识别 3. 返回识别结果 ## Python 脚本 保存到 {skill_root}/scripts/ocr_image.py: ``python import urllib.request, urllib.parse, base64, io, json, sys from PIL import Image img_path = sys.argv[1] if len(sys.argv) > 1 else sys.stdin.read().strip() img = Image.open(img_path) img_small = img.resize((1600, 2400), Image.LANCZOS) buf = io.BytesIO() img_small.save(buf, format='JPEG', quality=80) b64_data = base64.b64encode(buf.getvalue()).decode() url = 'https://api.ocr.space/parse/image' params = urllib.parse.urlencode({ 'base64Image': 'data:image/jpeg;base64,' + b64_data, 'language': 'chs', 'isOverlayRequired': 'false', 'detectOrientation': 'true', 'scale': 'true', 'OCREngine': '2', }) data = params.encode('utf-8') req = urllib.request.Request(url, data=data) req.add_header('Content-Type', 'application/x-www-form-urlencoded') req.add_header('apikey', 'helloworld') # OCR.space free demo key with urllib.request.urlopen(req, timeout=30) as resp: raw = resp.read() result = json.loads(raw.decode('utf-8', errors='replace')) if 'ParsedResults' in result: for r in result['ParsedResults']: print(r['ParsedText']) else: print('OCR识别失败:', result) ` ## 使用方式 `bash python {skill_root}/scripts/ocr_image.py "F:/1.jpg" ` ## 依赖 - Python 3 - Pillow (pip install pillow`)

数据来源ClawHub ↗ · 中文优化:龙虾技能库