首页龙虾技能列表 › Universal Extractor — 通用文本提取器

Universal Extractor — 通用文本提取器

v1.0.0

从URL、文章、文档和文件中提取干净文本。四个提取微服务。当需要从网页、PDF或任何文件格式提取内容时使用。

0· 43·0 当前·0 累计
by @renoblabs·MIT-0
下载技能包
License
MIT-0
最后更新
2026/4/11
安全扫描
VirusTotal
无害
查看报告
OpenClaw
可疑
medium confidence
技能声明的目的(从URL/文件提取文本)与其指令在高层面上匹配,但运行时指令对于请求发送位置和支付处理方式表述模糊,并指示将潜在敏感的文件内容发送到设备外——这种不匹配以及数据泄露和意外收费的可能性令人担忧。
评估建议
在澄清以下问题之前,不要向此技能发送敏感文档或密钥:(1) POST请求将发送到的完整API主机/URL(域名、TLS期望),(2) 实际如何执行支付(代理是否需要钱包/私钥,还是在代理外部处理账单),(3) 谁在运营服务,以及他们的隐私政策/保留规则,(4) 服务是否存储或记录数据。如果仍想尝试,请先使用非敏感示例文件进行测试,确认预期成本,并优先使用沙箱或一次性账户/钱包。如果发布者无法提供API文档、主机名和清晰的支付流程,请勿安装或使用该技能处理私人数据。...
详细分析 ▾
用途与能力
名称/描述(文本提取)与提供的端点(clean-url、extract-article、extract-document、extract-file)一致。然而SKILL.md省略了POST端点的主机/URL根(仅提供如/x402s/clean-url的路径),并引用付费的'x402'协议而未声明任何凭证或钱包要求——这与自包含提取器技能不一致,表明缺少集成细节。
指令范围
指令明确指示代理将base64编码的文件和URL POST到外部端点,这会传输任意用户内容(包括敏感数据)。没有关于使用哪个主机名、如何认证或如何处理许可/同意的指导。指令赋予代理将用户内容发送到未指定外部服务的广泛裁量权。
安装机制
没有安装规范和代码文件——仅是指令式技能。这最大程度地降低了磁盘风险,因为安装程序不会写入或执行任何内容,这对于简单的API调用技能是合适的。
凭证需求
SKILL.md声称'无需API密钥',但表明请求通过Base上的'x402'协议以USDC支付——这意味着存在未声明的钱包/交易签名机制或外部支付流程。技能请求发送内容但不声明凭证;声明的凭证或支付机制的缺失与所声明的付费API行为不成比例,是一个未解决的不一致之处。
持久化与权限
技能不请求常驻存在,使用正常的代理调用规则,不声明更改其他技能或系统范围的设置。
安全有层次,运行前请审查代码。

License

MIT-0

可自由使用、修改和再分发,无需署名。

运行时依赖

无特殊依赖

版本

latestv1.0.02026/4/11

- universal-extractor 初始版本。- 从URL、文章和多种文件格式提取干净文本。- 四个服务:干净的URL文本、带摘要的文章提取、文档转文本和通用文件提取。- 简单的API端点;通过x402协议使用USDC处理支付。

● 无害

安装命令 点击复制

官方npx clawhub@latest install universal-extractor
镜像加速npx clawhub@latest install universal-extractor --registry https://cn.clawhub-mirror.com

技能文档

四个提取服务 — URL转文本、文章转摘要、文档转JSON。

服务

/clean-url — URL转干净文本

去除广告、导航栏、页脚。获取内容。

POST /x402s/clean-url
Body: {"url": "https://example.com/article"}
Response: {"text": "...", "title": "...", "author": "...", "word_count": 1234}
Price: $0.001 USDC

/extract-article — 文章提取+摘要

完整文章提取,支持可选的LLM摘要。

POST /x402s/extract-article
Body: {"url": "https://...", "summarize": true}
Response: {"title": "...", "text": "...", "summary": "...", "author": "...", "date": "..."}
Price: $0.005 USDC

/extract-document — 文档转文本

Base64编码的PDF/DOCX/TXT转为结构化文本。

POST /x402s/extract-document
Body: {"content": "", "filename": "report.pdf"}
Response: {"text": "...", "word_count": 5678}
Price: $0.002 USDC

/extract-file — 任意文件转文本

通用文件转文本提取。

POST /x402s/extract-file
Body: {"content": "", "filename": "data.csv"}
Response: {"text": "...", "word_count": 234}
Price: $0.002 USDC

支付

x402协议 — Base上的USDC。无需API密钥。

数据来源:ClawHub ↗ · 中文优化:龙虾技能库
OpenClaw 技能定制 / 插件定制 / 私有工作流定制

免费技能或插件可能存在安全风险,如需更匹配、更安全的方案,建议联系付费定制

了解定制服务