安全扫描
OpenClaw
安全
high confidence技能的需求、说明和安装步骤与其声明的用途相匹配(运行 mineru-open-api CLI 并使用 MINERU_TOKEN 清理 HTML)。
评估建议
该技能看起来是连贯的:它运行 mineru-open-api CLI,需要来自 mineru.net 的 MINERU_TOKEN。安装前,请验证 npm 包和 GitHub 仓库是合法的(检查发布者、最近的提交和 npm 下载量)。像对待任何 API 凭证一样对待 MINERU_TOKEN:仅提供具有最小所需范围的令牌,避免在高度敏感的本地 HTML 上使用该服务(除非您接受将内容发送到 MinerU),如果停止使用该技能,请轮换或删除令牌。详细分析 ▾
✓ 用途与能力
名称/描述(通过 MinerU 清理 HTML)与所需二进制文件(mineru-open-api)和所需环境变量(MINERU_TOKEN)一致。声明的主要凭证和二进制文件正是 CLI 功能所需的条件。
✓ 指令范围
SKILL.md 仅指导代理针对远程 URL 或本地 HTML 文件运行 mineru-open-api 命令,使用认证流程,并将输出写入 stdout 或文件。它不要求代理读取无关的系统文件、其他凭证,或将数据发布到 MinerU API 之外的意外端点。
✓ 安装机制
安装选项是标准的包安装(npm 包和从 GitHub 仓库进行 Go 安装)。这些对于 CLI 是预期的;没有使用任意的下载 URL、提取步骤或个人服务器。
✓ 凭证需求
只需要 MINERU_TOKEN 并将其声明为主要凭证,这对于托管提取/处理服务是相称的。不需要无关的密钥或配置路径。
✓ 持久化与权限
技能不是强制始终运行的;它是用户可调用的,不请求提升的持久存在或修改其他技能或系统范围的配置。
安全有层次,运行前请审查代码。
运行时依赖
无特殊依赖
版本
latestv0.4.02026/3/27
SEO:扩展描述以更好地支持 ClawHub 向量搜索发现
● 无害
安装命令 点击复制
官方npx clawhub@latest install html-to-html
镜像加速npx clawhub@latest install html-to-html --registry https://cn.clawhub-mirror.com
技能文档
获取远程网页或本地 HTML 文件,并使用 MinerU 将其转换为干净的结构化 HTML。去除噪音并保留语义内容。
Install
npm install -g mineru-open-api
# 或者通过 Go(macOS/Linux):
go install github.com/opendatalab/MinerU-Ecosystem/cli/mineru-open-api@latest
Quick Start
# 爬取网页并输出干净的 HTML(需要令牌)
mineru-open-api crawl https://example.com/article -f html -o ./out/# 重新提取本地 HTML 文件为干净 HTML(需要令牌)
mineru-open-api extract page.html -f html -o ./out/
# 批量爬取多个 URL 为 HTML(需要令牌)
mineru-open-api crawl url1 url2 -f html -o ./pages/
Authentication
需要令牌:
mineru-open-api auth
# 交互式令牌设置
export MINERU_TOKEN="your-token"
# 或者通过环境变量
在以下地址创建令牌:https://mineru.net/apiManage/token
Capabilities
- 输入:远程网页 URL 或本地 .html 文件
- 输出:干净的结构化 HTML(
-f html) - 对于远程 URL:使用
crawl -f html - 对于本地 HTML 文件:使用
extract -f html - 需要令牌 — 在
flash-extract中不可用
Notes
- HTML 输出(
-f html)需要令牌;在flash-extract中不可用 crawl支持输出格式:md, html, jsonextract支持输出格式:md, html, latex, docx, json- 默认输出到 stdout;使用
-o保存到文件或目录 - 所有进度/状态消息输出到 stderr;文档内容输出到 stdout
- MinerU 由 OpenDataLab(上海 AI Lab)开源:https://github.com/opendatalab/MinerU
数据来源:ClawHub ↗ · 中文优化:龙虾技能库
OpenClaw 技能定制 / 插件定制 / 私有工作流定制
免费技能或插件可能存在安全风险,如需更匹配、更安全的方案,建议联系付费定制