📄 HTML Markdown — HTML 转 Markdown 工具
v0.4.0使用 MinerU 文档处理引擎将 HTML 转换为 Markdown。将 HTML 页面和文件转换为干净、可读的 Markdown 格式。支持标题、列表、表格、链接和代码块,保留结构。支持本地文件和 URL。输出干净,适合文档和内容系统使用。适用于需要将 HTML 转换为 Markdown、迁移 HTML 内容到 Markdown 系统的场景。由 OpenDataLab(上海 AI 实验室)的开源文档智能引擎 MinerU 提供支持,支持多语言内容。
0· 124·0 当前·0 累计
安全扫描
OpenClaw
安全
high confidence此技能内部一致:它封装了 mineru-open-api CLI 来将 HTML 转换为 Markdown,仅请求 MinerU token 和该工具合理需要的 mineru-open-api 二进制文件。
评估建议
此技能看起来是连贯的:它调用 MinerU CLI,只需要 MINERU_TOKEN。安装前,请验证 npm 包和 GitHub 仓库(https://github.com/opendatalab/MinerU-Ecosystem)以确保您信任上游代码。像对待任何密钥一样对待 MINERU_TOKEN:不要重复使用高权限令牌,尽可能限制其范围,并在处理不受信任的 HTML 时在受控环境中运行 CLI。如果您无法或不愿意安装第三方二进制文件,请勿授予该技能访问包含 mineru-open-api 的环境的权限。...详细分析 ▾
✓ 用途与能力
名称/描述与请求的产物匹配:技能需要 mineru-open-api 二进制文件和 MINERU_TOKEN,这两者对于调用 MinerU 服务的 CLI 来说都是预期的。
✓ 指令范围
SKILL.md 指示代理运行 mineru-open-api extract/crawl 并设置 MINERU_TOKEN。它不请求其他环境变量,读取无关的系统文件,或向 MinerU 服务之外的意外端点发送数据。
ℹ 安装机制
安装程序是 npm (mineru-open-api) 和从 GitHub 仓库的 go install — 常见且可追溯的机制。与任何第三方包一样,安装全局 npm 包或 go 二进制文件会执行上游代码;安装前请检查 npm 包和 GitHub 仓库。
✓ 凭证需求
只需要 MINERU_TOKEN 并声明为主要凭证。对于托管文档处理 API 来说,这是相称的。不需要无关的凭证或配置路径。
✓ 持久化与权限
always 为 false,技能不请求系统范围的配置更改。它是一个仅指令的技能,在运行时调用外部 CLI。
安全有层次,运行前请审查代码。
运行时依赖
无特殊依赖
版本
latestv0.4.02026/3/27
SEO:扩展描述以更好地支持 ClawHub 向量搜索发现
● 无害
安装命令
点击复制官方npx clawhub@latest install html-markdown
镜像加速npx clawhub@latest install html-markdown --registry https://cn.longxiaskill.com 镜像可用
技能文档
使用 MinerU 将 HTML 文件转换为干净的 Markdown。
对于本地 HTML 文件使用 extract;对于实时网页使用 crawl。
Install
npm install -g mineru-open-api
# 或者通过 Go(macOS/Linux): go install github.com/opendatalab/MinerU-Ecosystem/cli/mineru-open-api@latest
Quick Start
# 将本地 HTML 文件转换为 Markdown(需要 token) mineru-open-api extract page.html -o ./out/# 将远程 HTML 文件转换为 Markdown(需要 token) mineru-open-api extract https://example.com/doc.html -o ./out/
# 通过 crawl 将实时网页转换为 Markdown(需要 token) mineru-open-api crawl https://example.com/article -o ./out/
Authentication
需要 token:
mineru-open-api auth# 交互式 token 设置 export MINERU_TOKEN="your-token"
# 或者通过环境变量
在 https://mineru.net/apiManage/token 创建 token
Capabilities
- 支持输入:本地 .html 文件或 HTTP/HTTPS URL
- 本地
.html文件:使用extract(需要 token) - 实时网页 URL:使用
crawl(需要 token) - HTML 不支持
flash-extract - 使用
--language进行语言提示(默认:ch,使用en表示英语)
Notes
- HTML 输入始终需要 token(无
flash-extract支持) - 对于需要 JavaScript 渲染的实时网页,首选
crawl - 输出默认到 stdout;使用
-o保存到文件或目录 - 所有进度/状态消息到 stderr;文档内容到 stdout
- MinerU 是由 OpenDataLab(上海 AI 实验室)开发的开源项目:https://github.com/opendatalab/MinerU