首页龙虾技能列表 › HTML Markdown — HTML 转 Markdown 工具

📄 HTML Markdown — HTML 转 Markdown 工具

v0.4.0

使用 MinerU 文档处理引擎将 HTML 转换为 Markdown。将 HTML 页面和文件转换为干净、可读的 Markdown 格式。支持标题、列表、表格、链接和代码块,保留结构。支持本地文件和 URL。输出干净,适合文档和内容系统使用。适用于需要将 HTML 转换为 Markdown、迁移 HTML 内容到 Markdown 系统的场景。由 OpenDataLab(上海 AI 实验室)的开源文档智能引擎 MinerU 提供支持,支持多语言内容。

0· 124·0 当前·0 累计
by @mzlzyca (mzlzyCA)·MIT-0
下载技能包
License
MIT-0
最后更新
2026/4/3
安全扫描
VirusTotal
无害
查看报告
OpenClaw
安全
high confidence
此技能内部一致:它封装了 mineru-open-api CLI 来将 HTML 转换为 Markdown,仅请求 MinerU token 和该工具合理需要的 mineru-open-api 二进制文件。
评估建议
此技能看起来是连贯的:它调用 MinerU CLI,只需要 MINERU_TOKEN。安装前,请验证 npm 包和 GitHub 仓库(https://github.com/opendatalab/MinerU-Ecosystem)以确保您信任上游代码。像对待任何密钥一样对待 MINERU_TOKEN:不要重复使用高权限令牌,尽可能限制其范围,并在处理不受信任的 HTML 时在受控环境中运行 CLI。如果您无法或不愿意安装第三方二进制文件,请勿授予该技能访问包含 mineru-open-api 的环境的权限。...
详细分析 ▾
用途与能力
名称/描述与请求的产物匹配:技能需要 mineru-open-api 二进制文件和 MINERU_TOKEN,这两者对于调用 MinerU 服务的 CLI 来说都是预期的。
指令范围
SKILL.md 指示代理运行 mineru-open-api extract/crawl 并设置 MINERU_TOKEN。它不请求其他环境变量,读取无关的系统文件,或向 MinerU 服务之外的意外端点发送数据。
安装机制
安装程序是 npm (mineru-open-api) 和从 GitHub 仓库的 go install — 常见且可追溯的机制。与任何第三方包一样,安装全局 npm 包或 go 二进制文件会执行上游代码;安装前请检查 npm 包和 GitHub 仓库。
凭证需求
只需要 MINERU_TOKEN 并声明为主要凭证。对于托管文档处理 API 来说,这是相称的。不需要无关的凭证或配置路径。
持久化与权限
always 为 false,技能不请求系统范围的配置更改。它是一个仅指令的技能,在运行时调用外部 CLI。
安全有层次,运行前请审查代码。

License

MIT-0

可自由使用、修改和再分发,无需署名。

运行时依赖

无特殊依赖

版本

latestv0.4.02026/3/27

SEO:扩展描述以更好地支持 ClawHub 向量搜索发现

● 无害

安装命令 点击复制

官方npx clawhub@latest install html-markdown
镜像加速npx clawhub@latest install html-markdown --registry https://cn.clawhub-mirror.com

技能文档

使用 MinerU 将 HTML 文件转换为干净的 Markdown。

对于本地 HTML 文件使用 extract;对于实时网页使用 crawl

Install

npm install -g mineru-open-api

# 或者通过 Go(macOS/Linux): go install github.com/opendatalab/MinerU-Ecosystem/cli/mineru-open-api@latest

Quick Start

# 将本地 HTML 文件转换为 Markdown(需要 token)
mineru-open-api extract page.html -o ./out/

# 将远程 HTML 文件转换为 Markdown(需要 token) mineru-open-api extract https://example.com/doc.html -o ./out/

# 通过 crawl 将实时网页转换为 Markdown(需要 token) mineru-open-api crawl https://example.com/article -o ./out/

Authentication

需要 token:

mineru-open-api auth

# 交互式 token 设置 export MINERU_TOKEN="your-token"

# 或者通过环境变量

在 https://mineru.net/apiManage/token 创建 token

Capabilities

  • 支持输入:本地 .html 文件或 HTTP/HTTPS URL
  • 本地 .html 文件:使用 extract(需要 token)
  • 实时网页 URL:使用 crawl(需要 token)
  • HTML 不支持 flash-extract
  • 使用 --language 进行语言提示(默认:ch,使用 en 表示英语)

Notes

  • HTML 输入始终需要 token(无 flash-extract 支持)
  • 对于需要 JavaScript 渲染的实时网页,首选 crawl
  • 输出默认到 stdout;使用 -o 保存到文件或目录
  • 所有进度/状态消息到 stderr;文档内容到 stdout
  • MinerU 是由 OpenDataLab(上海 AI 实验室)开发的开源项目:https://github.com/opendatalab/MinerU
数据来源:ClawHub ↗ · 中文优化:龙虾技能库
OpenClaw 技能定制 / 插件定制 / 私有工作流定制

免费技能或插件可能存在安全风险,如需更匹配、更安全的方案,建议联系付费定制

了解定制服务