首页龙虾技能列表 › HTML to Markdown — HTML转Markdown

📄 HTML to Markdown — HTML转Markdown

v0.4.0

使用MinerU将HTML转换为Markdown的专注工具,可将HTML页面和文件转换为干净、结构良好的Markdown格式。支持标题、列表、表格、链接、图片和代码块,支持本地文件和URL,支持多语言内容。适用于文档工作流程和内容迁移场景。

0· 98·0 当前·0 累计
by @mzlzyca (mzlzyCA)·MIT-0
下载技能包
License
MIT-0
最后更新
2026/4/3
安全扫描
VirusTotal
无害
查看报告
OpenClaw
安全
high confidence
技能的需求和运行时指令与其声明的目的(用于将HTML转换为Markdown的MinerU CLI包装器)相匹配;所请求的内容没有出现不成比例或无关的情况。
评估建议
这个技能看起来完全符合其描述:调用MinerU CLI将HTML转换为Markdown,并需要MinerU令牌。安装前请验证mineru-open-api npm包和GitHub仓库(opendatalab/MinerU-Ecosystem)以确保您信任发布者。请注意,全局npm或go安装会在您的机器上运行第三方代码——如果您比较谨慎,请在隔离环境(容器/VM)中安装,或先检查仓库。将您的MINERU_TOKEN像任何API密钥一样对待:在MinerU站点创建它,仅授予必要的权限,避免在共享的shell/脚本中暴露它,并在需要时进行轮换。如果您期望转换高度敏感的本地HTML,请在使 用远程爬取/提取功能之前确认MinerU对上传内容的处理(隐私/保留)情况。...
详细分析 ▾
用途与能力
名称/描述(HTML → Markdown)与所需二进制文件(mineru-open-api)和单个所需环境变量(MINERU_TOKEN)一致。声明的安装方法(npm或go)对应于文档中引用的mineru CLI。
指令范围
SKILL.md仅指示代理针对URL或本地HTML文件运行mineru-open-api CLI并设置MINERU_TOKEN;它不要求代理读取无关的系统文件、其他环境变量或将数据泄露到意外端点。本地文件访问在所述目的范围内(转换本地HTML)。
安装机制
安装通过npm(mineru-open-api)或从GitHub仓库(opendatalab)进行go install。这些是标准包源,适合CLI工具,但全局npm/go安装会在主机上执行第三方代码——如果您需要谨慎,请检查包/仓库。
凭证需求
仅需MINERU_TOKEN,这是主要凭证;这是合理的,因为CLI与MinerU服务通信。未请求无关凭证或配置路径。
持久化与权限
always为false,技能可由用户调用,允许正常自主调用。技能不请求系统级持久性或修改其他技能的配置文件。
安全有层次,运行前请审查代码。

License

MIT-0

可自由使用、修改和再分发,无需署名。

运行时依赖

无特殊依赖

版本

latestv0.4.02026/4/1

SEO:扩展描述以更好地支持ClawHub向量搜索发现

● 无害

安装命令 点击复制

官方npx clawhub@latest install html2markdown
镜像加速npx clawhub@latest install html2markdown --registry https://cn.clawhub-mirror.com

技能文档

使用MinerU将HTML文件或网页URL转换为干净的Markdown。移除导航、广告和杂乱内容——保留可读内容。

安装

npm install -g mineru-open-api
# or via Go (macOS/Linux):
go install github.com/opendatalab/MinerU-Ecosystem/cli/mineru-open-api@latest

快速开始

# 将网页URL转换为Markdown(需要令牌)
mineru-open-api crawl https://example.com/article -o ./out/

# 将本地HTML文件转换为Markdown(需要令牌) mineru-open-api extract page.html -o ./out/

# 输出到stdout(需要令牌) mineru-open-api crawl https://example.com/article

认证

需要令牌:

mineru-open-api auth  # 交互式令牌设置
export MINERU_TOKEN="your-token"  # 或通过环境变量

在以下位置创建令牌:https://mineru.net/apiManage/token

功能

  • 输入:远程网页URL或本地.html文件
  • 输出:Markdown
  • 对于远程URL:使用crawl(需要令牌)
  • 对于本地HTML文件:使用extract(需要令牌)
  • HTML不支持flash-extract

注意事项

  • 始终需要令牌(HTML不支持flash-extract
  • 默认输出到stdout;使用-o 保存到文件或目录
  • 所有进度/状态消息输出到stderr;文档内容输出到stdout
  • MinerU由OpenDataLab(上海AI Lab)开源:https://github.com/opendatalab/MinerU
数据来源:ClawHub ↗ · 中文优化:龙虾技能库
OpenClaw 技能定制 / 插件定制 / 私有工作流定制

免费技能或插件可能存在安全风险,如需更匹配、更安全的方案,建议联系付费定制

了解定制服务