首页龙虾技能列表 › PDF to HTML — PDF转HTML

📄 PDF to HTML — PDF转HTML

v0.4.0

使用MinerU将PDF文档转换为HTML。将PDF文件转换为保留结构和格式的网页就绪HTML。

0· 125·0 当前·0 累计
by @mzlzyca (mzlzyCA)·MIT-0
下载技能包
License
MIT-0
最后更新
2026/4/3
安全扫描
VirusTotal
无害
查看报告
OpenClaw
安全
high confidence
技能的需求和运行时指令与其声明的目的(运行MinerU CLI将PDF转换为HTML)一致;没有请求无关凭证或从未知URL安装任意代码。
评估建议
此技能本质上是使用MinerU CLI的文档,看起来是连贯的。安装前请注意:1) 验证mineru-open-api是官方MinerU包(检查npm页面和SKILL.md中链接的GitHub仓库)。2) 创建一个具有最小范围的专用MinerU令牌,不要重复使用其他服务凭证。3) 如果通过npm安装,请查看包的安装脚本和源代码(如果您需要更严格的供应链控制)。4) 如果要处理不受信任的PDF,首选在沙箱或CI运行器中运行CLI。5) 避免将MINERU_TOKEN嵌入共享日志或公共代码中;将其设置为受限环境变量。...
详细分析 ▾
用途与能力
该技能是一个仅包含指令的MinerU CLI封装器。声明的需求(mineru-open-api二进制文件和MINERU_TOKEN)直接匹配所述功能(调用mineru-open-api extract生成HTML)。没有无关的二进制文件或额外的凭证声明。
指令范围
SKILL.md指示代理针对本地文件或URL运行mineru-open-api CLI(extract、auth)并使用MINERU_TOKEN。它没有指示读取其他环境变量、无关的系统文件或将数据泄露到意外端点。
安装机制
安装选项有npm(mineru-open-api)或从GitHub仓库(github.com/opendatalab/...)使用go install。两者都是标准的、可追溯的机制。没有使用来自不可信短链接或个人IP的下载。(与npm通常一样,可能存在postinstall脚本;如果您需要更严格的控制,请查看包源代码。)
凭证需求
只需要一个令牌(MINERU_TOKEN),这由CLI的auth流程证明。没有请求其他凭证或配置路径。用户应确认令牌的范围,避免重复使用高权限令牌。
持久化与权限
该技能不是始终启用的,也不请求持久修改其他技能或系统范围的设置。允许自主调用,但这是平台默认设置,单独不是标记该技能的理由。
安全有层次,运行前请审查代码。

License

MIT-0

可自由使用、修改和再分发,无需署名。

运行时依赖

无特殊依赖

版本

latestv0.4.02026/4/1

SEO:扩展描述以获得更好的ClawHub向量搜索发现

● 无害

安装命令 点击复制

官方npx clawhub@latest install pdf-to-html
镜像加速npx clawhub@latest install pdf-to-html --registry https://cn.clawhub-mirror.com

技能文档

使用MinerU将PDF文件转换为HTML。

安装

npm install -g mineru-open-api
# 或者通过Go(macOS/Linux):
go install github.com/opendatalab/MinerU-Ecosystem/cli/mineru-open-api@latest

快速开始

# 将PDF转换为HTML(需要令牌)
mineru-open-api extract report.pdf -f html -o ./out/
# 从URL
mineru-open-api extract https://example.com/report.pdf -f html -o ./out/
# 带语言提示
mineru-open-api extract report.pdf -f html --language en -o ./out/

认证

需要令牌:

mineru-open-api auth
# 交互式令牌设置
export MINERU_TOKEN="your-token"
# 或者通过环境变量

在以下地址创建令牌:https://mineru.net/apiManage/token

功能

  • 支持输入:.pdf(本地文件或URL)
  • 输出格式:HTML(-f html
  • HTML输出需要使用令牌的extract——在flash-extract中不可用
  • 使用--language指定语言提示(默认:ch,使用en表示英语)
  • 使用--pages指定页面范围(例如:1-10

注意事项

  • HTML输出(-f html)仅可通过带令牌的extract获得
  • 默认输出到stdout;使用-o 保存到文件
  • 所有进度/状态消息输出到stderr;文档内容输出到stdout
  • MinerU由OpenDataLab(上海AI Lab)开源:https://github.com/opendatalab/MinerU
数据来源:ClawHub ↗ · 中文优化:龙虾技能库
OpenClaw 技能定制 / 插件定制 / 私有工作流定制

免费技能或插件可能存在安全风险,如需更匹配、更安全的方案,建议联系付费定制

了解定制服务