Markdown Converter — 文件转换为 Markdown 格式
v1.0.0使用 markitdown 将 PDF、Word、PowerPoint、Excel、HTML、CSV、JSON、XML、图像(含 EXIF/OCR)、音频(含转录)、ZIP存档、YouTube URL 或 EPub 转换为 Markdown 格式,适用于 LLM 处理或文本分析。
158· 33,900·408 当前·426 累计·💬 1
安全扫描
OpenClaw
可疑
medium confidence该技能的指令与文档转 Markdown 转换器一致,但依赖外部 CLI(uvx markitdown),提及启用第三方插件和向外部服务(Azure、YouTube)发送数据,无明确的凭据或信任边界描述,存在操作和数据泄露风险,用户应在安装前了解这些风险。
评估建议
此技能本质上是一组外部 CLI `uvx markitdown` 的使用说明。使用/安装前:1) 确保从可信源获取 `uvx` 二进制文件(技能未提供安装或主页)。2) 使用 `--use-plugins` 时谨慎——第三方插件可能执行代码或访问网络;仅在信任其源时启用。3) 使用 Azure 文档智能或其他外部服务时,了解文档内容将发送到这些端点,可能需要额外的凭据(API 密钥);确认 `uvx` 如何期望这些密钥以及存储位置。4) 先在非敏感样本文件上测试工具,以观察网络活动和插件行为。如果您需要此功能但希望降低风险,请优先选择验证的转换器二进制文件或官方项目页面的文档安装。...详细分析 ▾
ℹ 用途与能力
名称/描述(将多种文件类型转换为 Markdown)与 SKILL.md 中的 `uvx markitdown` 使用相符。然而,该技能仅为指令,假设主机上存在 `uvx` CLI,但未声明所需的二进制文件或安装步骤;这应明确告知用户。
⚠ 指令范围
指令告诉代理运行 `uvx markitdown`,带有可能向外部端点发送数据的选项(例如,通过 -d/-e 使用 Azure 文档智能,获取 YouTube 内容)以及启用 `--use-plugins`(第三方插件)。SKILL.md 未记录如何源自/安装插件或如何提供凭据/API 密钥,这扩大了代理对可能发送或执行内容的自由裁量权。
✓ 安装机制
没有安装规格和代码文件 — 从磁盘/写入角度来看,这是最低风险模型。所有执行依赖于 PATH 上的现有 `uvx` 二进制文件。
ℹ 凭证需求
该技能未声明所需的环境变量或凭据,与其指令性质相符。但它引用了 Azure 文档智能(通常需要密钥的外部服务)和插件使用;SKILL.md 省略了如何提供身份验证或 `uvx` 工具是否会读取环境变量或配置文件,引起了对可能需要或存储秘密的位置的不确定性。
✓ 持久化与权限
always 为 false,并且没有安装会修改代理配置。该技能不请求持久权限或自动包含。
安全有层次,运行前请审查代码。
运行时依赖
无特殊依赖
版本
latestv1.0.02026/1/6
● 无害
安装命令 点击复制
官方npx clawhub@latest install markdown-converter
镜像加速npx clawhub@latest install markdown-converter --registry https://www.longxiaskill.com
技能文档
Markdown Converter
将文件转换为 Markdown 格式使用 uvx markitdown — 无需安装。
基本使用
# 转换到 stdout
uvx markitdown input.pdf
# 保存到文件
uvx markitdown input.pdf -o output.md
uvx markitdown input.docx > output.md
# 从 stdin
.cat input.pdf | uvx markitdown
支持的格式
- 文档: PDF, Word (.docx), PowerPoint (.pptx), Excel (.xlsx, .xls)
- Web/Data: HTML, CSV, JSON, XML
- 媒体: 图像(EXIF + OCR),音频(EXIF + 转录)
- 其他: ZIP(迭代内容),YouTube URL,EPub
选项
-o OUTPUT # 输出文件
-x EXTENSION # 文件扩展名提示(用于 stdin)
-m MIME_TYPE # MIME 类型提示
-c CHARSET # 字符集提示(例如,UTF-8)
-d # 使用 Azure 文档智能
-e ENDPOINT # 文档智能端点
--use-plugins # 启用第三方插件
--list-plugins # 显示安装的插件
示例
# 转换 Word 文档
uvx markitdown report.docx -o report.md
# 转换 Excel 电子表格
uvx markitdown data.xlsx > data.md
# 转换 PowerPoint 演示文稿
uvx markitdown slides.pptx -o slides.md
# 使用文件类型提示(用于 stdin)
cat document | uvx markitdown -x .pdf > output.md
# 使用 Azure 文档智能进行更好的 PDF 提取
uvx markitdown scan.pdf -d -e "https://your-resource.cognitiveservices.azure.com/"
注释
- 输出保留文档结构:标题、表格、列表、链接
- 首次运行缓存依赖项;后续运行速度更快
- 对于提取效果不佳的复杂 PDF,请使用
-d与 Azure 文档智能
数据来源:ClawHub ↗ · 中文优化:龙虾技能库
OpenClaw 技能定制 / 插件定制 / 私有工作流定制
免费技能或插件可能存在安全风险,如需更匹配、更安全的方案,建议联系付费定制