📦 Arxiv

v1.0.8

论文下载器 从 arXiv 一键下载 47+ 篇 AI/ML 必读论文,预置智能体测试、自主智能体、大语言模型精选合集

0· 24·0 当前·0 累计
liubindashen 头像by @liubindashen (geekclaw)·MIT
下载技能包
License
MIT
最后更新
2026/4/20
0
安全扫描
VirusTotal
无害
查看报告
OpenClaw
安全
high confidence
该技能与其声明的用途(从 arXiv 下载 PDF)保持一致;仅需 Python 和 requests,执行简单的 HTTP 下载与文件系统写入,不要求凭据或特殊安装源。
评估建议
该技能的功能如其名:从 arXiv 下载 PDF 并将元数据保存在本地。安装前请注意: (1) 来源可信:包注册元数据指向占位 GitHub URL,技能源码/主页未知——使用前请审查仓库或代码(已提供 src/skill.py)。 (2) 文件写入:技能会在你指定的 output_dir 创建并写入 PDF 与 JSON 文件——请选择你控制的目录。 (3) 网络访问:会向 arxiv.org 发起 HTTP 请求;若环境对外发流量限制严格,请避免运行。 (4) 遵守 arXiv 条款与速率限制:设置合理延迟,避免对 arXiv 造成压力(代码支持 delay 参数)。 (5) 安装:在 virtualenv 中安装 requests,避免全局依赖变更。若需更高保障,请在本地运行随附测试并查看简短易读的 src/skill.py,再启用自动调用。...
详细分析 ▾
用途与能力
名称/描述与代码一致:该包提供 arXiv ID 列表及下载 PDF、列出分类、导出元数据的函数。所请求的 python 二进制文件与依赖 requests 均合理。轻微信号:元数据文件版本号不一致(skill.json 1.0.1、SKILL.md 1.0.7、registry 1.0.8),仓库/主页字段使用占位符 your-username,Source/Homepage 实际未知——属信任/维护问题,但不影响功能。
指令范围
SKILL.md 和代码指示 Agent 对 arxiv.org 执行 HTTP GET,并将 PDF 与 JSON 元数据保存到本地文件系统——这符合声明的用途。指令不会读取无关的系统文件或环境变量。注意:该技能会对 arxiv.org 进行网络 I/O 并向指定的 output_dir 写入文件;README 声称“无 API 速率限制”,但批量下载仍可能受 arXiv 的速率限制/礼貌规则约束。
安装机制
安装规范要求 requests 包(已提供 requirements.txt)。禁止下载不受信任的 URL 或压缩包。安装规范中的 'uv' 类型似乎对应 Python 依赖安装器;整体而言合理且符合预期。
凭证需求
该技能无需环境变量、凭据或配置文件路径。其网络访问仅限于通过 HTTP 访问 arxiv.org。唯一需要的权限是对所选 output_dir(可配置)的文件系统写入权限。
持久化与权限
always:false(非强制包含)且 disable-model-invocation:false(正常自主)。该 skill 不会修改其他 skill 或全局 agent 配置,仅在自身输出目录下写入元数据/文件。
安全有层次,运行前请审查代码。

License

MIT

可自由使用、修改和再分发,需保留版权声明。

运行时依赖

无特殊依赖

版本

latestv1.0.82026/4/19

更新版本元数据

无害

安装命令

点击复制
官方npx clawhub@latest install arxiv-paper-downloader
镜像加速npx clawhub@latest install arxiv-paper-downloader --registry https://cn.longxiaskill.com

技能文档

从 arXiv 下载 AI/ML 论文,已按主题预分类。

功能

  • 3 大类 47+ 篇精选论文
  • 直接下载 PDF(无 API 限流)
  • 批量下载并导出元数据

分类

| 分类 | 论文数 | |------|--------| | agent_testing | 19 | | agents | 12 | | llm | 15 |

用法

``python # 按分类下载 download_papers("agent_testing") download_papers("all")

# 按 arXiv ID 下载 download_by_arxiv_ids(["2310.06129", "2402.01031"])

# 列出分类 list_categories() ``

依赖

  • Python 3.9+
  • requests>=2.28.0

许可证

MIT

数据来源ClawHub ↗ · 中文优化:龙虾技能库