百度学术助手 — baidu-scholar-helper — 学术科研助手

v1.1.0

学术科研助手，支持百度学术和arXiv搜索、PDF自动下载、工作总结+创新点、引用量查询

0· 32·0 当前·0 累计

by @weiliuah (WeiLiuAH)·MIT-0

生产力工具

下载技能包

License

MIT-0

最后更新

2026/4/16

安全扫描

VirusTotal

无害

查看报告

OpenClaw

安全

high confidence

该技能的代码、指令和声明的权限与论文搜索和下载助手的功能一致：它爬取百度学术和arXiv，将PDF下载到~/Desktop/papers，使用poppler工具提取文本和图片，并总结内容——未发现任何未解释的凭证请求或隐藏端点。

评估建议

该技能与其声明的目的相符，但在安装前请考虑以下几点：1) 它会将PDF从网络下载到~/Desktop/papers——请检查磁盘空间，并在您控制的目录中运行（不要以root身份运行）。2) 它爬取百度学术，可能会触发验证码或意外重定向；下载的链接可能指向任意主机，因此打开前请检查下载内容。3) 脚本调用本地工具(pdftotext/pdfimages)——请从您的操作系统包管理器安装poppler以避免第三方二进制文件。4) 由于SKILL.md建议一次性完成所有步骤，代理可能会自主下载多篇论文；请首先在沙箱中运行或手动调用脚本以验证行为。5) 如果您需要更严格的隐私/固件策略，请在使用前自行查看脚本（它们已包含在内）。...

详细分析 ▾

✓ 用途与能力

名称/描述（论文搜索、PDF下载、总结）与包含的脚本和声明的依赖项（requests、BeautifulSoup、poppler）一致。所需的文件写入/网络权限以及pdftotext/pdfimages的使用与提取PDF和模型图成比例。

ℹ 指令范围

运行时指令和脚本向百度学术、arXiv和Semantic Scholar执行网络请求，解析页面，并将PDF下载到~/Desktop/papers。它们还在下载的PDF上运行本地外部工具（pdftotext/pdfimages）。这些操作与声明的目的相符，但SKILL.md的“一次性完成所有操作，不要分步骤”赋予了代理在一次运行中下载多个文件的广泛裁量权——用户应注意网络、验证码和磁盘影响。

✓ 安装机制

没有远程任意二进制文件下载。依赖项是标准Python包（pip）和操作系统包管理器安装的poppler-utils（pdfimages/pdftotext）。这是一种常见的低风险安装模式。

✓ 凭证需求

该技能不请求环境变量、凭证，仅声明网络和文件写入权限。没有请求无关的机密或系统配置路径。网络调用指向预期的服务（xueshu.baidu.com、arxiv.org、semanticscholar API）。

✓ 持久化与权限

always为false，没有修改其他技能或系统代理配置的代码。该技能仅在~/Desktop/papers下写入文件，并按声明使用/tmp进行临时工作。

安全有层次，运行前请审查代码。

License

MIT-0

可自由使用、修改和再分发，无需署名。

查看条款 ↗

运行时依赖

无特殊依赖

版本

latestv1.1.02026/4/16

添加完整安全声明：声明外部进程、文件操作、网络访问的用途和安全性

● 无害

安装命令

点击复制

官方npx clawhub@latest install baidu-scholar-helper

镜像加速npx clawhub@latest install baidu-scholar-helper --registry https://cn.longxiaskill.com 镜像可用

需要定制？告诉我你的需求 →

技能文档

一键搜索学术论文，自动下载PDF，智能总结核心工作与创新点。

功能清单

百度学术

✅ 关键词搜索 + 年份筛选
✅ 按引用量排序（高引用在前）
✅ 每次显示5-10篇论文
✅ 自动提取核心工作
✅ 自动提取创新点
✅ 显示模型图（如有）
✅ 显示论文链接
✅ 自动下载PDF

arXiv

✅ 关键词搜索（官方API）
✅ 按相关度排序
✅ 自动提取核心工作
✅ 自动提取创新点
✅ 显示arXiv分类
✅ 显示论文链接
✅ 自动下载PDF

安装指南

1. 安装 Python 依赖

pip install requests beautifulsoup4 Pillow

2. 安装系统依赖（用于提取PDF模型图）

Ubuntu/Debian:

sudo apt-get install -y poppler-utils

macOS:

brew install poppler

Fedora/CentOS:

sudo dnf install -y poppler-utils
# 或
sudo yum install -y poppler-utils

3. 验证安装

# 检查 poppler-utils 是否安装成功
which pdftotext pdfimages

PDF保存规则

保存位置

~/Desktop/papers/<论文方向>/

每次搜索会自动创建以关键词命名的文件夹，方便分类管理。

命名格式

标题_年份_J.pdf # 期刊论文
标题_年份_C.pdf # 会议论文

arXiv预印本也按此格式命名（根据分类自动判断J/C）。

使用方法

命令行

# 百度学术 python scripts/search.py baidu 大模型 python scripts/search.py baidu 人工智能 2024

# arXiv python scripts/search.py arxiv transformer python scripts/search.py arxiv "deep learning" 5

对话方式

用户：百度学术搜索大模型 AI：运行脚本，返回论文列表 + 核心工作 + 创新点 + PDF下载

用户：arXiv GPT 5 AI：搜索arXiv并下载前5篇论文

输出示例

━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━ 📄 【1】引用量：⭐1523 ━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━ 📌 标题：Attention Is All You Need 👥 作者：Vaswani A, Shazeer N, Parmar N 📚 来源：NeurIPS 2017 🔗 链接：https://... 🧠 【核心工作】本文提出了一种新的简单网络架构——Transformer，完全基于注意力机制，彻底摒弃了循环和卷积。 💡 【创新点】提出多头注意力机制，在机器翻译任务上取得了最优性能，同时训练速度大幅提升。 🖼️ 【模型图】 https://...

⬇️ 下载PDF... ✅ 已下载：Attention Is All You Need_2017_C.pdf

脚本说明

脚本	说明
`main.py`	百度学术搜索脚本
`arxiv_search_v2.py`	arXiv API搜索脚本
`search.py`	统一入口脚本
`extract_model_figure.py`	PDF模型图提取脚本

注意事项

百度学术可能触发验证码拦截
arXiv API有速率限制，脚本已内置重试机制
下载的PDF请用于学术研究，尊重版权
引用量数据来自百度学术，仅供参考
模型图提取功能需要安装 poppler-utils

系统要求

Python 3.7+
网络连接（访问百度学术/arXiv）
磁盘空间（存储下载的PDF）

License

运行时依赖

版本

安装命令

技能文档

功能清单

百度学术

arXiv

安装指南

1. 安装 Python 依赖

2. 安装系统依赖（用于提取PDF模型图）

3. 验证安装

PDF保存规则

保存位置

命名格式

使用方法

命令行

对话方式

输出示例

脚本说明

注意事项

系统要求

相关技能推荐