安全扫描
OpenClaw
安全
high confidence该技能的代码、指令和声明的权限与论文搜索和下载助手的功能一致:它爬取百度学术和arXiv,将PDF下载到~/Desktop/papers,使用poppler工具提取文本和图片,并总结内容——未发现任何未解释的凭证请求或隐藏端点。
评估建议
该技能与其声明的目的相符,但在安装前请考虑以下几点:1) 它会将PDF从网络下载到~/Desktop/papers——请检查磁盘空间,并在您控制的目录中运行(不要以root身份运行)。2) 它爬取百度学术,可能会触发验证码或意外重定向;下载的链接可能指向任意主机,因此打开前请检查下载内容。3) 脚本调用本地工具(pdftotext/pdfimages)——请从您的操作系统包管理器安装poppler以避免第三方二进制文件。4) 由于SKILL.md建议一次性完成所有步骤,代理可能会自主下载多篇论文;请首先在沙箱中运行或手动调用脚本以验证行为。5) 如果您需要更严格的隐私/固件策略,请在使用前自行查看脚本(它们已包含在内)。...详细分析 ▾
✓ 用途与能力
名称/描述(论文搜索、PDF下载、总结)与包含的脚本和声明的依赖项(requests、BeautifulSoup、poppler)一致。所需的文件写入/网络权限以及pdftotext/pdfimages的使用与提取PDF和模型图成比例。
ℹ 指令范围
运行时指令和脚本向百度学术、arXiv和Semantic Scholar执行网络请求,解析页面,并将PDF下载到~/Desktop/papers。它们还在下载的PDF上运行本地外部工具(pdftotext/pdfimages)。这些操作与声明的目的相符,但SKILL.md的“一次性完成所有操作,不要分步骤”赋予了代理在一次运行中下载多个文件的广泛裁量权——用户应注意网络、验证码和磁盘影响。
✓ 安装机制
没有远程任意二进制文件下载。依赖项是标准Python包(pip)和操作系统包管理器安装的poppler-utils(pdfimages/pdftotext)。这是一种常见的低风险安装模式。
✓ 凭证需求
该技能不请求环境变量、凭证,仅声明网络和文件写入权限。没有请求无关的机密或系统配置路径。网络调用指向预期的服务(xueshu.baidu.com、arxiv.org、semanticscholar API)。
✓ 持久化与权限
always为false,没有修改其他技能或系统代理配置的代码。该技能仅在~/Desktop/papers下写入文件,并按声明使用/tmp进行临时工作。
安全有层次,运行前请审查代码。
运行时依赖
无特殊依赖
版本
latestv1.1.02026/4/16
添加完整安全声明:声明外部进程、文件操作、网络访问的用途和安全性
● 无害
安装命令
点击复制官方npx clawhub@latest install baidu-scholar-helper
镜像加速npx clawhub@latest install baidu-scholar-helper --registry https://cn.longxiaskill.com镜像同步中
技能文档
一键搜索学术论文,自动下载PDF,智能总结核心工作与创新点。
功能清单
百度学术
- ✅ 关键词搜索 + 年份筛选
- ✅ 按引用量排序(高引用在前)
- ✅ 每次显示5-10篇论文
- ✅ 自动提取核心工作
- ✅ 自动提取创新点
- ✅ 显示模型图(如有)
- ✅ 显示论文链接
- ✅ 自动下载PDF
arXiv
- ✅ 关键词搜索(官方API)
- ✅ 按相关度排序
- ✅ 自动提取核心工作
- ✅ 自动提取创新点
- ✅ 显示arXiv分类
- ✅ 显示论文链接
- ✅ 自动下载PDF
安装指南
1. 安装 Python 依赖
pip install requests beautifulsoup4 Pillow
2. 安装系统依赖(用于提取PDF模型图)
Ubuntu/Debian:
sudo apt-get install -y poppler-utils
macOS:
brew install poppler
Fedora/CentOS:
sudo dnf install -y poppler-utils
# 或
sudo yum install -y poppler-utils
3. 验证安装
# 检查 poppler-utils 是否安装成功
which pdftotext pdfimages
PDF保存规则
保存位置
~/Desktop/papers/<论文方向>/
每次搜索会自动创建以关键词命名的文件夹,方便分类管理。
命名格式
标题_年份_J.pdf # 期刊论文
标题_年份_C.pdf # 会议论文
arXiv预印本也按此格式命名(根据分类自动判断J/C)。
使用方法
命令行
# 百度学术 python scripts/search.py baidu 大模型 python scripts/search.py baidu 人工智能 2024
# arXiv python scripts/search.py arxiv transformer python scripts/search.py arxiv "deep learning" 5
对话方式
用户:百度学术搜索 大模型 AI:运行脚本,返回论文列表 + 核心工作 + 创新点 + PDF下载
用户:arXiv GPT 5 AI:搜索arXiv并下载前5篇论文
输出示例
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━ 📄 【1】引用量:⭐1523 ━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━ 📌 标题:Attention Is All You Need 👥 作者:Vaswani A, Shazeer N, Parmar N 📚 来源:NeurIPS 2017 🔗 链接:https://...🧠 【核心工作】 本文提出了一种新的简单网络架构——Transformer,完全基于注意力机制, 彻底摒弃了循环和卷积。
💡 【创新点】 提出多头注意力机制,在机器翻译任务上取得了最优性能,同时训练速度大幅提升。
🖼️ 【模型图】 https://...
⬇️ 下载PDF... ✅ 已下载:Attention Is All You Need_2017_C.pdf
脚本说明
| 脚本 | 说明 |
|---|---|
main.py | 百度学术搜索脚本 |
arxiv_search_v2.py | arXiv API搜索脚本 |
search.py | 统一入口脚本 |
extract_model_figure.py | PDF模型图提取脚本 |
注意事项
- 百度学术可能触发验证码拦截
- arXiv API有速率限制,脚本已内置重试机制
- 下载的PDF请用于学术研究,尊重版权
- 引用量数据来自百度学术,仅供参考
- 模型图提取功能需要安装
poppler-utils
系统要求
- Python 3.7+
- 网络连接(访问百度学术/arXiv)
- 磁盘空间(存储下载的PDF)