Pdf Figure Extractor — Pdf Figure 提取器

v1.0.0

从PDF论文中精确提取Figure图片，自动分析PDF结构、定位caption位置、裁剪干净图形，并验证图片质量。支持学术新闻稿、论文写作等场景的自动化图片处理。

0· 340·0 当前·0 累计

by @438061781·MIT-0

文件处理

下载技能包

License

MIT-0

License

MIT-0

可自由使用、修改和再分发，无需署名。

查看条款 ↗

运行时依赖

无特殊依赖

安装命令

点击复制

官方npx clawhub@latest install pdf-figure-extractor

镜像加速npx clawhub@latest install pdf-figure-extractor --registry https://cn.longxiaskill.com 镜像可用

需要定制？告诉我你的需求 →

技能文档

PDF Figure提取技能使用场景从学术论文PDF提取Figure插入Word文档需要干净、无caption、无正文的纯图形图片批量提取多个Figure 标准工作流程步骤1: 分析PDF结构导入 fitz

doc = fitz.open(pdf_path) page = doc[page_num]

# 获取所有文本块 blocks = page.获取_text("blocks") for block in blocks: x0, y0, x1, y1, text, block_no, block_type = block if "Fig." in text or "Figure" in text: print(f"Figure相关: y={y0:.0f}-{y1:.0f}, {text[:50]}...")

步骤2: 定位Caption位置 # 搜索Fig. X的精确位置 text_instances = page.搜索_for(f"Fig. {fig_num}") for inst in text_instances: print(f"Fig.{fig_num}位置: y={inst.y0:.0f}-{inst.y1:.0f}")

步骤3: 确定裁剪区域

根据caption位置判断图形区域：

Caption位置图形区域 y=400 (页面中部) y=100-395 (caption上方) y=666 (页面底部) y=350-660 (caption上方) y=326 (页面底部) y=100-320 (caption上方) 步骤4: 精确裁剪 rect = fitz.Rect(50, y_启动, page.rect.width - 50, y_end) pix = page.获取_pixmap(matrix=fitz.Matrix(2, 2), 命令行工具p=rect) pix.save(f"fig{fig_num}.png")

步骤5: 验证图片质量

检查清单：

包含所有子图(a,b,c,d...) 没有混入"Fig. X"开头的caption文字没有混入正文段落坐标轴和标签完整常见PDF布局模板 Nature/Science论文 Fig.1: 通常caption在底部，图形y=350-660 Fig.2+: caption位置不固定，需要先分析会议论文单栏布局: caption通常在图形下方双栏布局: caption可能在图形上方或下方错误处理问题: 图片混入正文

原因: 裁剪范围太大解决: 缩小y_end，确保在caption之前结束

问题: 子图缺失

原因: 裁剪范围太小解决: 扩大y_启动/y_end，包含完整图形

问题: caption未去除

原因: 裁剪范围包含了caption区域解决: 根据caption的y坐标精确调整裁剪边界

最佳实践永远不要凭感觉估计坐标始终先分析PDF文本块结构高分辨率渲染: 使用matrix=fitz.Matrix(2, 2) 验证每张图片: 确保干净无杂质记录坐标: 为常见PDF类型建立坐标模板触发关键词

"提取PDF图片", "从PDF提取Figure", "PDF图片裁剪", "学术论文图片提取"

License

运行时依赖

安装命令

技能文档

相关技能推荐