详细分析 ▾
运行时依赖
版本
- Initial release of segment-anything skill (sam-segmentation-zh). - Provides image background removal using Meta’s Segment Anything Model (SAM), outputting transparent PNGs. - Supports customizable models, foreground point hints, and advanced options for extracting multiple elements. - Includes CLI usage instructions and detailed parameter explanations. - Automatic handling of model downloads and dependency installation.
安装命令 点击复制
技能文档
使用 Meta 的 Segment Anything Model 从图像中提取前景主体,输出透明背景的 PNG 文件。
快速开始
python3 scripts/segment.py <输入图像> <输出.png>
默认以图像中心作为前景提示点——适用于主体居中的人像和产品图。
参数说明
| 参数 | 说明 | 默认值 |
|---|---|---|
input | 输入图像路径 | 必填 |
output | 输出 PNG 路径(单目标模式)或目录(--all 模式) | 必填 |
--model | 模型大小:vit_b(快速)· vit_l(中等)· vit_h(最佳质量) | vit_h |
--checkpoint | 本地权重文件路径;省略时自动下载 | 自动 |
--points | 前景提示点,格式为 x,y,可指定多个 | 中心点 |
--all | 网格扫描模式:提取所有独立元素 | 关闭 |
--grid | --all 模式的网格密度;16 表示 16×16=256 个探测点 | 16 |
--iou-thresh | 接受掩码的最低预测 IoU(--all 模式) | 0.88 |
--min-area | 掩码最小面积占图像比例(--all 模式) | 0.001 |
使用示例
# 基础背景去除(自动下载 vit_h 约 2.5GB)
python3 scripts/segment.py photo.jpg output.png# 主体偏离中心时指定提示点
python3 scripts/segment.py photo.jpg output.png --points 320,240
# 多提示点 + 轻量模型
python3 scripts/segment.py photo.jpg output.png --model vit_b --points 320,240 400,300
# 提取所有元素(每个元素输出一个 PNG)
python3 scripts/segment.py photo.jpg ./elements/ --all
# 使用更密集的网格捕获小物体
python3 scripts/segment.py photo.jpg ./elements/ --all --grid 32
# 使用本地权重文件
python3 scripts/segment.py photo.jpg output.png --checkpoint /path/to/sam_vit_h_4b8939.pth
依赖安装
segment_anything 首次运行时自动安装,也可手动安装:
pip install git+https://github.com/facebookresearch/segment-anything.git
pip install pillow numpy torch torchvision
工作流程
- 用户提供图像路径
- 询问是否需要提示点(主体偏离中心时)
- 运行脚本;权重文件首次使用时自动下载至
~/.cache/sam/ - 输出透明背景的 PNG 文件
模型选择
| 模型 | 大小 | 速度 | 质量 |
|---|---|---|---|
vit_b | ~375 MB | 最快 | 良好 |
vit_l | ~1.25 GB | 中等 | 较好 |
vit_h | ~2.5 GB | 较慢 | 最佳 |
免费技能或插件可能存在安全风险,如需更匹配、更安全的方案,建议联系付费定制