Segment Anything — SAM — 背景移除与图像分割

Name: Segment Anything — SAM — 背景移除与图像分割
Author: scikkk

scikkk

Segment Anything — SAM — 背景移除与图像分割

v1.0.0

使用 Meta 的 SAM (Segment Anything Model) 移除图像背景并将前景主体提取为透明 PNG。适用于用户想要移除背景、裁剪对象、提取前景主体或进行图像分割的场景。

0· 216·0 当前·0 累计

by @scikkk·MIT-0

生产力工具

下载技能包

License

MIT-0

最后更新

2026/4/14

安全扫描

VirusTotal

可疑

查看报告

OpenClaw

安全

high confidence

此技能与其描述内在一致：运行基于 SAM 的分割脚本，安装预期的 Python 包（以及 segment_anything 仓库）并下载官方 SAM 检查点；不请求无关凭证或访问权限。

评估建议

此技能似乎符合其声称的功能，但会：(1) 在运行时自动从 GitHub 安装 segment_anything 包，(2) 下载大型模型检查点（约 375MB–2.5GB）到 ~/.cache/sam。在安装前，请确保您有足够的磁盘空间和带宽，并信任从 segment-anything GitHub 仓库拉取代码。如果您更喜欢更严格的控制，请预安装依赖项并通过 --checkpoint 提供本地检查点，以避免运行时 pip 安装和下载。在支持大型原生包（torch）的环境中运行（并考虑 GPU/CUDA 兼容性），或者如果您想限制风险，请在隔离的沙箱中运行。...

详细分析 ▾

✓ 用途与能力

名称/描述（SAM 背景移除）与代码和声明的依赖项相符：python3、pillow、numpy、torch、torchvision 和 segment_anything 包。脚本实现了所宣传的分割和保存透明 PNG 功能。

✓ 指令范围

SKILL.md 简单指示运行 scripts/segment.py 并记录参数。运行时行为（通过 pip 自动安装 segment_anything 并自动下载模型检查点到 ~/.cache/sam）描述清晰。指令不读取无关文件、环境变量或向意外端点传输数据。

ℹ 安装机制

安装规范列出 pillow、numpy、torch、torchvision（适合 SAM）。脚本可能在需要时自动运行 pip install git+https://github.com/facebookresearch/segment-anything.git 并从 dl.fbaipublicfiles.com（Meta 的公共托管）下载大型模型检查点。这是预期的，但涉及动态代码下载和大型网络传输（约 375MB–2.5GB）。

✓ 凭证需求

不请求环境变量、凭证或无关配置路径。脚本将检查点写入 ~/.cache/sam 并在用户指定的位置保存输出；这些都与功能相称。

✓ 持久化与权限

always 为 false，该技能不修改其他技能或系统级设置。它仅将模型检查点存储在用户的缓存目录中，这对于重复使用是合理的。

安全有层次，运行前请审查代码。

License

MIT-0

可自由使用、修改和再分发，无需署名。

查看条款 ↗

运行时依赖

无特殊依赖

版本

latestv1.0.02026/3/14

- "sam-segmentation" 技能初次发布，用于背景移除和图像分割。 - 使用 Meta 的 Segment Anything Model (SAM) 从图像中提取前景主体并保存为透明 PNG。 - 支持多种模型尺寸（`vit_b`、`vit_l`、`vit_h`）以满足不同的速度和质量需求。 - 允许前景提示点、网格扫描模式以提取所有不同元素，以及各种掩码过滤参数。 - 首次使用时自动安装所需依赖项（`segment_anything`、Pillow、numpy、torch、torchvision）。 - 如果未提供模型检查点，则自动下载。

● 可疑

安装命令点击复制

官方npx clawhub@latest install sam

镜像加速npx clawhub@latest install sam --registry https://cn.clawhub-mirror.com

技能文档

使用 Meta 的 Segment Anything Model 从图像中提取前景主体，输出透明 PNG。

快速开始

python3 scripts/segment.py

默认以图像中心作为前景提示点——适用于主体居中的人像和产品照片。

参数

参数	描述	默认值
`input`	输入图像路径	必填
`output`	输出 PNG 路径（单模式）或目录（`--all` 模式）	必填
`--model`	模型尺寸：`vit_b`（快速）· `vit_l`（中等）· `vit_h`（最佳质量）	`vit_h`
`--checkpoint`	本地检查点路径；如省略则自动下载	自动
`--points`	前景提示点，格式为 `x,y`，可多个	中心
`--all`	网格扫描模式：提取所有不同元素	关闭
`--grid`	`--all` 的网格密度；16 表示 16×16=256 个探测点	`16`
`--iou-thresh`	接受掩码的最小预测 IoU（`--all`）	`0.88`
`--min-area`	最小掩码面积占图像的比例（`--all`）	`0.001`

示例

# 基础背景移除（自动下载 vit_h 约 2.5GB） python3 scripts/segment.py photo.jpg output.png # 主体偏离中心时指定提示点 python3 scripts/segment.py photo.jpg output.png --points 320,240 # 多个提示点配合轻量级模型 python3 scripts/segment.py photo.jpg output.png --model vit_b --points 320,240 400,300 # 提取所有元素（每个元素一个 PNG） python3 scripts/segment.py photo.jpg ./elements/ --all # 更密集的网格以捕获小物体 python3 scripts/segment.py photo.jpg ./elements/ --all --grid 32

# 使用本地检查点 python3 scripts/segment.py photo.jpg output.png --checkpoint /path/to/sam_vit_h_4b8939.pth

依赖项

首次运行时自动安装 segment_anything，或手动安装：

pip install git+https://github.com/facebookresearch/segment-anything.git
pip install pillow numpy torch torchvision

工作流程

1.用户提供图像路径 2.询问是否需要提示点（当主体偏离中心时） 3.运行脚本；首次使用时检查点自动下载到 ~/.cache/sam/ 4.输出透明背景 PNG

模型选择

模型	尺寸	速度	质量
`vit_b`	约 375 MB	最快	良好
`vit_l`	约 1.25 GB	中等	更好
`vit_h`	约 2.5 GB	较慢	最佳

有 GPU 时自动使用 CUDA。

Extract foreground subjects from images using Meta's Segment Anything Model, outputting transparent PNGs.

Quick Start

python3 scripts/segment.py

Defaults to the image center as the foreground hint — works well for portraits and product shots where the subject is centered.

Parameters

Param	Description	Default
`input`	Input image path	required
`output`	Output PNG path (single mode) or directory (`--all` mode)	required
`--model`	Model size: `vit_b` (fast) · `vit_l` (medium) · `vit_h` (best quality)	`vit_h`
`--checkpoint`	Local checkpoint path; auto-downloaded if omitted	auto
`--points`	Foreground hint points as `x,y`, multiple allowed	center
`--all`	Grid-sweep mode: extract all distinct elements	off
`--grid`	Grid density for `--all`; 16 means 16×16=256 probe points	`16`
`--iou-thresh`	Minimum predicted IoU to accept a mask (`--all`)	`0.88`
`--min-area`	Minimum mask area as fraction of image (`--all`)	`0.001`

Examples

# Basic background removal (auto-downloads vit_h ~2.5GB) python3 scripts/segment.py photo.jpg output.png # Specify hint point when subject is off-center python3 scripts/segment.py photo.jpg output.png --points 320,240 # Multiple hints with lightweight model python3 scripts/segment.py photo.jpg output.png --model vit_b --points 320,240 400,300 # Extract all elements (one PNG per element) python3 scripts/segment.py photo.jpg ./elements/ --all # Denser grid to capture small objects python3 scripts/segment.py photo.jpg ./elements/ --all --grid 32

# Use a local checkpoint python3 scripts/segment.py photo.jpg output.png --checkpoint /path/to/sam_vit_h_4b8939.pth

Dependencies

segment_anything is auto-installed on first run, or install manually:

pip install git+https://github.com/facebookresearch/segment-anything.git
pip install pillow numpy torch torchvision

Workflow

User provides image path
Ask if hint points are needed (when subject is off-center)
Run script; checkpoint auto-downloads on first use to ~/.cache/sam/
Output transparent-background PNG

Model Selection

Model	Size	Speed	Quality
`vit_b`	~375 MB	fastest	good
`vit_l`	~1.25 GB	medium	better
`vit_h`	~2.5 GB	slower	best

CUDA is used automatically when a GPU is available.

数据来源：ClawHub ↗ · 中文优化：龙虾技能库

OpenClaw 技能定制 / 插件定制 / 私有工作流定制

免费技能或插件可能存在安全风险，如需更匹配、更安全的方案，建议联系付费定制

了解定制服务

License

运行时依赖

版本

安装命令 点击复制

技能文档

快速开始

参数

示例

依赖项

工作流程

模型选择

Quick Start

Parameters

Examples

Dependencies

Workflow

Model Selection

安装命令点击复制