首页龙虾技能列表 › Segment Anything — SAM — 背景移除与图像分割

Segment Anything — SAM — 背景移除与图像分割

v1.0.0

使用 Meta 的 SAM (Segment Anything Model) 移除图像背景并将前景主体提取为透明 PNG。适用于用户想要移除背景、裁剪对象、提取前景主体或进行图像分割的场景。

0· 216·0 当前·0 累计
by @scikkk·MIT-0
下载技能包
License
MIT-0
最后更新
2026/4/14
安全扫描
VirusTotal
可疑
查看报告
OpenClaw
安全
high confidence
此技能与其描述内在一致:运行基于 SAM 的分割脚本,安装预期的 Python 包(以及 segment_anything 仓库)并下载官方 SAM 检查点;不请求无关凭证或访问权限。
评估建议
此技能似乎符合其声称的功能,但会:(1) 在运行时自动从 GitHub 安装 segment_anything 包,(2) 下载大型模型检查点(约 375MB–2.5GB)到 ~/.cache/sam。在安装前,请确保您有足够的磁盘空间和带宽,并信任从 segment-anything GitHub 仓库拉取代码。如果您更喜欢更严格的控制,请预安装依赖项并通过 --checkpoint 提供本地检查点,以避免运行时 pip 安装和下载。在支持大型原生包(torch)的环境中运行(并考虑 GPU/CUDA 兼容性),或者如果您想限制风险,请在隔离的沙箱中运行。...
详细分析 ▾
用途与能力
名称/描述(SAM 背景移除)与代码和声明的依赖项相符:python3、pillow、numpy、torch、torchvision 和 segment_anything 包。脚本实现了所宣传的分割和保存透明 PNG 功能。
指令范围
SKILL.md 简单指示运行 scripts/segment.py 并记录参数。运行时行为(通过 pip 自动安装 segment_anything 并自动下载模型检查点到 ~/.cache/sam)描述清晰。指令不读取无关文件、环境变量或向意外端点传输数据。
安装机制
安装规范列出 pillow、numpy、torch、torchvision(适合 SAM)。脚本可能在需要时自动运行 pip install git+https://github.com/facebookresearch/segment-anything.git 并从 dl.fbaipublicfiles.com(Meta 的公共托管)下载大型模型检查点。这是预期的,但涉及动态代码下载和大型网络传输(约 375MB–2.5GB)。
凭证需求
不请求环境变量、凭证或无关配置路径。脚本将检查点写入 ~/.cache/sam 并在用户指定的位置保存输出;这些都与功能相称。
持久化与权限
always 为 false,该技能不修改其他技能或系统级设置。它仅将模型检查点存储在用户的缓存目录中,这对于重复使用是合理的。
安全有层次,运行前请审查代码。

License

MIT-0

可自由使用、修改和再分发,无需署名。

运行时依赖

无特殊依赖

版本

latestv1.0.02026/3/14

- "sam-segmentation" 技能初次发布,用于背景移除和图像分割。 - 使用 Meta 的 Segment Anything Model (SAM) 从图像中提取前景主体并保存为透明 PNG。 - 支持多种模型尺寸(`vit_b`、`vit_l`、`vit_h`)以满足不同的速度和质量需求。 - 允许前景提示点、网格扫描模式以提取所有不同元素,以及各种掩码过滤参数。 - 首次使用时自动安装所需依赖项(`segment_anything`、Pillow、numpy、torch、torchvision)。 - 如果未提供模型检查点,则自动下载。

● 可疑

安装命令 点击复制

官方npx clawhub@latest install sam
镜像加速npx clawhub@latest install sam --registry https://cn.clawhub-mirror.com

技能文档

使用 Meta 的 Segment Anything Model 从图像中提取前景主体,输出透明 PNG。

快速开始

python3 scripts/segment.py  

默认以图像中心作为前景提示点——适用于主体居中的人像和产品照片。

参数

参数描述默认值
input输入图像路径必填
output输出 PNG 路径(单模式)或目录(--all 模式)必填
--model模型尺寸:vit_b(快速)· vit_l(中等)· vit_h(最佳质量)vit_h
--checkpoint本地检查点路径;如省略则自动下载自动
--points前景提示点,格式为 x,y,可多个中心
--all网格扫描模式:提取所有不同元素关闭
--grid--all 的网格密度;16 表示 16×16=256 个探测点16
--iou-thresh接受掩码的最小预测 IoU(--all0.88
--min-area最小掩码面积占图像的比例(--all0.001

示例

# 基础背景移除(自动下载 vit_h 约 2.5GB)
python3 scripts/segment.py photo.jpg output.png

# 主体偏离中心时指定提示点 python3 scripts/segment.py photo.jpg output.png --points 320,240

# 多个提示点配合轻量级模型 python3 scripts/segment.py photo.jpg output.png --model vit_b --points 320,240 400,300

# 提取所有元素(每个元素一个 PNG) python3 scripts/segment.py photo.jpg ./elements/ --all

# 更密集的网格以捕获小物体 python3 scripts/segment.py photo.jpg ./elements/ --all --grid 32

# 使用本地检查点 python3 scripts/segment.py photo.jpg output.png --checkpoint /path/to/sam_vit_h_4b8939.pth

依赖项

首次运行时自动安装 segment_anything,或手动安装:

pip install git+https://github.com/facebookresearch/segment-anything.git
pip install pillow numpy torch torchvision

工作流程

1.用户提供图像路径 2.询问是否需要提示点(当主体偏离中心时) 3.运行脚本;首次使用时检查点自动下载到 ~/.cache/sam/ 4.输出透明背景 PNG

模型选择

模型尺寸速度质量
vit_b约 375 MB最快良好
vit_l约 1.25 GB中等更好
vit_h约 2.5 GB较慢最佳
有 GPU 时自动使用 CUDA。

数据来源:ClawHub ↗ · 中文优化:龙虾技能库
OpenClaw 技能定制 / 插件定制 / 私有工作流定制

免费技能或插件可能存在安全风险,如需更匹配、更安全的方案,建议联系付费定制

了解定制服务