基于 Segment Anything 模型的图像分割部署与测试 | 极客日志

PythonAI算法

基于 Segment Anything 模型的图像分割部署与测试

综述由AI生成Segment Anything Model（SAM）可根据输入提示生成高质量对象遮罩。演示了在 Linux 环境下配置 PyTorch 与 CUDA，安装 SAM 依赖库，下载预训练模型文件，并通过命令行脚本及 Web Demo 进行图像分割测试的全过程。涵盖环境搭建、模型推理及 ONNX 导出步骤，适用于 AI 图像分割任务开发。

数字游民发布于 2025/1/20更新于 2026/6/216 浏览

前言

最近在研究图像处理的过程中，接触到了 Meta 开源的图像分割项目，看了他们官网的 demo 演示，感觉很神奇。上传一张图片，点击一下就能将点击的物体切割出来，很类似自动物体识别，智能抠图。于是决定深入研究学习一番。要研究学习一个模型，必不可少地要用到 GPU 计算。

环境准备

登录云服务平台，创建 GPU 实例。规格选择如下：镜像选择：PyTorch 2.3.0, Python 3.10.14, 系统 Ubuntu-22.04, CUDA 版本：12.1。

环境配置内置了 CUDA，可自由选择 PyTorch，Python CUDA 版本，节省手动配置时间。注意：segment-anything 模型的要求 python>=3.8 , pytorch>=1.7, torchvision>=0.8。实例创建成功后，点击操作栏的 JupyterLab 打开实例中已安装的 Jupyter，或使用访问链接和密码访问服务器终端。

Jupyter 访问终端登录

Segment Anything 模型介绍

Segment Anything Model（SAM）可根据输入提示（如点或方框）生成高质量的对象遮罩，并可用于为图像中的所有对象生成遮罩。该模型已在一个包含 1100 万张图像和 11 亿个遮罩的数据集上进行过训练，在各种分割任务中都具有很强的零样本性能。

SAM 示意图

配置环境

进入 GPU 实例的终端，部署 Segment Anything 模型。要在实例中安装 Segment Anything 模型，有两种方式：第一种：在实例的终端中执行下面的命令

pip install git+https://github.com/facebookresearch/segment-anything.git

第二种：你也可以执行下面的命令来安装

git clone [email protected]:facebookresearch/segment-anything.git cd segment-anything; pip install -e .

安装还需要安装相关的依赖库

pip install opencv-python pycocotools matplotlib onnxruntime onnx

环境安装过程如下图所示。

环境安装通过上面的步骤，我们已经安装好了模型运行的环境。

相关免费在线工具

加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
RSA密钥对生成器
生成新的随机RSA私钥和公钥pem证书。在线工具，RSA密钥对生成器在线工具，online
Mermaid 预览与可视化编辑
基于 Mermaid.js 实时预览流程图、时序图等图表，支持源码编辑与即时渲染。在线工具，Mermaid 预览与可视化编辑在线工具，online
随机西班牙地址生成器
随机生成西班牙地址（支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选），支持数量快捷选择、显示全部与下载。在线工具，随机西班牙地址生成器在线工具，online
Gemini 图片去水印
基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印，支持批量处理与下载。在线工具，Gemini 图片去水印在线工具，online
curl 转代码
解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。在线工具，curl 转代码在线工具，online

python scripts/amg.py --checkpoint /root/shared-storage/sam_vit_h_4b8939.pth --model-type vit_h --input /root/shared-storage/de.png --output /home/imgoutput

import numpy as np 
import cv2 
from segment_anything import SamPredictor, sam_model_registry 
checkpoint = "/root/shared-storage/sam_vit_h_4b8939.pth" 
model_type = "vit_h" 
sam = sam_model_registry[model_type](checkpoint=checkpoint) 
sam.to(device='cuda') 
predictor = SamPredictor(sam) 
image = cv2.imread('/root/shared-storage/de.png') 
predictor.set_image(image) 
image_embedding = predictor.get_image_embedding().cpu().numpy() 
np.save("de_embedding.npy", image_embedding)

python scripts/export_onnx_model.py --checkpoint /root/shared-storage/sam_vit_h_4b8939.pth --model-type vit_h --output /root/shared-storage/sam_vit_h_onnx_example.onnx

yarn && yarn start

基于 Segment Anything 模型的图像分割部署与测试

前言

环境准备

Segment Anything 模型介绍

配置环境

更多推荐文章

相关免费在线工具

下载模型，运行模型

测试模型

运行 Demo

总结

更多推荐文章

相关免费在线工具

基于 Segment Anything 模型的图像分割部署与测试

前言

环境准备

Segment Anything 模型介绍

配置环境

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

下载模型，运行模型

测试模型

运行 Demo

总结

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具