SAM 3开源大模型部署教程：Docker、Jupyter与Web三模式详解 | 极客日志

PythonAI算法

SAM 3开源大模型部署教程：Docker、Jupyter与Web三模式详解

介绍 SAM 3 开源大模型的三种部署方式：Docker 一键启动、Jupyter 交互调试及 Web 可视化操作。涵盖环境准备（GPU/系统）、镜像拉取、服务运行及常见问题排查。通过 Docker 封装依赖，用户可快速在本地实现图像与视频的智能分割与跟踪，无需编写复杂代码即可体验视觉理解能力。

花里胡哨发布于 2026/4/6更新于 2026/7/2771 浏览

SAM 3开源大模型部署教程：Docker、Jupyter与Web三模式详解

1. 为什么你需要SAM 3——不只是分割，而是理解视觉内容

你有没有遇到过这样的问题：想从一张杂乱的街景图里快速抠出所有行人，或者从一段监控视频中持续追踪某个包裹？传统方法要么需要大量标注数据，要么得写一堆OpenCV规则，费时又难泛化。SAM 3不一样——它不靠预设规则，而是像人一样'看懂'画面：你点一下、框一下，甚至只说一句'那个穿红衣服的人'，它就能立刻识别、分割、跟踪。

这不是概念演示，而是已经能跑在你本地机器上的真实能力。SAM 3是Meta（Facebook）推出的统一基础模型，专为图像和视频中的可提示分割设计。它把检测、分割、跟踪三个任务融合进一个模型，支持文本提示（如'cat'、'bicycle'）、点提示（单击目标区域）、框提示（拖拽包围目标）、掩码提示（粗略涂鸦）等多种交互方式。更关键的是，它不是只能处理静态图——视频中同一物体的跨帧一致性分割效果非常稳定，这对安防、电商、内容创作等场景来说，意味着开箱即用的生产力提升。

本文不讲论文公式，也不堆参数指标。我们直接带你走通三条最实用的部署路径：Docker一键启动、Jupyter交互调试、Web可视化操作。无论你是刚接触AI的开发者，还是需要快速验证方案的产品经理，都能在30分钟内让SAM 3在你机器上真正'动起来'。

2. 环境准备：三步搞定基础依赖

在开始部署前，先确认你的系统满足最低要求。SAM 3对硬件有一定要求，但远低于训练级模型——我们聚焦推理场景，所以重点在'能跑通'和'够流畅'。

2.1 硬件与系统要求

GPU：推荐NVIDIA显卡（RTX 3060及以上），显存≥8GB（视频处理建议≥12GB）
CPU：4核以上，主频≥2.5GHz
内存：16GB以上（处理高清视频建议32GB）
操作系统：Ubuntu 20.04/22.04（推荐），或Windows 10/11（需WSL2环境）
软件依赖：Docker 24.0+、NVIDIA Container Toolkit（GPU加速必需）

小贴士：如果你没有独立GPU，也可以用CPU模式运行，只是图像处理约需15-30秒/张，视频处理会明显变慢。本文后续所有操作均以GPU环境为默认前提。

2.2 安装Docker与NVIDIA驱动

如果你尚未安装Docker，请按官方文档执行（Ubuntu示例）：

# 卸载旧版本（如有）
sudo apt-get remove docker docker-engine docker.io containerd runc
# 安装依赖
sudo apt-get update
sudo apt-get install -y \
 ca-certificates \
 curl \
 gnupg \
 lsb-release
# 添加Docker官方GPG密钥
sudo mkdir -p /etc/apt/keyrings
curl -fsSL https://download.docker.com/linux/ubuntu/gpg | sudo gpg --dearmor -o /etc/apt/keyrings/docker.gpg
# 设置稳定仓库
echo "deb [arch=$(dpkg --print-architecture) signed-by=/etc/apt/keyrings/docker.gpg] https://download.docker.com/linux/ubuntu $(lsb_release -cs) stable" |   /etc/apt/sources.list.d/docker.list > /dev/null

 apt-get update
 apt-get install -y docker-ce docker-ce-cli containerd.io docker-buildx-plugin docker-compose-plugin

 systemctl  docker
 systemctl start docker

 docker run hello-world

相关免费在线工具

加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
RSA密钥对生成器
生成新的随机RSA私钥和公钥pem证书。在线工具，RSA密钥对生成器在线工具，online
Mermaid 预览与可视化编辑
基于 Mermaid.js 实时预览流程图、时序图等图表，支持源码编辑与即时渲染。在线工具，Mermaid 预览与可视化编辑在线工具，online
随机西班牙地址生成器
随机生成西班牙地址（支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选），支持数量快捷选择、显示全部与下载。在线工具，随机西班牙地址生成器在线工具，online
Gemini 图片去水印
基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印，支持批量处理与下载。在线工具，Gemini 图片去水印在线工具，online
curl 转代码
解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。在线工具，curl 转代码在线工具，online

# 添加密钥和源
curl -fsSL https://nvidia.github.io/libnvidia-container/gpgkey | sudo gpg --dearmor -o /usr/share/keyrings/nvidia-container-toolkit-keyring.gpg
curl -fsSL https://nvidia.github.io/libnvidia-container/stable/deb/nvidia-container-toolkit.list | \
 sed 's#deb https://#deb [arch=amd64 signed-by=/usr/share/keyrings/nvidia-container-toolkit-keyring.gpg] https://#g' | \
 sudo tee /etc/apt/sources.list.d/nvidia-container-toolkit.list
# 安装工具包
sudo apt-get update
sudo apt-get install -y nvidia-container-toolkit
# 重启Docker守护进程
sudo systemctl restart docker

sudo docker run --rm --gpus all nvidia/cuda:12.2.0-base-ubuntu22.04 nvidia-smi

# 拉取镜像（国内用户推荐使用阿里云镜像加速）
sudo docker pull sam3:latest
# 启动容器（映射端口8888给Jupyter，7860给Web界面）
sudo docker run -d \
 --gpus all \
 --name sam3-server \
 -p 8888:8888 \
 -p 7860:7860 \
 -v $(pwd)/sam3_data:/workspace/data \
 -v $(pwd)/sam3_models:/workspace/models \
 --shm-size=2g \
 sam3:latest

# 查看实时日志
sudo docker logs -f sam3-server

INFO: Uvicorn running on http://0.0.0.0:7860 (Press CTRL+C to quit)
INFO: Application startup complete.
INFO: Starting Jupyter server on port 8888...

sudo docker logs sam3-server 2>&1 | grep "token="

# 1. 加载模型（首次运行自动下载，后续秒级加载）
from sam3 import SAM3ImagePredictor
predictor = SAM3ImagePredictor.from_pretrained("facebook/sam3")
# 2. 读取图片
import cv2
image = cv2.imread("/workspace/data/example.jpg")
image = cv2.cvtColor(image, cv2.COLOR_BGR2RGB) # 转RGB
# 3. 设置提示：这里用文本提示（也可传points=[[x,y]], boxes=[[x1,y1,x2,y2]]
input_prompt = "cat"
# 4. 执行预测
masks, scores, logits = predictor.predict(image, input_prompt)
# 5. 可视化结果（自动叠加掩码）
from sam3.utils.visualize import show_mask
show_mask(image, masks[0], save_path="/workspace/data/output_mask.png")
# 6. 输出坐标（JSON格式）
import json
with open("/workspace/data/output_bbox.json", "w") as f:
    json.dump({"bbox": [int(x) for x in predictor.last_bbox]}, f)

# 初始化视频预测器
from sam3 import SAM3VideoPredictor
video_predictor = SAM3VideoPredictor.from_pretrained("facebook/sam3")
# 传入视频路径和首帧提示（只需指定第一帧的目标位置）
first_frame_path = "/workspace/data/video_001.mp4"
first_frame_prompt = "motorcycle" # 或 points=[[320,240]]
# 开始跨帧跟踪（自动处理光流与外观一致性）
results = video_predictor.track(
    first_frame_path, first_frame_prompt, max_frames=100, # 处理前100帧
    min_score=0.65, # 过滤低置信度结果
    smooth_mask=True # 启用掩码时序平滑
)
# 导出为视频（带分割叠加）
video_predictor.save_results(results, "/workspace/data/output_tracked.mp4")

SAM 3开源大模型部署教程：Docker、Jupyter与Web三模式详解

SAM 3开源大模型部署教程：Docker、Jupyter与Web三模式详解

1. 为什么你需要SAM 3——不只是分割，而是理解视觉内容

2. 环境准备：三步搞定基础依赖

2.1 硬件与系统要求

2.2 安装Docker与NVIDIA驱动

更多推荐文章

相关免费在线工具

3. Docker镜像部署：一键启动，3分钟可用

3.1 拉取并运行镜像

3.2 等待模型加载与服务就绪

4. Web可视化操作：零代码，上传即用

4.1 访问Web界面

4.2 图像分割实操：三步完成精准抠图

4.3 视频分割实操：跨帧跟踪，一语定位

5. Jupyter交互调试：自定义提示，深入控制

5.1 进入Jupyter环境

5.2 图像分割代码精讲（可直接运行）

5.3 视频分割进阶技巧

6. 常见问题与优化建议

6.1 启动失败：端口被占用或GPU不可用

6.2 Web界面卡在'服务启动中'

6.3 分割效果不理想？试试这3个调优点

6.4 性能优化：让处理更快更稳

7. 总结：三条路径，一种能力

更多推荐文章

相关免费在线工具

SAM 3开源大模型部署教程：Docker、Jupyter与Web三模式详解

SAM 3开源大模型部署教程：Docker、Jupyter与Web三模式详解

1. 为什么你需要SAM 3——不只是分割，而是理解视觉内容

2. 环境准备：三步搞定基础依赖

2.1 硬件与系统要求

2.2 安装Docker与NVIDIA驱动

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

3. Docker镜像部署：一键启动，3分钟可用

3.1 拉取并运行镜像

3.2 等待模型加载与服务就绪

4. Web可视化操作：零代码，上传即用

4.1 访问Web界面

4.2 图像分割实操：三步完成精准抠图

4.3 视频分割实操：跨帧跟踪，一语定位

5. Jupyter交互调试：自定义提示，深入控制

5.1 进入Jupyter环境

5.2 图像分割代码精讲（可直接运行）

5.3 视频分割进阶技巧

6. 常见问题与优化建议

6.1 启动失败：端口被占用或GPU不可用

6.2 Web界面卡在'服务启动中'

6.3 分割效果不理想？试试这3个调优点

6.4 性能优化：让处理更快更稳

7. 总结：三条路径，一种能力

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具