Stable Diffusion 容器化部署：Docker Run、Compose 与 Dockerfile 方案详解

一、引言：为什么选择容器化部署？

Stable Diffusion 宿主机部署 vs 容器化部署核心差异对比表

对比维度	传统宿主机部署	容器化部署
环境依赖管理	需手动处理依赖冲突，如 Python 版本、PyTorch 版本、CUDA 工具链的兼容性问题，配置过程繁琐且易出错	环境隔离，每个应用拥有独立的运行环境，依赖包仅存在于容器内，避免跨应用冲突
系统清洁度	全局安装的依赖包会污染系统环境，后续清理困难，可能残留冗余文件或无效配置	依赖与配置均封装在容器中，容器删除后无残留，不影响宿主机系统清洁度
环境一致性	易出现'在我机器上能跑'问题，团队协作时因设备配置差异导致复现困难，排查成本高	基于镜像构建，开发、测试、生产环境完全一致，消除环境差异带来的部署隐患
迁移与部署效率	更换机器需重新执行所有配置步骤（安装依赖、调试参数等），迁移成本高、耗时久	一次构建镜像，支持'随处运行'，新设备仅需拉取镜像即可启动，部署效率大幅提升
版本控制能力	无统一版本管理机制，依赖更新或配置修改后难以回滚到历史可用状态	镜像支持版本化标记（如 `v1.0` `v2.1`），可快速回滚到指定版本，风险可控
核心痛点总结	依赖冲突频发、系统污染、复现难、迁移成本高	无上述痛点，且额外具备资源隔离、可移植性强等优势（需掌握容器基础操作）

文章配图

二、Docker Run：快速启动官方镜像

1、方案概述

这是最简单的容器化部署方式，适合快速验证和体验。

2、实战步骤

拉取官方镜像

docker pull universonic/stable-diffusion-webui:full

如果出现以下日志

需要设置代理，打开vim /etc/systemd/system/docker.service.d/http-proxy.conf

填写代理信息，保存

重启 docker

查看代理是否生效

# 创建模型和输出目录 mkdir -p ~/sd-data/models mkdir -p ~/sd-data/outputs

将此目录挂载到容器后会继承宿主机的权限属性（UID/GID 一致），而容器内运行用户是 sduser（非 root），因此出现权限 denied。核心解决方案是，以下是分步骤的根治方案：

参数全量写法	核心作用	详细说明
`docker run`	基础命令	Docker 的核心命令，用于「创建并启动一个新容器」（若本地无指定镜像，会自动从 Docker Hub 拉取）。
`-d`	后台运行	全称 `--detach`，让容器在后台以「守护进程模式」运行，终端不会被容器日志占用（可通过 `docker logs 容器名` 查看日志）。
`--gpus all`	GPU 资源分配	允许容器访问宿主机的所有 NVIDIA GPU（需宿主机提前安装 NVIDIA 驱动 + nvidia-docker2 插件），是 Stable Diffusion 启用 GPU 加速的核心配置（无此参数则默认用 CPU 运行，生成图片极慢）。扩展：若想指定 GPU，可写 `--gpus "device=0,1"`（仅允许容器用第 0、1 号 GPU）。
`--restart unless-stopped`	容器重启策略	配置容器退出后的重启规则，`unless-stopped` 表示：1. 容器异常退出（如崩溃、OOM）时自动重启；2. 手动执行 `docker stop` 停止容器后，不会自动重启；3. 宿主机重启后，容器会随 Docker 服务自动启动（适合需要长期运行的应用，如 SD WebUI）。其他可选策略：`always`（无论何种退出都重启）、`on-failure`（仅失败退出时重启）、`no`（默认，不重启）。
`-p 7860:8080`	端口映射	全称 `--publish`，格式为「宿主机端口：容器内端口」，实现宿主机与容器的端口打通：- 左侧 `7860`：宿主机对外暴露的端口（外部访问 SD WebUI 时用这个端口，如 `http://宿主机 IP:7860`）；- 右侧 `8080`：容器内 SD WebUI 实际运行的端口（需与 SD 启动命令中 `--port` 指定的端口一致，否则无法访问）。
`-e HTTP_PROXY=http://192.168.100.237:7890`	环境变量（HTTP 代理）	全称 `--env`，向容器内注入环境变量，这里用于配置 HTTP 协议的代理：当容器内进程（如 SD WebUI 下载模型、插件时）发起 HTTP 请求，会通过 `192.168.100.237:7890` 这个代理服务器转发（解决内网无法直接访问外网资源的问题）。
`-e HTTPS_PROXY=http://192.168.100.237:7890`	环境变量（HTTPS 代理）	与上一个参数类似，用于配置 HTTPS 协议的代理（注意：即使是 HTTPS 代理，这里地址也用 `http://` 开头，因为代理服务器本身的地址是 HTTP 协议）。
`-e NO_PROXY=localhost,127.0.0.1`	环境变量（无需代理的地址）	指定「不需要走代理」的地址列表：- `localhost` 和 `127.0.0.1` 均指代「容器自身」；作用：避免容器内进程访问自身服务时（如 SD 内部组件通信）也走代理，减少网络延迟和代理服务压力。
`-v /home/sdwebui/sd-data/outputs:/app/stable-diffusion-webui/outputs`	目录挂载（输出目录）	全称 `--volume`，实现「宿主机目录」与「容器内目录」的双向数据映射，核心作用是持久化数据（容器删除后数据不丢失）：- 左侧 `/home/sdwebui/sd-data/outputs`：宿主机上用于存储 SD 生成图片的目录；- 右侧 `/app/stable-diffusion-webui/outputs`：容器内 SD WebUI 默认的图片输出目录；效果：容器内生成的图片会实时同步到宿主机目录，宿主机修改该目录下的文件也会同步到容器内。
`-v /home/sdwebui/sd-data/models:/app/stable-diffusion-webui/models`	目录挂载（模型目录）	与上一个 `-v` 逻辑一致，用于挂载 SD 模型文件目录：- 宿主机目录可提前存放模型（如 Stable Diffusion v1.5、RealVis 等 `.safetensors` 或 `.ckpt` 文件）；- 容器内 SD WebUI 可直接读取该目录下的模型，无需在容器内重复下载，节省空间和时间。
`--user sduser`	指定运行用户	让容器内的进程（如 SD WebUI）以 `sduser` 这个非 root 用户身份运行：1. 安全性：避免容器内进程用 root 权限操作，降低恶意程序破坏宿主机的风险；2. 权限匹配：需确保宿主机挂载目录（如 `outputs`、`models`）的 UID/GID 与容器内 `sduser` 一致，否则会出现「权限 denied」问题（参考之前的权限配置步骤）。

参数全量写法

核心作用

详细说明

docker run

基础命令

Docker 的核心命令，用于「创建并启动一个新容器」（若本地无指定镜像，会自动从 Docker Hub 拉取）。

-d

后台运行

全称 --detach，让容器在后台以「守护进程模式」运行，终端不会被容器日志占用（可通过 docker logs 容器名 查看日志）。

--gpus all

GPU 资源分配

允许容器访问宿主机的所有 NVIDIA GPU（需宿主机提前安装 NVIDIA 驱动 + nvidia-docker2 插件），是 Stable Diffusion 启用 GPU 加速的核心配置（无此参数则默认用 CPU 运行，生成图片极慢）。扩展：若想指定 GPU，可写 --gpus "device=0,1"（仅允许容器用第 0、1 号 GPU）。

--restart unless-stopped

容器重启策略

配置容器退出后的重启规则，unless-stopped 表示：1. 容器异常退出（如崩溃、OOM）时自动重启；2. 手动执行 docker stop 停止容器后，不会自动重启；3. 宿主机重启后，容器会随 Docker 服务自动启动（适合需要长期运行的应用，如 SD WebUI）。其他可选策略：always（无论何种退出都重启）、on-failure（仅失败退出时重启）、no（默认，不重启）。

-p 7860:8080

端口映射

全称 --publish，格式为「宿主机端口：容器内端口」，实现宿主机与容器的端口打通：- 左侧 7860：宿主机对外暴露的端口（外部访问 SD WebUI 时用这个端口，如 http://宿主机 IP:7860）；- 右侧 8080：容器内 SD WebUI 实际运行的端口（需与 SD 启动命令中 --port 指定的端口一致，否则无法访问）。

-e HTTP_PROXY=http://192.168.100.237:7890

环境变量（HTTP 代理）

全称 --env，向容器内注入环境变量，这里用于配置 HTTP 协议的代理：当容器内进程（如 SD WebUI 下载模型、插件时）发起 HTTP 请求，会通过 192.168.100.237:7890 这个代理服务器转发（解决内网无法直接访问外网资源的问题）。

-e HTTPS_PROXY=http://192.168.100.237:7890

环境变量（HTTPS 代理）

与上一个参数类似，用于配置 HTTPS 协议的代理（注意：即使是 HTTPS 代理，这里地址也用 http:// 开头，因为代理服务器本身的地址是 HTTP 协议）。

-e NO_PROXY=localhost,127.0.0.1

环境变量（无需代理的地址）

指定「不需要走代理」的地址列表：- localhost 和 127.0.0.1 均指代「容器自身」；作用：避免容器内进程访问自身服务时（如 SD 内部组件通信）也走代理，减少网络延迟和代理服务压力。

-v /home/sdwebui/sd-data/outputs:/app/stable-diffusion-webui/outputs

全称 --volume，实现「宿主机目录」与「容器内目录」的双向数据映射，核心作用是 持久化数据（容器删除后数据不丢失）：- 左侧 /home/sdwebui/sd-data/outputs：宿主机上用于存储 SD 生成图片的目录；- 右侧 /app/stable-diffusion-webui/outputs：容器内 SD WebUI 默认的图片输出目录；效果：容器内生成的图片会实时同步到宿主机目录，宿主机修改该目录下的文件也会同步到容器内。

-v /home/sdwebui/sd-data/models:/app/stable-diffusion-webui/models

与上一个 -v 逻辑一致，用于挂载 SD 模型文件目录：- 宿主机目录可提前存放模型（如 Stable Diffusion v1.5、RealVis 等 .safetensors 或 .ckpt 文件）；- 容器内 SD WebUI 可直接读取该目录下的模型，无需在容器内重复下载，节省空间和时间。

--user sduser

指定运行用户

让容器内的进程（如 SD WebUI）以 sduser 这个非 root 用户身份运行：1. 安全性：避免容器内进程用 root 权限操作，降低恶意程序破坏宿主机的风险；2. 权限匹配：需确保宿主机挂载目录（如 outputs、models）的 UID/GID 与容器内 sduser 一致，否则会出现「权限 denied」问题（参考之前的权限配置步骤）。

################################################################ Install script for stable-diffusion + Web UI Tested on Debian 11 (Bullseye), Fedora 34+ and openSUSE Leap 15.4 or newer. ################################################################ ################################################################ Running on sduser user ################################################################ ################################################################ Repo already cloned, using it as install directory ################################################################ ################################################################ Create and activate python venv ################################################################ ################################################################ Launching launch.py... ################################################################ Python 3.10.12 (main, Feb 4 2025, 14:57:36) [GCC 11.4.0] Version: v1.10.1 Commit hash: 82a973c04367123ae98bd9abdf80d9eda9b910e2 Installing xformers Traceback (most recent call last): File "/app/stable-diffusion-webui/launch.py", line 48, in <module> main() File "/app/stable-diffusion-webui/launch.py", line 39, in main prepare_environment() File "/app/stable-diffusion-webui/modules/launch_utils.py", line 402, in prepare_environment run_pip(f"install -U -I --no-deps {xformers_package}", "xformers") File "/app/stable-diffusion-webui/modules/launch_utils.py", line 144, in run_pip return run(f'"{python}" -m pip {command} --prefer-binary{index_url_line}', desc=f"Installing {desc}", errdesc=f"Couldn't install {desc}", live=live) File "/app/stable-diffusion-webui/modules/launch_utils.py", line 116, in run raise RuntimeError("\n".join(error_bits)) RuntimeError: Couldn't install xformers. Command: "/app/stable-diffusion-webui/venv/bin/python" -m pip install -U -I --no-deps xformers==0.0.23.post1 --prefer-binary Error code: 1 stdout: Collecting xformers==0.0.23.post1 Downloading xformers-0.0.23.post1-cp310-cp310-manylinux2014_x86_64.whl.metadata (1.0 kB) Downloading xformers-0.0.23.post1-cp310-cp310-manylinux2014_x86_64.whl (213.0 MB) 0.0/213.0 MB ? eta -:--:-- stderr: WARNING: Retrying (Retry(total=4, connect=None, read=None, redirect=None, status=None)) after connection broken by 'ProxyError('Cannot connect to proxy.', TimeoutError('_ssl.c:990: The handshake operation timed out'))': /simple/xformers/ WARNING: Retrying (Retry(total=4, connect=None, read=None, redirect=None, status=None)) after connection broken by 'ProxyError('Cannot connect to proxy.', ConnectionResetError(104, 'Connection reset by peer'))': /packages/f4/89/ce8e936d3e64b3b565c16312dd6446d54f6e485f864130702c6b3b3cbe7c/xformers-0.0.23.post1-cp310-cp310-manylinux2014_x86_64.whl.metadata WARNING: Connection timed out while downloading. error: incomplete-download × Download failed because not enough bytes were received (0 bytes/213.0 MB) ╰─> URL: https://files.pythonhosted.org/packages/f4/89/ce8e936d3e64b3b565c16312dd6446d54f6e485f864130702c6b3b3cbe7c/xformers-0.0.23.post1-cp310-cp310-manylinux2014_x86_64.whl note: This is an issue with network connectivity, not pip. hint: Consider using --resume-retries to enable download resumption. ~/stable-diffusion-webui

--- 0%| | 0/20 [00:00<?, ?it/s] *** Error completing request *** Arguments: ('task(wan01r2cq08hz6h)', <gradio.routes.Request object at 0x7f43ce887850>, '11111', '', [], 1, 1, 7, 512, 512, False, 0.7, 2, 'Latent', 0, 0, 0, 'Use same checkpoint', 'Use same sampler', 'Use same scheduler', '', '', [], 0, 20, 'DPM++ 2M', 'Automatic', False, '', 0.8, -1, False, -1, 0, 0, 0, False, False, 'positive', 'comma', 0, False, False, 'start', '', 1, '', [], 0, '', [], 0, '', [], True, False, False, False, False, False, False, 0, False) {} Traceback (most recent call last): File "/app/modules/call_queue.py", line 74, in f res = list(func(*args, **kwargs)) ... File "/opt/conda/lib/python3.10/site-packages/xformers/ops/fmha/dispatch.py", line 63, in _run_priority_list raise NotImplementedError(msg) NotImplementedError: No operator found for `memory_efficient_attention_forward` with inputs: query : shape=(2, 4096, 8, 40) (torch.float16) key : shape=(2, 4096, 8, 40) (torch.float16) value : shape=(2, 4096, 8, 40) (torch.float16) attn_bias : <class 'NoneType'> p : 0.0 `decoderF` is not supported because: xFormers wasn't build with CUDA support attn_bias type is <class 'NoneType'> operator wasn't built - see `python -m xformers.info` for more info `[email protected]` is not supported because: xFormers wasn't build with CUDA support operator wasn't built - see `python -m xformers.info` for more info `tritonflashattF` is not supported because: xFormers wasn't build with CUDA support operator wasn't built - see `python -m xformers.info` for more info triton is not available Only work on pre-MLIR triton for now `cutlassF` is not supported because: xFormers wasn't build with CUDA support operator wasn't built - see `python -m xformers.info` for more info `smallkF` is not supported because: max(query.shape[-1] != value.shape[-1]) > 32 xFormers wasn't build with CUDA support dtype=torch.float16 (supported: {torch.float32}) operator wasn't built - see `python -m xformers.info` for more info unsupported embed per head: 40

Stable Diffusion 容器化部署：Docker Run、Compose 与 Dockerfile 方案详解

一、引言：为什么选择容器化部署？

二、Docker Run：快速启动官方镜像

1、方案概述

2、实战步骤

更多推荐文章

相关免费在线工具

3、参数详解

4、适用场景

5、镜像保存

三、Docker Compose：生产级编排部署

1、方案概述

2、文件内容

3、操作命令

4、网络配置优势

5、适用场景

四、自定义 Dockerfile：高度定制化部署

⭐点击查看

五、故障排除与常见问题

1、指定挂载 GPU 而不是全部挂载

1.1、查看容器内部 GPU 数量

1.2、指定 GPU

2、网络波动，一般是因为连接超时

3、如何下载模型？

4、内存不足问题

5、日志查看和调试

6、无 cuda 支持

六、结语

更多推荐文章

相关免费在线工具

Stable Diffusion 容器化部署：Docker Run、Compose 与 Dockerfile 方案详解

一、引言：为什么选择容器化部署？

二、Docker Run：快速启动官方镜像

1、方案概述

2、实战步骤

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

3、参数详解

4、适用场景

5、镜像保存

三、Docker Compose：生产级编排部署

1、方案概述

2、文件内容

3、操作命令

4、网络配置优势

5、适用场景

四、自定义 Dockerfile：高度定制化部署

⭐点击查看

五、故障排除与常见问题

1、指定挂载 GPU 而不是全部挂载

1.1、查看容器内部 GPU 数量

1.2、指定 GPU

2、网络波动，一般是因为连接超时

3、如何下载模型？

4、内存不足问题

5、日志查看和调试

6、无 cuda 支持

六、结语

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具