Stable Diffusion 整合包本地部署与使用指南

在本地运行 Stable Diffusion 时，手动配置环境往往面临诸多挑战：Python 版本冲突、依赖库缺失、CUDA 驱动不匹配等问题频发，极易消耗大量调试时间。相比之下，采用成熟的整合包方案能显著降低门槛，将复杂的底层配置封装起来，让用户更专注于模型训练与图像生成本身。

环境准备与系统要求

整合包通常针对 Windows 平台优化，解压后无需管理员权限即可运行，也不会修改系统环境变量。主要硬件要求如下：

显卡：支持 CUDA 的 NVIDIA 显卡体验最佳。
显存：显存越大，生成高分辨率图像越稳定。
内存：建议 16GB 及以上，避免加载模型时内存溢出。

若无独立显卡，整合包也能运行，但推理速度会明显下降。

安装与目录结构

下载压缩包后，建议将其解压至非中文路径的根目录下，例如 D:\SD。避免使用桌面或深层嵌套目录，以防脚本解析路径出错。

解压后的典型结构如下：

text
stable-diffusion-webui/
├── webui-user.bat  (启动脚本)
├── models/         (模型存放区)
├── extensions/     (插件目录)
└── venv/           (虚拟环境)

整合包已内置 Python 环境和依赖库，无需单独安装。直接双击 webui-user.bat 即可启动服务。首次启动耗时较长，后续启动速度会有显著提升。当命令行输出 http://127.0.0.1:7860 时，浏览器访问该地址即可进入 WebUI 界面。

模型管理与放置

整合包对模型目录进行了标准化整理，常见路径规范如下：

text
models/Stable-diffusion  # 主模型 (.ckpt, .safetensors)
models/Lora              # LoRA 微调模型
models/VAE               # VAE 解码器

将下载的模型文件放入对应文件夹后，重启 WebUI，选择栏会自动刷新。常见的开源模型如 chilloutmix、anything 以及各类国风、写实风格模型均可直接使用。

核心功能实战

文生图 (txt2img)

最基础的功能。重点调整正面提示词、负面提示词、采样步数及 CFG 值。默认参数通常可直接出图，适合快速验证效果。

图生图 (img2img)

基于现有图片进行重绘或风格迁移。通过调节重绘幅度（Denoising strength），控制 0.3~0.7 之间可平衡原图保留度与新内容生成量。

插件扩展

整合包通常预装了常用插件，如 ControlNet、Tagger 等。

ControlNet：支持线稿、姿态、深度图控制，大幅提升构图可控性。
Lora 管理：在提示词中使用 <lora:模型名：权重> 格式调用，权重建议从 0.6 开始尝试。

若需添加第三方插件，只需将插件文件夹放入 extensions 目录并重启即可。

常见问题排查

启动闪退：检查路径是否包含中文字符，或尝试缩短路径长度。
显存不足 (OOM)：在启动脚本中添加 --medvram 或参数，或降低生成分辨率。

Stable Diffusion 整合包本地部署与使用指南