Stable Diffusion 整合包本地部署与使用指南
在本地运行 Stable Diffusion 时,手动配置环境往往面临诸多挑战:Python 版本冲突、依赖库缺失、CUDA 驱动不匹配等问题频发,极易消耗大量调试时间。相比之下,采用成熟的整合包方案能显著降低门槛,将复杂的底层配置封装起来,让用户更专注于模型训练与图像生成本身。
环境准备与系统要求
整合包通常针对 Windows 平台优化,解压后无需管理员权限即可运行,也不会修改系统环境变量。主要硬件要求如下:
- 显卡:支持 CUDA 的 NVIDIA 显卡体验最佳。
- 显存:显存越大,生成高分辨率图像越稳定。
- 内存:建议 16GB 及以上,避免加载模型时内存溢出。
若无独立显卡,整合包也能运行,但推理速度会明显下降。
安装与目录结构
下载压缩包后,建议将其解压至非中文路径的根目录下,例如 D:\SD。避免使用桌面或深层嵌套目录,以防脚本解析路径出错。
解压后的典型结构如下:
text
stable-diffusion-webui/
├── webui-user.bat (启动脚本)
├── models/ (模型存放区)
├── extensions/ (插件目录)
└── venv/ (虚拟环境)
整合包已内置 Python 环境和依赖库,无需单独安装。直接双击 webui-user.bat 即可启动服务。首次启动耗时较长,后续启动速度会有显著提升。当命令行输出 http://127.0.0.1:7860 时,浏览器访问该地址即可进入 WebUI 界面。
模型管理与放置
整合包对模型目录进行了标准化整理,常见路径规范如下:
text
models/Stable-diffusion # 主模型 (.ckpt, .safetensors)
models/Lora # LoRA 微调模型
models/VAE # VAE 解码器
将下载的模型文件放入对应文件夹后,重启 WebUI,选择栏会自动刷新。常见的开源模型如 chilloutmix、anything 以及各类国风、写实风格模型均可直接使用。
核心功能实战
文生图 (txt2img)
最基础的功能。重点调整正面提示词、负面提示词、采样步数及 CFG 值。默认参数通常可直接出图,适合快速验证效果。
图生图 (img2img)
基于现有图片进行重绘或风格迁移。通过调节重绘幅度(Denoising strength),控制 0.3~0.7 之间可平衡原图保留度与新内容生成量。
插件扩展
整合包通常预装了常用插件,如 ControlNet、Tagger 等。
- ControlNet:支持线稿、姿态、深度图控制,大幅提升构图可控性。
- Lora 管理:在提示词中使用
<lora:模型名:权重>格式调用,权重建议从 0.6 开始尝试。
若需添加第三方插件,只需将插件文件夹放入 extensions 目录并重启即可。
常见问题排查
- 启动闪退:检查路径是否包含中文字符,或尝试缩短路径长度。
- 显存不足 (OOM):在启动脚本中添加
--medvram或--lowvram参数,或降低生成分辨率。


