最近深入使用了 Stable Diffusion,对比过多种部署方案。手动安装往往需要处理 Python 版本、依赖库和运行环境,哪一步出错都要重新查资料,非常消耗时间。后来发现主流的整合包省去了很多折腾,对新手比较友好。
系统环境与硬件要求
目前主要基于 Windows 平台整理,这类整合包通常针对 Windows 优化,解压后直接运行,不需要管理员权限,也不会修改系统环境变量。
硬件方面需要注意:
- 显卡支持 CUDA 会更顺畅
- 显存越大,生成大图越稳定
- 没有独显也能跑,但速度会慢
我用的是有独显的电脑,跑 txt2img 基本能正常运行。
部署与目录结构
整合包将 WebUI、模型管理、插件、运行环境都准备好了。下载后建议把压缩包放在普通路径,比如 D 盘或 E 盘,不要放在中文路径,也不要放在桌面太深的目录,避免脚本识别路径时出错。
解压后主目录结构清晰:
- webui
- models
- 环境文件
- 启动脚本
不用修改文件位置,也不需要先安装 Python。整合包里已经准备好了运行环境,用的都是独立目录,对系统没影响。
运行 WebUI
在主目录里会看到一个'启动 WebUI'的脚本文件(通常是 .bat)。双击运行它,命令行窗口会自动加载环境。等命令行显示链接,例如 http://127.0.0.1:7860,就可以在浏览器里打开界面。
经验是第一次启动会加载时间稍长,之后启动就快很多。
模型管理
整合包将模型目录整理好了。常见路径是:
stable-diffusion-webui\models\Stable-diffusion
如果你要添加新的模型,把 .ckpt 或者 .safetensors 文件放进这个目录就行。重新打开 WebUI 后,模型选择栏会自动出现。
常见的模型类型都可以放进去使用,例如 chilloutmix、anything、国风模型或写实真人模特。
Lora 的路径一般在:
models\Lora
VAE 的路径一般在:
models\VAE
整合包目录结构都整理好,基本不需要改动。
常用功能实战
为了让内容更有帮助,我把自己常用的几个功能写一下。
文生图 (txt2img) 这是最常用的功能。常填的内容包括正面提示词、负面提示词、分辨率、采样方法、步数、CFG 值。这些默认值一般都能用,生成图像后可以立即保存,也能继续调整。
图生图 (img2img) 用一张图片作为基础再调整。比如把原图风格换一下,替换人物,改背景,这些都用得上。强度值可以调节变化程度,0.3~0.7 之间比较常用。
Lora 管理 整合包里带的插件可以管理 Lora,选择权重、合并、加载都会很方便。使用 Lora 时只需要在提示词里写:
<lora:模型名:权重>
权重 0.6 左右比较常见。
控制网 (ControlNet) 整合包有附带 ControlNet 插件。常用功能包括线稿、姿态、深度、分割。把提示词结合 ControlNet,可以大幅提高可控性。比如指定一个姿势生成人物,指定一个场景保持透视不变。
插件与配置
整合包里常见插件有 ControlNet、Tagger、图片浏览插件、Prompt 工具、Lora 管理工具。这些插件的默认设置基本都能直接用,不需要提前配置。如果有特别需要,也能添加其他插件,方式就是把插件文件放进 extensions 目录。
如果想改默认值,可以修改根目录里的配置文件,比如运行参数、显存优化、线程数等。新手阶段可以不用改。如果遇到显存不足,可以在脚本里加上 --medvram 或 --lowvram 参数。


