Stable Diffusion WebUI 1.8.0 版本更新详解
Stable Diffusion WebUI 近期发布了 1.8.0 版本,此次更新内容较为丰富,主要集中在处理性能优化、新采样器内置以及模型支持增强等方面。对于用户而言,最显著的变化是显存使用的大幅下降以及图像生成速度的提升。以下是对本次更新核心内容的详细技术解析。
1. 底层框架与性能优化
PyTorch 与 CUDA 版本升级
WebUI 1.8.0 将 Torch 版本支持提升至 2.1.2。通常情况下,PyTorch 版本的提高意味着更优的处理效率和更好的硬件兼容性。为了充分发挥新版本的优势,建议搭配的 CUDA 版本为 11.8 或 12.1。
PyTorch 作为目前主流的开源机器学习库,其底层实现基于 C/C++,提供了强大的张量计算功能及完整的深度学习框架。它支持高效的 GPU 加速计算和自动求导机制。CUDA 是由 NVIDIA 推出的并行计算平台,使得开发者能够利用 GPU 进行大规模并行计算,尤其在处理深度学习中大量浮点运算时优势明显。不同版本的 PyTorch 对 CUDA 有特定依赖关系,升级前请确认环境配置。
FP8 精度计算支持
新版本支持 FP8(8 位浮点数)精度的计算。FP8 通过使用 8 位浮点数进行运算,相比传统的 FP16 或 BF16,能显著节省显存占用。官方测试表明,开启 FP8 后图片质量没有明显下降,但推理速度可能会因量化过程产生微小波动。
启用条件:
- PyTorch 版本需 >= 2.1.0
- 建议显存小于 8GB 的用户优先开启此选项
注意事项:
由于 FP8 涉及量化操作,部分老旧显卡或特定操作系统可能尚未完全适配。尝鲜用户建议在非生产环境中先进行测试,如遇兼容性问题可回退至 FP16 模式。
2. 内置 LCM 采样器
WebUI 1.8.0 正式内置了 LCM(Latent Consistency Models,潜在一致性模型)采样器,无需再单独安装插件。
LCM 技术原理
LCM 是继 LDMs(潜在扩散模型)之后的新一代生成模型,由清华大学交叉信息科学研究院研发。其核心优化在于去噪推理步骤:
- 减少迭代步数:不再像传统 Diffusion 模型那样需要逐步迭代去噪,而是追求'一步完成推理'或极少步数。
- 潜空间压缩:在 Consistency Models 基础上引入 Latent Space,进一步压缩数据处理量。
效果对比:
- 图像生成速度提升 2-5 倍
- 所需算力大幅降低
- 仅需 2-4 步即可生成 768x768 分辨率的清晰图像
实际测试表现:
- 大多数 LCM 模型在 4 步时可得到清晰图像
- 6-10 步图片质量更佳
- 在 RTX 3090 等高端显卡上,512x512 分辨率可实现秒级出图
3. SDXL-Inpaint 模型支持
以往在使用 SDXL 通用模型进行图像修复(Inpainting)时,常遇到局部重绘效果不自然的问题。1.8.0 版本通过 diffusers 引入了专注于图片修复功能的 SDXL-Inpaint 模型。
该模型特别强化了对局部区域的精确重绘能力,能够更准确地理解遮罩区域的内容需求,从而在保持背景一致性的同时,高质量地生成目标物体。这对于需要精细编辑图像细节的用户来说是一个重大改进。
4. 柔和重绘(Soft Inpaint)
在 1.8.0 版本的图生图模块中,新增了一项极为实用的特性——柔和重绘模式。
问题背景
此前,在进行局部重绘时,如果原图与生成部分的融合处理不当,往往会在接缝处留下明显的痕迹,导致生成图片存在瑕疵。
解决方案
新功能引入了平滑融合算法,能够更加自然地混合原图与生成部分,极大减少了拼接感和瑕疵。例如,将一张小猫的照片重绘为小狗时,毛发过渡和光影变化会更加连贯自然。
设置路径:
在'图生图'界面中,找到相关设置项并开启柔和重绘模式,通常涉及遮罩模糊度(Mask Blur)和重绘幅度(Denoising Strength)的微调。
5. 其他重要更新
高清放大模型支持
新增了三个 DAT(Diffusion Autoencoder Transformer)放大模型的支持:
选择建议:
- 速度:DAT X4 > DAT X3 > DAT X2
- 质量:DAT X2 最佳
- 推荐配置:显存大于 8GB 的用户建议使用 DAT X2 以获得最佳画质;显存受限用户可选择 X3 或 X4 以平衡速度与质量。
提示词注释支持
新版本增加了对提示词注释的支持,允许用户在 Prompt 中使用特定语法来调整权重或添加临时指令,增强了提示词工程的灵活性。
硬件兼容性扩展
- 昇腾 NPU:新增了对华为昇腾 NPU 芯片的出图支持,拓展了国产硬件生态的兼容性。
- 字体服务:改为本地提供字体服务,不再依赖 Google 服务器,提升了加载速度和隐私安全性。
稳定性修复
除了上述功能外,1.8.0 还修复了大量已知 BUG,并扩展了 API 接口,方便第三方开发者集成更多功能。
6. 升级指南与环境配置
方法一:源码覆盖升级
从 GitHub 下载最新版本的代码,覆盖到本地目录后重启 WebUI 即可。
风险提示:直接覆盖可能会导致部分插件或 Python 包版本冲突。如果遇到报错,建议清理虚拟环境并重新安装依赖。
方法二:容器化部署
对于希望快速体验且不想处理环境依赖的用户,可以使用封装好的镜像文件。确保系统满足 Docker 运行要求,拉取最新镜像并启动实例。
常见问题排查
- 显存不足:若开启 FP8 后仍报 OOM,请尝试降低 Batch Size 或使用
--medvram 参数启动。
- 插件失效:检查插件是否已更新至支持 1.8.0 的版本,旧版插件可能导致界面崩溃。
- LCM 模型未显示:确保已下载对应的 LCM LoRA 模型并放置在正确的 models 目录下。
7. 总结
Stable Diffusion WebUI 1.8.0 是一次重要的功能性更新,特别是在显存优化和生成效率方面取得了实质性突破。FP8 支持和 LCM 内置让低配设备也能流畅运行大模型,而 SDXL-Inpaint 和柔和重绘则提升了图像编辑的专业度。建议广大用户根据自身的硬件条件和业务需求,及时评估并升级到新版本,以享受更高效的 AI 绘画体验。