Stable Diffusion WebUI 1.8.0 版本更新详解
Stable Diffusion WebUI 近期发布了 1.8.0 版本,此次更新内容较为丰富,主要集中在处理性能优化、新采样器内置以及模型支持增强等方面。对于用户而言,最显著的变化是显存使用的大幅下降以及图像生成速度的提升。以下是对本次更新核心内容的详细技术解析。
1. 底层框架与性能优化
PyTorch 与 CUDA 版本升级
WebUI 1.8.0 将 Torch 版本支持提升至 2.1.2。通常情况下,PyTorch 版本的提高意味着更优的处理效率和更好的硬件兼容性。为了充分发挥新版本的优势,建议搭配的 CUDA 版本为 11.8 或 12.1。
PyTorch 作为目前主流的开源机器学习库,其底层实现基于 C/C++,提供了强大的张量计算功能及完整的深度学习框架。它支持高效的 GPU 加速计算和自动求导机制。CUDA 是由 NVIDIA 推出的并行计算平台,使得开发者能够利用 GPU 进行大规模并行计算,尤其在处理深度学习中大量浮点运算时优势明显。不同版本的 PyTorch 对 CUDA 有特定依赖关系,升级前请确认环境配置。
FP8 精度计算支持
新版本支持 FP8(8 位浮点数)精度的计算。FP8 通过使用 8 位浮点数进行运算,相比传统的 FP16 或 BF16,能显著节省显存占用。官方测试表明,开启 FP8 后图片质量没有明显下降,但推理速度可能会因量化过程产生微小波动。
启用条件:
- PyTorch 版本需 >= 2.1.0
- 建议显存小于 8GB 的用户优先开启此选项
注意事项: 由于 FP8 涉及量化操作,部分老旧显卡或特定操作系统可能尚未完全适配。尝鲜用户建议在非生产环境中先进行测试,如遇兼容性问题可回退至 FP16 模式。
2. 内置 LCM 采样器
WebUI 1.8.0 正式内置了 LCM(Latent Consistency Models,潜在一致性模型)采样器,无需再单独安装插件。
LCM 技术原理
LCM 是继 LDMs(潜在扩散模型)之后的新一代生成模型,由清华大学交叉信息科学研究院研发。其核心优化在于去噪推理步骤:
- 减少迭代步数:不再像传统 Diffusion 模型那样需要逐步迭代去噪,而是追求'一步完成推理'或极少步数。
- 潜空间压缩:在 Consistency Models 基础上引入 Latent Space,进一步压缩数据处理量。
效果对比:
- 图像生成速度提升 2-5 倍
- 所需算力大幅降低
- 仅需 2-4 步即可生成 768x768 分辨率的清晰图像
实际测试表现:
- 大多数 LCM 模型在 4 步时可得到清晰图像
- 6-10 步图片质量更佳
- 在 RTX 3090 等高端显卡上,512x512 分辨率可实现秒级出图
3. SDXL-Inpaint 模型支持
以往在使用 SDXL 通用模型进行图像修复(Inpainting)时,常遇到局部重绘效果不自然的问题。1.8.0 版本通过 diffusers 引入了专注于图片修复功能的 SDXL-Inpaint 模型。
该模型特别强化了对局部区域的精确重绘能力,能够更准确地理解遮罩区域的内容需求,从而在保持背景一致性的同时,高质量地生成目标物体。这对于需要精细编辑图像细节的用户来说是一个重大改进。
4. 柔和重绘(Soft Inpaint)
在 1.8.0 版本的图生图模块中,新增了一项极为实用的特性——柔和重绘模式。
问题背景
此前,在进行局部重绘时,如果原图与生成部分的融合处理不当,往往会在接缝处留下明显的痕迹,导致生成图片存在瑕疵。
解决方案
新功能引入了平滑融合算法,能够更加自然地混合原图与生成部分,极大减少了拼接感和瑕疵。例如,将一张小猫的照片重绘为小狗时,毛发过渡和光影变化会更加连贯自然。
设置路径: 在'图生图'界面中,找到相关设置项并开启柔和重绘模式,通常涉及遮罩模糊度(Mask Blur)和重绘幅度(Denoising Strength)的微调。


