Stable Diffusion 技术详解:LoRA 模型与 ControlNet 协同应用
前言
Stable Diffusion (SD) 是目前开源社区中最流行的生成式人工智能模型之一。通过结合 LoRA (Low-Rank Adaptation) 微调模型和 ControlNet 控制网络,用户可以实现对生成图像的精细控制,包括风格迁移、人物姿态保持以及特定细节的修饰。
本文旨在详细介绍如何在本地部署的 Stable Diffusion WebUI 中,使用特定的 LoRA 模型配合 ControlNet 插件进行图像编辑实战,涵盖环境准备、模型管理、参数配置及常见问题排查。
一、环境准备
1. 基础环境
确保您的计算机满足以下最低要求:
- 操作系统:Windows 10/11, Linux 或 macOS (Apple Silicon)
- 显卡:NVIDIA GPU 推荐显存 6GB 以上 (CUDA 支持)
- 内存:建议 16GB RAM
- 存储:预留至少 20GB 空间用于模型文件
2. 软件安装
推荐使用 Automatic1111 提供的 Stable Diffusion WebUI 版本。克隆仓库并运行启动脚本即可进入图形化操作界面。
git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui.git
cd stable-diffusion-webui
# Windows 用户可运行 webui-user.bat
# Linux/Mac 用户可运行 webui.sh
二、LoRA 模型管理
LoRA 是一种高效的微调技术,允许在不重新训练整个大模型的情况下,向 SD 注入新的概念或风格。
1. 模型下载与放置
将下载的 .safetensors 格式 LoRA 模型文件放入 WebUI 目录下的 models/Lora 文件夹中。
- 路径示例:
stable-diffusion-webui/models/Lora/ - 命名规范:建议使用英文文件名,避免特殊字符。
2. 常用 LoRA 类型
在图像局部修饰任务中,常见的 LoRA 类型包括:
- 服饰纹理类:用于改变衣物材质、颜色或样式。
- 人物特征类:用于调整面部特征或发型。
- 风格类:用于统一整体画风(如二次元、写实等)。
三、ControlNet 插件配置
ControlNet 是 SD WebUI 的重要扩展,能够利用边缘检测、深度图、姿态骨架等条件图来约束生成过程。
1. 插件安装
在 WebUI 的 "Extensions" -> "Install from URL" 中输入 ControlNet 仓库地址进行安装,或在 "Settings" -> "Installed" 中启用。
2. 预处理器选择
针对保留原图轮廓的任务,推荐使用 Canny (边缘检测) 预处理器。
- 下载地址:需从 HuggingFace 官方源下载对应的 safetensors 权重文件。
- 存放位置:
stable-diffusion-webui/extensions/sd-webui-controlnet/models/


