Kohya's GUI 教程:Stable Diffusion 模型训练与 LoRA 创建
安装指南
系统要求
- Windows/Linux/macOS 系统
- Python 3.10+
- 支持 CUDA 的 NVIDIA GPU(推荐)
- 至少 8GB 显存
安装步骤
克隆项目仓库并进入目录。
git clone <repository_url>
cd kohya_ss
根据你的操作系统选择安装脚本:
- Windows 用户:运行 setup.bat 或 gui.bat
- Linux/macOS 用户:运行 setup.sh 或 gui.sh
- 使用 uv 安装:运行 gui-uv.sh(Linux/macOS)或 gui-uv.bat(Windows)
核心功能
1. 数据准备与预处理
在开始训练前,需要准备好训练数据。Kohya's GUI 支持多种数据格式:
- 图像格式:.png、.jpg、.jpeg、.webp、.bmp
- 推荐分辨率:512x512 或更高
- 支持批量处理和多数据集管理
数据预处理工具位于 tools/ 目录,包括:
- caption.py - 自动生成图像描述
- group_images.py - 图像分组管理
- convert_images_to_webp.py - 图像格式转换
2. LoRA 训练配置
LoRA 训练是 Kohya's GUI 的核心功能之一,通过 kohya_gui/class_lora_tab.py 提供完整的配置界面。 关键配置参数包括:
- 学习率设置
- 训练轮次配置
- 模型保存策略
- 优化器选择
3. Dreambooth 训练
Dreambooth 训练让你可以为特定概念或风格创建个性化模型。通过 kohya_gui/dreambooth_gui.py 界面,你可以:
- 设置类别标识符
- 配置正则化图像
- 调整训练参数
- 监控训练进度
4. 高级训练选项
Kohya's GUI 提供丰富的高级选项,位于 kohya_gui/class_advanced_training.py:
- 学习率调度器
- 梯度累积
- 混合精度训练
- 检查点保存
实战训练流程
第一步:数据准备
- 收集训练图像(建议 20-100 张)
- 使用 tools/caption.py 为图像添加描述
- 将数据组织到 dataset/ 目录
第二步:模型选择
- 选择基础模型(如 SD 1.5、SDXL 等)
- 配置训练参数
- 设置输出路径
第三步:开始训练
- 点击'开始训练'按钮
- 监控训练日志
- 查看生成的样本图像
第四步:模型测试
- 使用生成的 LoRA 模型

