Kohya's GUI 教程:Stable Diffusion 模型训练与 LoRA 定制
简介
Kohya's GUI 是基于 Gradio 开发的图形化界面工具,专为 Kohya's Stable Diffusion 训练脚本提供可视化操作。它让复杂的 AI 模型训练变得简单直观,支持多种训练方法。
系统要求
- Windows/Linux/macOS 系统
- Python 3.10+
- 支持 CUDA 的 NVIDIA GPU(推荐)
- 至少 8GB 显存
安装指南
使用以下命令快速安装 Kohya's GUI:
git clone [repository_url]
cd kohya_ss
根据你的操作系统选择安装脚本:
- Windows 用户:运行
setup.bat或gui.bat - Linux/macOS 用户:运行
setup.sh或gui.sh - 使用 uv 安装:运行
gui-uv.sh(Linux/macOS)或gui-uv.bat(Windows)
安装过程中会自动配置 Python 环境、安装依赖库,并设置必要的训练环境。
核心功能详解
1. 数据准备与预处理
在开始训练前,需要准备好训练数据。Kohya's GUI 支持多种数据格式:
- 图像格式:
.png、.jpg、.jpeg、.webp、.bmp - 推荐分辨率:512x512 或更高
- 支持批量处理和多数据集管理
数据预处理工具位于 tools/ 目录,包括:
caption.py- 自动生成图像描述group_images.py- 图像分组管理convert_images_to_webp.py- 图像格式转换
2. LoRA 训练配置
LoRA 训练是 Kohya's GUI 的核心功能之一,通过 kohya_gui/class_lora_tab.py 提供完整的配置界面。
关键配置参数包括:
- 学习率设置
- 训练轮次配置
- 模型保存策略
- 优化器选择
3. Dreambooth 训练
Dreambooth 训练让你可以为特定概念或风格创建个性化模型。通过 kohya_gui/dreambooth_gui.py 界面,你可以:
- 设置类别标识符
- 配置正则化图像
- 调整训练参数
- 监控训练进度
4. 高级训练选项
Kohya's GUI 提供丰富的高级选项,位于 kohya_gui/class_advanced_training.py:
- 学习率调度器
- 梯度累积
- 混合精度训练

