Kohya's GUI 教程：Stable Diffusion 模型训练与 LoRA 创建

Kohya's GUI 是基于 Gradio 开发的 Stable Diffusion 训练可视化工具，支持 LoRA、Dreambooth 及 SDXL 等训练模式。文章涵盖系统要求、安装步骤、数据预处理、模型配置及训练流程。通过图形界面简化复杂操作，提供预设配置与优化技巧，帮助用户在本地或云端环境高效构建专属 AI 绘画模型。

灰度发布发布于 2026/4/11更新于 2026/5/2616 浏览

Kohya's GUI 教程：Stable Diffusion 模型训练与 LoRA 创建

安装指南

系统要求

Windows/Linux/macOS 系统
Python 3.10+
支持 CUDA 的 NVIDIA GPU（推荐）
至少 8GB 显存

安装步骤

克隆项目仓库并进入目录。

git clone <repository_url>
cd kohya_ss

根据你的操作系统选择安装脚本：

Windows 用户：运行 setup.bat 或 gui.bat
Linux/macOS 用户：运行 setup.sh 或 gui.sh
使用 uv 安装：运行 gui-uv.sh（Linux/macOS）或 gui-uv.bat（Windows）

核心功能

1. 数据准备与预处理

在开始训练前，需要准备好训练数据。Kohya's GUI 支持多种数据格式：

图像格式：.png、.jpg、.jpeg、.webp、.bmp
推荐分辨率：512x512 或更高
支持批量处理和多数据集管理

数据预处理工具位于 tools/ 目录，包括：

caption.py - 自动生成图像描述
group_images.py - 图像分组管理
convert_images_to_webp.py - 图像格式转换

2. LoRA 训练配置

LoRA 训练是 Kohya's GUI 的核心功能之一，通过 kohya_gui/class_lora_tab.py 提供完整的配置界面。关键配置参数包括：

学习率设置
训练轮次配置
模型保存策略
优化器选择

3. Dreambooth 训练

Dreambooth 训练让你可以为特定概念或风格创建个性化模型。通过 kohya_gui/dreambooth_gui.py 界面，你可以：

设置类别标识符
配置正则化图像
调整训练参数
监控训练进度

4. 高级训练选项

Kohya's GUI 提供丰富的高级选项，位于 kohya_gui/class_advanced_training.py：

学习率调度器
梯度累积
混合精度训练
检查点保存

实战训练流程

第一步：数据准备

收集训练图像（建议 20-100 张）
使用 tools/caption.py 为图像添加描述
将数据组织到 dataset/ 目录

第二步：模型选择

选择基础模型（如 SD 1.5、SDXL 等）
配置训练参数
设置输出路径

第三步：开始训练

点击'开始训练'按钮
监控训练日志
查看生成的样本图像

第四步：模型测试

使用生成的 LoRA 模型

Kohya's GUI 教程：Stable Diffusion 模型训练与 LoRA 创建