使用自定义数据集微调 Stable Diffusion 3.5 LoRA 文生图模型

如何使用自定义数据集微调 Stable Diffusion 3.5 的 LoRA 文生图模型。内容包括环境依赖配置、数据集格式准备（metadata.jsonl）、预训练模型下载（Hugging Face/ModelScope）、训练命令参数详解以及推理预测步骤。通过该流程可实现特定风格或对象的图像生成，适用于艺术创作、游戏开发等场景。

极客零度发布于 2026/4/6更新于 2026/7/543 浏览

使用自定义数据集微调 Stable Diffusion 3.5 LoRA 文生图模型

环境要求

Package Version ------------------------ ------------
absl-py 2.3.1 accelerate 1.11.0 aiohappyeyeballs 2.6.1 aiohttp 3.13.1 aiosignal 1.4.0 annotated-types 0.7.0 anyio 4.11.0 attrs 25.4.0 bitsandbytes 0.48.1 certifi 2025.10.5 charset-normalizer 3.4.4 click 8.3.0 datasets 4.2.0 diffusers 0.35.2 dill 0.4.0 filelock 3.20.0 frozenlist

git clone https://github.com/seochan99/stable-diffusion-3.5-text2image-lora.git

dataset/
├── images/
│   ├── landscape_001.jpg
│   ├── portrait_001.jpg
│   └── ...
└── metadata.jsonl

{"image":"images/landscape_001.jpg","caption":"a breathtaking mountain landscape with snow-capped peaks, a crystal clear lake reflecting the sky, and pine trees in the foreground"}
{"image":"images/portrait_001.jpg","caption":"a professional portrait of a young woman with curly brown hair, wearing a blue denim jacket, smiling softly, natural lighting"}

import os
os.environ['HF_ENDPOINT']='https://hf-mirror.com'
from huggingface_hub import snapshot_download
snapshot_download(repo_id="stabilityai/stable-diffusion-3.5-large", local_dir="stabilityai/stable-diffusion-3.5-large")

from modelscope import snapshot_download
model_dir = snapshot_download('AI-ModelScope/stable-diffusion-3.5-medium', local_dir="stabilityai/stable-diffusion-3.5-medium")

python stable-diffusion-3.5-text2image-lora-main/train_text_to_image_lora_sd35.py \
--pretrained_model_name_or_path stabilityai/stable-diffusion-3.5-medium \
--train_data_dir sd3_test/stable-diffusion-3.5-text2image-lora-main/examples/dataset/ \
--output_dir sd3_test/stable-diffusion-3.5-text2image-lora-main/outputs/sd35-lora \
--resolution 1024 --train_batch_size 1 --gradient_accumulation_steps 4 \
--num_train_epochs 50 --rank 64 --learning_rate 0.0001 \
--text_encoder_lr 1e-05 --lr_scheduler cosine --lr_warmup_steps 500 \
--lr_num_cycles 1 --mixed_precision fp16 --validation_epochs 2 \
--num_validation_images 2 --checkpointing_steps 500 --report_to tensorboard \
--dataloader_num_workers 2 --seed 42 --precondition_outputs 1 \
--random_flip --gradient_checkpointing --train_text_encoder

python stable-diffusion-3.5-text2image-lora-main/inference.py \
--model_path stabilityai/stable-diffusion-3.5-medium \
--lora_path stable-diffusion-3.5-text2image-lora-main/outputs/sd35-lora/pytorch_lora_weights.safetensors \
--prompt "a professional portrait of a young woman with curly brown hair, wearing a blue denim jacket, smiling softly, natural lighting" \
--num_images 4 --seed 42

使用自定义数据集微调 Stable Diffusion 3.5 LoRA 文生图模型

使用自定义数据集微调 Stable Diffusion 3.5 LoRA 文生图模型

环境要求

相关介绍

微调 Stable Diffusion 3.5 LoRA 文生图模型

下载项目

准备数据集

下载预训练模型

进行训练

进行预测

参考

更多推荐文章

相关免费在线工具

使用自定义数据集微调 Stable Diffusion 3.5 LoRA 文生图模型

使用自定义数据集微调 Stable Diffusion 3.5 LoRA 文生图模型

环境要求

相关介绍

微调 Stable Diffusion 3.5 LoRA 文生图模型

下载项目

准备数据集

下载预训练模型

进行训练

进行预测

参考

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具