Stable Diffusion 微调实战：Dreambooth 与 Textual Inversion 对比 | 极客日志

PythonAI算法

Stable Diffusion 微调实战：Dreambooth 与 Textual Inversion 对比

综述由AI生成对比了 Stable Diffusion 微调中的 Dreambooth 与 Textual Inversion 两种方法。通过准备人物数据集并进行预处理，分别使用两种方案进行模型训练。实验表明 Dreambooth 仅需 1000 步即可较好捕捉特征，而 Textual Inversion 需更多步骤且难以学习细节。文章提供了数据预处理代码、训练参数设置及效果对比，为 AI 绘画模型定制提供参考。

落日余晖发布于 2025/2/7更新于 2026/6/324 浏览

Stable Diffusion 微调实战：Dreambooth 与 Textual Inversion 对比

本文对比了 Textual Inversion 和 Dreambooth 两种微调方法，旨在通过扩大词字典嵌入来插入新概念。

训练图片处理

微调 Stable Diffusion 训练过程

在网上找到了 11 张高清的小兰特写图，尽量找人物主体比较鲜明的图片，这样才能让模型更好地学习到人物特征。为了图片不因为 resize 而变形，这里使用 letterbox 方法将图片先处理为 512×512 大小的尺寸：

def letterbox_image(image, size=(512, 512), color=(0, 0, 0), scale=False):
    iw, ih = image.size
    w, h = size

    scale = min(w / iw, h / ih)
    nw = int(iw * scale)
    nh = int(ih * scale)

    image = image.resize((nw, nh), Image.BICUBIC)
    new_image = Image.new('RGB', size, color)
    new_image.paste(image, ((w - nw) // 2, (h - nh) // 2))
    return new_image

到这一步，我们需要训练的人物主体数据就处理好啦~

dreambooth 微调

dreambooth 的效果类似于照相摄影棚——一旦拍摄了几张某个对象的照片，摄影棚就会生成包含该对象在不同条件和场景下的照片。dreambooth 的目标是扩展模型的语言视觉词典，一旦新词典嵌入模型，模型就可以在不同的背景场景下生成新词主题，同时保留其关键识别特征。

这个新词可以用标识符（identifier）来表示，为了防止语言漂移，需要在标识符的后面加入这个新词的大类，比如："A [V] dog"，[V] 为标识符，dog 为大类。

微调 Stable Diffusion 训练过程

为了防止语言漂移，研究者提出了 Class-specific Prior Preservation Loss

微调 Stable Diffusion 训练过程

dreambooth 微调代码

相关免费在线工具

加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
RSA密钥对生成器
生成新的随机RSA私钥和公钥pem证书。在线工具，RSA密钥对生成器在线工具，online
Mermaid 预览与可视化编辑
基于 Mermaid.js 实时预览流程图、时序图等图表，支持源码编辑与即时渲染。在线工具，Mermaid 预览与可视化编辑在线工具，online
随机西班牙地址生成器
随机生成西班牙地址（支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选），支持数量快捷选择、显示全部与下载。在线工具，随机西班牙地址生成器在线工具，online
Gemini 图片去水印
基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印，支持批量处理与下载。在线工具，Gemini 图片去水印在线工具，online
curl 转代码
解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。在线工具，curl 转代码在线工具，online

!python tools/ckpt2diffusers.py \
    --checkpoint_path=./ckpt_models/v1-5-pruned_emaonly.ckpt \
    --dump_path=./model \
    --original_config_file=./ckpt_models/model.yaml \
    --scheduler_type="ddim"

--pretrained_model_name_or_path: 跟微调 dreambooth 用到的基础模型一样 sdv1-5
--train_data_dir: 一开始处理好的小兰数据路径
--placeholder_token: <mouriran>
--initializer_token: girl
--learnable_property: object
--train_batch_size: 4
--learning_rate: 5e-3

Stable Diffusion 微调实战：Dreambooth 与 Textual Inversion 对比

训练图片处理

dreambooth 微调

dreambooth 微调代码

更多推荐文章

相关免费在线工具

转换 ckpt 检查点文件为 diffusers 官方权重

训练 object 脚本的输入

最后生成的效果

textual inversion 微调

代码仓库

修改相关参数设置

最后生成的效果 (5000 个 steps)

更多推荐文章

相关免费在线工具

Stable Diffusion 微调实战：Dreambooth 与 Textual Inversion 对比

训练图片处理

dreambooth 微调

dreambooth 微调代码

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

转换 ckpt 检查点文件为 diffusers 官方权重

训练 object 脚本的输入

最后生成的效果

textual inversion 微调

代码仓库

修改相关参数设置

最后生成的效果 (5000 个 steps)

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具