在 Stable Diffusion 中,模型是核心组件,决定了生成图像的风格、质量和控制能力。新手常因各种模型后缀和用途感到困惑,以下是对常见模型的详细分类与说明。
safetensors 格式
在使用模型前,需了解 safetensors 格式。这是由 Hugging Face 研发的一种开源模型存储格式,目前被广泛采用。
相比旧有的 .ckpt 或 .bin 格式,safetensors 具有以下优势:
- 安全性高:防止反序列化攻击(如 DOS 攻击)
- 加载迅速:无需加载整个文件即可读取元数据
- 支持懒加载:按需加载权重,节省内存
- 通用性强:兼容多种 AI 模型架构
因此,现代开源模型大多提供 safetensors 版本,后缀通常为 .safetensors。
主模型:Checkpoint
Checkpoint 是 Stable Diffusion 中最核心的模型,也称为 Checkpoint Model 或 Main Model。它包含了 UNet、Text Encoder 和 VAE 的大部分参数,决定了图像的基础风格。
- 后缀:
.ckpt或.safetensors - 体积:通常在 2GB - 7GB 之间
- 存放目录:WebUI 的
models/Stable-diffusion文件夹 - 使用方式:在 WebUI 左上角切换
所有的主模型均基于 Stable Diffusion 架构训练而来,选择不同的大模型会直接改变画面的整体质感。
微调模型:LoRA 和 LyCORIS
LoRA (Low-Rank Adaptation) 和 LyCORIS 属于微调模型,用于在主模型基础上进行特定风格的调整。
- 作用:控制画风、角色外观、姿势、服装细节等
- 后缀:
.safetensors - 体积:较小,一般在 4MB - 300MB 之间
- 存放目录:WebUI 的
models/LoRA文件夹 - 使用方式:可通过 WebUI 左侧菜单激活,或在 Prompt 中使用
<lora:文件名:权重>调用
LyCORIS 是 LoRA 的扩展,调节范围更大,但通常需要额外插件支持。
文本编码器:Textual Inversion
Textual Inversion 通过修改文本嵌入向量来引入新概念。
- 作用:简化 Prompt,将复杂描述浓缩为单个关键词
- 后缀:
.pt或.safetensors - 体积:极小,通常仅几 KB
- 存放目录:WebUI 的
embeddings文件夹 - 使用方式:可在 Textual Inversion 菜单选择,或直接在 Prompt 中输入对应词汇
风格网络:Hypernetworks
Hypernetworks 是一种较早期的微调技术,通过调整神经网络权重来改变风格。
- 作用:风格微调,色彩倾向调整


