Stable Diffusion AI 绘画入门与使用指南
一、前言
随着人工智能技术的快速发展,生成式 AI 对生活和工作的影响日益显著。Stable Diffusion(简称 SD)作为一款开源的 AI 绘图工具,因其免费、本地部署及丰富的生态资源,成为了许多创作者和开发者首选的工具之一。本文将详细介绍 Stable Diffusion 的安装、核心概念、参数设置及提示词编写方法,帮助用户快速上手并高效利用该工具进行创作。
二、环境准备与安装
1. 硬件要求
Stable Diffusion 对显卡有一定要求,尤其是显存(VRAM)。
- 推荐配置:NVIDIA 显卡,显存建议 8GB 及以上(如 RTX 3060, 4070 等),内存 16GB 以上。
- 最低配置:显存 4GB 以上可运行基础版本,但速度较慢且可能受限。
- 操作系统:Windows 10/11 为主流支持平台,MacOS 和 Linux 也有相应支持方案。
2. 软件安装
目前社区维护了多个整合包,简化了 Python 环境和依赖库的配置过程。推荐使用官方或社区广泛认可的 WebUI 整合包。
- 步骤简述:
- 下载整合包压缩包。
- 解压至非中文路径目录。
- 双击启动脚本(通常为
webui-user.bat或类似名称)。 - 首次启动会自动下载模型文件,请耐心等待。
三、核心概念与模型管理
1. 模型类型
理解不同类型的模型是掌握 SD 的关键。
- Checkpoint(大模型):体积较大(2GB-7GB),决定了图像的基础画风、光影和整体质感。例如 SD 1.5, SDXL, Pony 等。
- LoRA (Low-Rank Adaptation):体积小(几十 MB),用于微调特定角色、风格或概念。适合固定人物特征或特定画风。
- VAE (Variational Autoencoder):变分自编码器,主要作用是优化出图的颜色和细节。如果图片颜色发灰或过曝,通常需要更换 VAE 文件。
- Embedding / Textual Inversion:用于压缩提示词,将长串描述浓缩为单个 token,常用于负面提示词优化。
- ControlNet:用于精确控制构图、姿态和边缘,是实现精准生成的必备插件。
2. 模型获取与管理
模型通常从第三方网站下载,常见的包括 Civitai、LiblibAI 等。下载后需放入对应文件夹:
- Checkpoint 放入
models/Stable-diffusion - LoRA 放入
models/Lora - VAE 放入
models/VAE在界面中点击刷新按钮即可加载新模型。
四、界面参数详解
1. 采样步数 (Steps)
指生成图像时的迭代次数。步数过低会导致画面不完整,过高则收益递减且耗时增加。
- 建议范围:20-40 步。对于大多数场景,30 步左右是平衡点。
2. 采样器 (Sampler)
决定模型如何从噪声中生成图像的算法策略。不同采样器在速度和画质上各有优劣。
| 算法 | 特点 | 适用场景 |
|---|


