Stable Diffusion 文生图保姆级入门指南
简介
Stable Diffusion(简称 SD)是一款基于扩散模型的开源人工智能图像生成工具。它允许用户通过文本提示词(Prompt)生成高质量的图像,广泛应用于艺术创作、设计辅助及概念验证等领域。
环境准备
在使用 SD 之前,建议确保硬件环境满足基本要求:
- 显卡:NVIDIA GPU 为佳,显存建议 4GB 以上,8GB 及以上体验更佳。
- 软件:推荐使用 Automatic1111 WebUI 或 ComfyUI 等主流部署方案。
- 模型资源:需下载基础大模型(Checkpoint)及相关插件。
界面参数详解
1. 模型选择 (Model)
模型是 SD 的核心,不同的 Checkpoint 文件决定了图像的整体风格、画质和细节表现。常见的模型类型包括写实类、二次元类及混合风格类。
推荐模型下载站点:
- Civitai
- LiblibAI
2. 提示词 (Prompts)
提示词分为正向提示词(Positive Prompt)和反向提示词(Negative Prompt)。
- 正向提示词:描述你希望画面中出现的内容。
- 反向提示词:描述你不希望出现的内容(如模糊、畸形、多余肢体等)。
权重规则:
- 提示词在开头和末尾的权重较高,中间部分权重较低。
- 若提示词过长,SD 可能会忽略中间部分以减少计算量。
- 可通过
(keyword:1.2)的形式单独增加特定词汇的权重。
3. 迭代步数 (Sampling Steps)
一般设定在 20~30 步之间,具体取决于所选的大模型。
- 步数越高:图片越精致、精确,但生成时间增加。
- 步数过低:可能导致画面细节不足或结构混乱。
- 建议:并非越高越好,找到适合当前模型的平衡点最佳。
4. 采样方法 (Sampler)
SD 提供多种采样算法,适用于不同场景:
- Euler a:适合生成相对简单的图像,适应快速生成场景,如二次元风格。
- DPM++ 2M Karras / DPM++ SDE Karras:可快速生成高品质图像,适合真人、自然场景。
- UniPC:生成更逼真的图像并提高采样速度,适合人形体相关场景,可用较少步数实现复杂效果。
5. 面部修复 (Face Fix)
主要用于修复扭曲的人脸,适用于真人场景。如果生成的人物脸部崩坏,可勾选此选项进行自动优化。
6. 平铺图 (Tiling)
可实现图像的无缝拼贴效果,适用于生成花纹、背景纹理等场景。
7. 高分辨率修复 (Hires. Fix)
默认情况下,文生图在较高分辨率下(宽高大于 756 像素)制作图像可能出现混沌现象。开启该选项可先生成低分辨率底图,再放大并修复细节。
常用放大算法:
- 真实图片场景:R-ESRGAN 4x+
- 动漫二次元场景:R-ESRGAN 4x+ Anime6B


