Stable Diffusion 秋叶整合包 v4.7 本地部署与入门指南
1. 概述
Stable Diffusion(简称 SD)是 2022 年发布的深度学习文本到图像生成模型,属于潜在扩散模型(Latent Diffusion Model)。它由 Stability AI 与多个学术研究者及非营利组织合作开发。目前 SD 的源代码和模型均已开源,在 GitHub 上由 AUTOMATIC1111 维护了一个完整的项目,正由全球开发者共同维护。
由于完整版对网络环境有一定要求,国内多位开发者维护了不同版本的封装包。其中,"秋叶整合包"由中国开发者秋叶开发,旨在降低使用门槛。该整合包内置了与电脑系统隔离的 Python 环境及 Git 工具,用户无需掌握编程知识即可运行 WebUI。
SD 最大的特征在于其开源特性,支持在本地离线运行。大多数配备至少 8GB 显存的消费级 GPU 硬件均可运行,建议显存为 12GB 以获得更好的训练和生图体验。
2. 核心概念解析
在使用 Stable Diffusion 之前,理解以下核心组件至关重要:
2.1 大模型 (Checkpoint)
大模型是用素材配合 SD 低模(如 SD1.5、SD1.4、SD2.1)经过深度学习炼制而成的模型文件,决定了最终出图的大方向,可视为底料。常见扩展名为 .ckpt 或 .safetensors。
2.2 VAE (Variational Autoencoder)
VAE 类似于滤镜,是对大模型的补充,用于稳定画面的色彩范围和解码潜空间数据。若未加载 VAE,生成的图片可能会出现颜色灰暗或噪点过多的情况。常见扩展名同样为 .ckpt 或 .safetensors。
2.3 LoRA (Low-Rank Adaptation)
LoRA 是一种模型插件,基于某个大模型进行微调后生成的小模型。它需要在搭配大模型使用时生效,可以在中小范围内影响出图的风格,或是增加大模型所没有的元素(如特定人物、服装、画风)。
- 通用性:若基于 SD 底模炼制,在不同大模型间更换使用时通用性较好。
- 针对性:若基于特定大模型炼制,与该模型配合时效果更佳。
2.4 ControlNet
ControlNet 被称为神级插件,赋予了 SD'眼睛'。它能够基于现有图片提取线条、景深、姿态等信息,并反推用于处理图片,实现对生成内容的精准控制。
2.5 Stable Diffusion Web-UI
这是开源大神 AUTOMATIC1111 基于 Stability AI 算法制作的开源软件。它通过浏览器图形界面操控 SD,提供了丰富的参数设置和可视化操作,是目前最流行的 SD 交互方式。
3. 环境配置与安装步骤
3.1 确认配置
在安装前,请确保您的电脑满足以下最低要求:
- 操作系统:Windows 10 及以上版本。
- 显卡:建议安装 Nvidia 独立显卡,显存需达到 6GB 以上。仅 6GB 显存可用于基础出图,若涉及模型训练建议 12GB 以上。
- 磁盘空间:预留至少 50GB 可用空间以存放模型文件和缓存。
查看显卡型号方法:
- 右键点击 Windows 左下角窗口图标。
- 选择'设备管理器'。
- 展开'显示适配器',即可查看显卡型号。
3.2 下载与解压
- 获取整合包安装包至本地。
- 将压缩包解压至 D 盘根目录或其他无中文路径的文件夹。避免使用中文目录以防编码错误导致程序无法启动。
3.3 启动程序
- 安装依赖:整合包通常基于 .NET 6 驱动。请先安装
启动器运行依赖-dotnet-6.0.11.exe。已安装过 .NET6 的用户可跳过此步。


