Stable Diffusion 秋叶整合包 v4.7 本地部署与入门指南

1. 概述

Stable Diffusion（简称 SD）是 2022 年发布的深度学习文本到图像生成模型，属于潜在扩散模型（Latent Diffusion Model）。它由 Stability AI 与多个学术研究者及非营利组织合作开发。目前 SD 的源代码和模型均已开源，在 GitHub 上由 AUTOMATIC1111 维护了一个完整的项目，正由全球开发者共同维护。

由于完整版对网络环境有一定要求，国内多位开发者维护了不同版本的封装包。其中，"秋叶整合包"由中国开发者秋叶开发，旨在降低使用门槛。该整合包内置了与电脑系统隔离的 Python 环境及 Git 工具，用户无需掌握编程知识即可运行 WebUI。

SD 最大的特征在于其开源特性，支持在本地离线运行。大多数配备至少 8GB 显存的消费级 GPU 硬件均可运行，建议显存为 12GB 以获得更好的训练和生图体验。

2. 核心概念解析

在使用 Stable Diffusion 之前，理解以下核心组件至关重要：

2.1 大模型 (Checkpoint)

大模型是用素材配合 SD 低模（如 SD1.5、SD1.4、SD2.1）经过深度学习炼制而成的模型文件，决定了最终出图的大方向，可视为底料。常见扩展名为 .ckpt 或 .safetensors。

2.2 VAE (Variational Autoencoder)

VAE 类似于滤镜，是对大模型的补充，用于稳定画面的色彩范围和解码潜空间数据。若未加载 VAE，生成的图片可能会出现颜色灰暗或噪点过多的情况。常见扩展名同样为 .ckpt 或 .safetensors。

2.3 LoRA (Low-Rank Adaptation)

LoRA 是一种模型插件，基于某个大模型进行微调后生成的小模型。它需要在搭配大模型使用时生效，可以在中小范围内影响出图的风格，或是增加大模型所没有的元素（如特定人物、服装、画风）。

通用性：若基于 SD 底模炼制，在不同大模型间更换使用时通用性较好。
针对性：若基于特定大模型炼制，与该模型配合时效果更佳。

2.4 ControlNet

ControlNet 被称为神级插件，赋予了 SD'眼睛'。它能够基于现有图片提取线条、景深、姿态等信息，并反推用于处理图片，实现对生成内容的精准控制。

2.5 Stable Diffusion Web-UI

这是开源大神 AUTOMATIC1111 基于 Stability AI 算法制作的开源软件。它通过浏览器图形界面操控 SD，提供了丰富的参数设置和可视化操作，是目前最流行的 SD 交互方式。

3. 环境配置与安装步骤

3.1 确认配置

在安装前，请确保您的电脑满足以下最低要求：

操作系统：Windows 10 及以上版本。
显卡：建议安装 Nvidia 独立显卡，显存需达到 6GB 以上。仅 6GB 显存可用于基础出图，若涉及模型训练建议 12GB 以上。
磁盘空间：预留至少 50GB 可用空间以存放模型文件和缓存。

查看显卡型号方法：

右键点击 Windows 左下角窗口图标。
选择'设备管理器'。
展开'显示适配器'，即可查看显卡型号。

3.2 下载与解压

获取整合包安装包至本地。
将压缩包解压至 D 盘根目录或其他无中文路径的文件夹。避免使用中文目录以防编码错误导致程序无法启动。

3.3 启动程序

安装依赖：整合包通常基于 .NET 6 驱动。请先安装 启动器运行依赖-dotnet-6.0.11.exe。已安装过 .NET6 的用户可跳过此步。

Stable Diffusion 秋叶整合包 v4.7 本地部署与入门指南