Stable Diffusion AI 绘画入门与实战指南

1. 概述

人工智能生成内容（AIGC）正在重塑数字艺术创作领域。Stable Diffusion（简称 SD）作为一款开源的深度学习文本到图像生成模型，凭借其强大的生成能力和灵活的扩展性，成为了目前最流行的 AI 绘画工具之一。它允许用户通过输入文字描述（Prompt），快速生成高质量、风格多样的图像，广泛应用于壁纸设计、插画创作、概念设计及商业素材制作等领域。

本文旨在为初学者提供一份详尽的 Stable Diffusion 使用指南，涵盖环境搭建、核心功能操作、提示词工程及参数优化等关键技术点，帮助用户从零开始掌握 AI 绘画技能。

2. 硬件与环境要求

在开始之前，确保您的计算机满足以下最低配置要求，以保证软件流畅运行：

操作系统：Windows 10/11 或 Linux (Ubuntu 推荐)。
显卡 (GPU)：NVIDIA 显卡是首选，建议显存至少 4GB，推荐 8GB 及以上（如 RTX 3060, 4090 等）。AMD 显卡支持有限，需额外配置 ROCm 环境。
内存 (RAM)：建议 16GB 或以上。
硬盘空间：预留至少 50GB 可用空间用于安装软件及存储模型文件。
Python 环境：部分高级用法需要 Python 3.8+ 环境支持。

3. 软件安装步骤

3.1 选择启动器

对于新手用户，推荐使用集成度高的启动器，例如 "Stable Diffusion WebUI" 的整合包（如秋叶启动器、OneClick 等）。这些整合包预装了依赖库和常用插件，无需手动配置复杂的 Python 环境。

3.2 基础安装流程

下载整合包：从官方 GitHub 或可信社区获取最新版本的 WebUI 整合包。
解压文件：将压缩包解压至一个路径不含中文、空格或特殊字符的文件夹中。
运行脚本：双击 webui-user.bat (Windows) 或 webui.sh (Linux) 启动程序。
首次加载：首次运行时会自动下载默认模型并初始化环境，请耐心等待。
访问界面：启动成功后，浏览器会自动打开 http://127.0.0.1:7860，即可进入操作界面。

AI 绘画界面概览

4. 界面与核心功能解析

WebUI 界面主要分为以下几个区域：

文生图 (txt2img)：根据文字描述生成新图像。
图生图 (img2img)：基于已有图片进行修改或重绘。
高清修复 (Hires. fix)：提升生成图像的分辨率和细节。
Inpainting (局部重绘)：修改图片中的特定区域。
Extras (后期处理)：包含超分放大、批量处理等功能。

5. 提示词工程 (Prompt Engineering)

提示词是控制 AI 生成内容的核心。正确的提示词能显著提升出图质量。

5.1 正向提示词

正向提示词描述了您希望画面中出现的内容。格式通常为逗号分隔的关键词组合。

示例：

参数	说明	推荐设置
Sampling Steps	采样步数，决定生成过程的迭代次数	20 - 50
CFG Scale	提示词引导系数，控制对提示词的遵循程度	7 - 12
Sampler	采样算法，影响生成速度和效果	Euler a, DPM++ 2M Karras
Seed	随机种子，固定种子可复现相同结果	-1 (随机)
Width/Height	输出图像分辨率	512x512 或 768x768

Stable Diffusion AI 绘画入门与实战指南