Stable Diffusion 文生图功能详解与参数配置指南
前言
Stable Diffusion(简称 SD)是目前开源领域最流行的生成式人工智能模型之一,其核心能力在于根据文本提示词(Prompt)生成高质量的图像。文生图(Text-to-Image)是 SD WebUI 中最基础也是最常用的功能模块。本文将以 Stable Diffusion WebUI 为例,详细解析文生图界面的各个参数含义、配置技巧以及常见问题解决方案,帮助初学者快速上手并提升出图质量。
一、WebUI 界面概览
打开 Stable Diffusion WebUI 后,默认进入'文生图'标签页。界面主要分为以下几个区域:
- 模型选择区:位于顶部,用于加载不同的 Checkpoint 大模型。不同模型具有独特的风格偏好,如写实类、二次元类或艺术插画类。
- 提示词输入区:包含正向提示词和反向提示词输入框,这是控制生成内容的核心指令区域。
- 采样设置区:包括采样器类型、采样步数、CFG 引导系数等算法相关参数。
- 尺寸与批次设置区:设定输出图片的分辨率及单次生成的数量。
- 生成按钮与结果展示区:点击生成后查看进度条,并在下方网格中查看生成的图片。
二、核心参数详解
1. 提示词(Prompt)
提示词是描述画面内容的指令,直接决定生成图像的主题和细节。
- 语言建议:虽然支持中文,但英文提示词的识别精度更高,社区分享的提示词库也多为英文。
- 结构建议:推荐采用'质量词 + 主体 + 细节 + 环境 + 风格'的结构。
- 质量词:如
best quality,masterpiece,high resolution,用于提升画面整体质感。 - 主体:如
1girl,cyberpunk city,cat,明确画面主角。 - 细节:如
long black hair,detailed eyes,wearing white shirt,丰富人物特征。 - 环境与光影:如
sunny day,cinematic lighting,depth of field,营造氛围。
- 质量词:如
示例提示词:
best quality, masterpiece, super high resolution, 4k, adult women, asia, full body:1.4, long black hair, beautiful detailed eyes, small breasts, white t-shirt:1.6, white pants:1.6, wide shot:1.3, strolling, beach:1.3, tree, beautiful detailed sky, blue sky
2. 反向提示词(Negative Prompt)
反向提示词用于排除不希望出现在画面中的元素,能有效减少常见瑕疵。
- 常用负面词:
- , , (修复手部畸形)


