Stable Diffusion WebUI(AUTOMATIC1111,简称 A1111)是一个为高级用户设计的图形用户界面(GUI),提供了丰富的功能和灵活性,以满足复杂和高级的图像生成需求。由于其强大的功能和社区的活跃参与,A1111 成为了 Stable Diffusion 模型事实上的标准 GUI,并且是新功能和实验性工具的首选发布平台。
本指南可以作为一步步跟随的教程,帮助你从基础开始学习如何使用 A1111。通过实际操作的例子,你可以逐步了解每个功能的作用和配置方法。当你已经熟悉了基本操作后,可以将此指南作为快速参考手册。在学习过程中,示例是非常重要的,通过观察和实践示例,可以更清晰地理解每个设置的效果和用途。
下载并安装 Stable Diffusion WebUI
请前往 GitHub 仓库克隆代码并启动。确保你的显卡显存大于 8G,否则在使用中会非常慢,并且可能会出现某些功能无法使用的问题。
txt2img
当您首次启动 GUI 时,您会看到 txt2img 标签。这个标签执行了 Stable Diffusion 的最基本功能:将文本提示转换成图像。
基本用法
如果你是第一次使用 webUI,那么下面这几个参数是你一定需要注意的:
- Checkpoint:这个模型决定了你图片的基础风格。
- Prompt(提示词):输入你希望生成的图片描述。
- Negative Prompt(反向提示词):输入你不想在图片上看到的内容。
- 宽度和高度:输出图像的尺寸。当使用 v1 模型时,您应该将至少一边设置为 512 像素。例如,将宽度设置为 512,高度设置为 768,以获得一个 2:3 的纵向图像。
- 批处理大小:每次生成的图像数量。在测试提示时,您至少想生成几个图像,因为每个图像都会有所不同。最后,点击 生成 按钮。稍等片刻,您就会得到您的图像!
图像生成参数
在上面生成图像的底部,我们可以看到一些关于图片生成的具体信息,具体到上面的例子,我们得到了下面的图片生成参数:
Prompt: a girl,0lg4kury, Negative prompt: (unhealthy-deformed-joints:2),(unhealthy-hands:2),easynegative,ng_deepnegative_v1_75t,(worst quality:2),(low quality:2),(normal quality:2),lowres,bad anatomy,badhandv4,((extra limbs)),((extra legs)),((fused legs)),((extra arms)),((fused arms)),normal quality,((monochrome)),((grayscale)),((watermark)),uneven eyes,lazy eye,bad-hands-5,(((mutated hand))), Steps: 20,
Sampler: DPM++ 2M Karras,
CFG scale: 7,
Seed: 1650696303,
Size: 512x512,
Clip skip: 2
- 采样步骤:去噪过程的采样步骤数。步数越多越好,但也需要更长时间。25 步适用于大多数情况。
- 宽度和高度:输出图像的尺寸。对于 v1 模型,您应该至少将一侧设置为 512 像素。例如,将宽度设置为 512,高度设置为 768,以获得一个 2:3 的竖向图像。使用 v2-768px 模型时,应至少将一侧设置为 768。
- 批次计数:运行图像生成管道的次数。
- 批次大小:每次运行管道生成的图像数量。生成的图像总数等于批次计数乘以批次大小。通常您会更改批次大小,因为这样更快。只有在遇到内存问题时才会更改批次计数。
- CFG scale(分类器无指导比例):是一个参数,用于控制模型应该多大程度上遵循您的提示。
- 1 - 大部分忽略您的提示。
- 3 - 更具创造性。
- 7 - 在遵循提示和自由之间取得良好的平衡。
- 15 - 更加遵循提示。
- 30 - 严格遵循提示。
seed
seed:是在潜在空间中用于生成初始随机张量的种子值。从实际情况来看,它可以控制图像的内容。


