Stable Diffusion 图生图功能入门详解
本文详细介绍了 Stable Diffusion 的图生图功能,涵盖反向提示词工具(CLIP、DeepBooru、WD 1.4)、四种缩放模式及其差异、重绘幅度对图像相似度的控制原理、涂鸦与局部重绘的操作方法。文章还解析了核心参数如迭代步数、采样器、CFG 系数及种子的作用,并提供了常见问题的解决方案及最佳实践工作流。旨在帮助用户系统掌握 SD 图像编辑技术,提升创作效率与质量。

本文详细介绍了 Stable Diffusion 的图生图功能,涵盖反向提示词工具(CLIP、DeepBooru、WD 1.4)、四种缩放模式及其差异、重绘幅度对图像相似度的控制原理、涂鸦与局部重绘的操作方法。文章还解析了核心参数如迭代步数、采样器、CFG 系数及种子的作用,并提供了常见问题的解决方案及最佳实践工作流。旨在帮助用户系统掌握 SD 图像编辑技术,提升创作效率与质量。

图生图(Image-to-Image,简称 Img2Img)是 Stable Diffusion 中一项核心功能。与文生图不同,图生图允许用户基于已有的参考图像进行重绘、修改或风格迁移。其基本原理是在输入图像的基础上添加噪声,然后通过去噪过程生成新图像。这一功能在图像修复、风格转换、细节增强以及创意扩展等方面具有广泛应用。
本文将深入讲解 Stable Diffusion WebUI 中的图生图功能,涵盖反向提示词、缩放模式、重绘幅度及涂鸦绘制等关键参数,并提供最佳实践建议。
在图生图模式下,系统需要理解原始图像的语义信息,以便在保留原图特征的同时进行合理的修改。Stable Diffusion 提供了多种反向提示词工具:
CLIP(Contrastive Language–Image Pre-training)模型能够理解图像与文本的关联。使用 CLIP 反推,SD 会根据图像内容生成描述性的自然语言提示词。
DeepBooru 是一种基于标签的分类模型,专门用于生成符合 Danbooru 风格的标签式提示词。
WD 1.4 Tagger 是一个第三方插件,通常能提供比内置工具更准确的标签提取效果。
tagger,找到第一个结果并安装,重启 WebUI 后生效。对比示例: 对于同一张女性肖像图:
在调整图像尺寸时,不同的缩放模式会对最终生成结果产生显著影响。常见的模式包括:
直接对图像像素进行拉伸或压缩。
先将图像裁剪至目标比例,再进行缩放。
先将图像缩小至指定尺寸,然后使用算法填充剩余空白区域。
在潜在空间(Latent Space)中进行放大操作,而非像素空间。
重绘幅度,也称为降噪强度,是图生图中最重要的参数之一。它决定了生成图像与原图的相似程度。
调试建议:建议从 0.5 开始尝试,根据实际效果逐步调整。过高的重绘幅度可能导致图像崩坏或失去原意。
涂鸦功能允许用户在图像上绘制蒙版,指定需要重绘的区域。
上传图片后,右上角提供以下工具:
在生成日志中,常可见到以下参数组合,理解它们有助于优化生成质量:
Steps: 20, Sampler: Euler a, CFG scale: 7, Seed: 3418322614, Size: 512x512, Model hash: 7440042bbd, Model: sd_xl_refiner_1.0, Denoising strength: 0, Clip skip: 2, ENSD: 31337, Version: v1.5.1
为了获得高质量的图生图结果,建议遵循以下工作流:
A: 可能是重绘幅度过高或提示词冲突。建议降低重绘幅度,或使用专门的 Face Detailer 插件修复。
A: 使用 ControlNet 的 OpenPose 或 Canny 预处理器锁定骨架和轮廓,配合较低的重绘幅度。
A: 降低分辨率,减少批次大小,或使用 --medvram 启动参数。
Stable Diffusion 的图生图功能为创作者提供了强大的图像编辑能力。通过掌握反向提示词、缩放模式、重绘幅度及局部重绘等核心概念,用户可以灵活地控制生成结果。随着技术的进步,AI 绘画正逐渐降低创作门槛,成为职场人士提升效率的重要工具。无论是文字处理、平面设计还是数字艺术,具备 AI 技能的人才将在未来职场中占据优势。
建议用户在实际操作中多加练习,结合具体项目需求探索参数组合,充分发挥 AI 辅助创作的潜力。

微信公众号「极客日志」,在微信中扫描左侧二维码关注。展示文案:极客日志 zeeklog
使用加密算法(如AES、TripleDES、Rabbit或RC4)加密和解密文本明文。 在线工具,加密/解密文本在线工具,online
生成新的随机RSA私钥和公钥pem证书。 在线工具,RSA密钥对生成器在线工具,online
基于 Mermaid.js 实时预览流程图、时序图等图表,支持源码编辑与即时渲染。 在线工具,Mermaid 预览与可视化编辑在线工具,online
解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。 在线工具,curl 转代码在线工具,online
将字符串编码和解码为其 Base64 格式表示形式即可。 在线工具,Base64 字符串编码/解码在线工具,online
将字符串、文件或图像转换为其 Base64 表示形式。 在线工具,Base64 文件转换器在线工具,online