Stable Diffusion 利用 Reference Only 实现多场景人脸一致

在 AI 绘画创作中，保持角色形象的一致性是最具挑战性的问题之一。例如为小说创作插图或游戏设计角色时，若每次生成的图片人物长相不同，将严重影响连续性创作。

固定 Seed 值是传统方法中最简单的尝试。实测表明，虽然能让生成的人物看起来相似，但会将整个画面（包括姿势、背景、服装）固定住，无法达到'同一个人在不同场景'的需求。

LORA 模型是另一个常见选择，但存在痛点：训练高质量 LORA 需要大量素材和调参经验；现成模型效果参差不齐，即使权重调至最高，生成的脸仍可能有明显差异；混合多个 LORA 特征时结果往往不理想。

ControlNet 的 Reference Only 功能能有效解决上述痛点。它无需训练额外模型，仅需一张参考图片即可在新生成的图片中保持核心特征的一致性。主要优势如下：

操作极其简单。无需理解复杂模型训练流程，直观如使用'图片滤镜'。步骤包括：准备满意的角色图片；在 ControlNet 中启用 Reference Only；输入新的场景提示词。
灵活性超强。可在保持人脸一致的同时，自由改变服装风格、场景背景、艺术风格及拍摄角度。
适用性广。不仅适用于真人照片，对动漫角色、动物形象同样有效。

更多推荐文章