前言
随着人工智能技术的飞速发展,AI 绘画已成为内容创作领域的重要工具。相比 Midjourney 等闭源商业软件,Stable Diffusion(简称 SD)以其开源、免费、可本地部署的特性,为技术爱好者提供了更高的自由度和可控性。本文将详细介绍 Stable Diffusion 的入门安装、核心功能配置以及基于蒙版和 ControlNet 的写真生成实战流程。
本文详细介绍了 Stable Diffusion 的安装配置及写真生成实战教程。内容包括环境搭建、WebUI 基础操作、基于 Inpaint Anything 的面部蒙版制作、ControlNet 姿态与线稿控制、以及局部重绘的细节优化。文章涵盖了提示词编写、参数设置、硬件要求及常见问题排查,旨在帮助读者从零开始掌握 AI 写真的核心技术流程。

随着人工智能技术的飞速发展,AI 绘画已成为内容创作领域的重要工具。相比 Midjourney 等闭源商业软件,Stable Diffusion(简称 SD)以其开源、免费、可本地部署的特性,为技术爱好者提供了更高的自由度和可控性。本文将详细介绍 Stable Diffusion 的入门安装、核心功能配置以及基于蒙版和 ControlNet 的写真生成实战流程。
提到 AI 绘画,Midjourney 因其高质量出图而广为人知,但其使用门槛较高(需网络环境)且订阅费用不菲。对于希望深入理解原理或进行定制化开发的技术人员而言,Stable Diffusion 是更优的选择。
Stable Diffusion 是一个基于潜在扩散模型(Latent Diffusion Model)的开源项目。它允许用户在本地运行,通过调整参数、更换模型和使用插件,实现从文生图到图生图的多种效果。其强大的扩展性和社区生态支持,使其成为目前最流行的开源 AI 绘图方案之一。
为了简化环境配置,建议使用整合包(如秋叶启动器、B站大佬发布的整合包)。
webui-user.bat 或 start.bat。git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui.gitpip install -r requirements.txtpython webui.pySD 的核心在于模型(Checkpoint)。常用模型包括 SD 1.5、SDXL 等。模型文件需放置在 stable-diffusion-webui/models/Stable-diffusion 目录下。启动后在设置中刷新即可选择。
启动 WebUI 后,主要包含以下标签页:
本章节介绍如何通过局部重绘(Inpainting)结合 ControlNet,实现人物脸部不变、背景或服装变化的写真效果。
为了固定人物特征,我们需要精确提取人脸区域。
建议选择写实风格的大模型,例如 MajicMix Realistic 或 ChilloutMix 等。在模型下拉菜单中选择已下载的 .safetensors 格式模型。
正向提示词描述画面内容,负向提示词排除不想要的元素。
示例提示词:
High quality, masterpiece, realistic photography, 8k, high-definition,
1 girl, solo, exquisite hairstyle, black hair, crown, headwear,
Blue dress, long skirt,
Outdoor, snow, ice castle, snowflakes, blurred background, looking at viewer
负向提示词:
low quality, worst quality, bad anatomy, bad hands, text, watermark, signature
ControlNet 用于控制画面的结构、姿态和轮廓。
开启 OpenPose 单元,上传参考人物的骨架图,可以保持人物姿势一致。
为了固定脸型轮廓,使用 Canny 预处理器。
生成结果可能存在脖子、发际线融合不自然的问题,需进行二次局部重绘。
最后使用外部修图软件(如美图秀秀、Photoshop)调整整体色温和色调,确保皮肤质感与背景协调。
--xformers 参数可显著提升生成速度。--medvram 或 --lowvram 参数启动。若无高性能电脑,可使用 Google Colab、AutoDL 等云平台。这些平台提供 GPU 资源,按小时计费,适合临时体验或批量生成。
Stable Diffusion 提供了极高的创作自由度。通过掌握蒙版技术、ControlNet 控制以及参数调优,用户可以高效生成高质量的写真作品。虽然对硬件有一定要求,但随着云服务的普及,门槛正在逐渐降低。持续学习模型训练(LoRA)和高级工作流,将进一步拓展 AI 绘画的应用边界。

微信公众号「极客日志」,在微信中扫描左侧二维码关注。展示文案:极客日志 zeeklog
使用加密算法(如AES、TripleDES、Rabbit或RC4)加密和解密文本明文。 在线工具,加密/解密文本在线工具,online
生成新的随机RSA私钥和公钥pem证书。 在线工具,RSA密钥对生成器在线工具,online
基于 Mermaid.js 实时预览流程图、时序图等图表,支持源码编辑与即时渲染。 在线工具,Mermaid 预览与可视化编辑在线工具,online
解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。 在线工具,curl 转代码在线工具,online
将字符串编码和解码为其 Base64 格式表示形式即可。 在线工具,Base64 字符串编码/解码在线工具,online
将字符串、文件或图像转换为其 Base64 表示形式。 在线工具,Base64 文件转换器在线工具,online