跳到主要内容
极客日志极客日志面向AI+效率的开发者社区
首页博客GitHub 精选镜像工具UI配色美学隐私政策关于联系
搜索内容 / 工具 / 仓库 / 镜像...⌘K搜索
注册
博客列表
PythonAI算法

Stable Diffusion 教程:额外功能、后期处理与高清化

Stable Diffusion 额外功能模块提供图片放大与人脸修复工具。图片放大利用超分辨率技术提升低分辨率图像清晰度,支持多种算法如 ESRGAN、LDSR 及 SwinIR,可设置缩放比例与裁剪方式。人脸修复支持 GFPGAN 与 CodeFormer 模型,能改善磨皮过度、变形或模糊的人脸效果,并可调节权重参数。该功能适合显存不足时先生成小图再放大,或用于修复老照片及生成图中的面部瑕疵。

深海蔚蓝发布于 2025/2/7更新于 2026/6/526 浏览
Stable Diffusion 教程:额外功能、后期处理与高清化

Stable Diffusion 教程:额外功能、后期处理与高清化

"额外功能"对应的英文单词是 Extras,部分版本翻译为'后期处理'或'高清化'。其主要功能是放大图片、去噪、修脸等对图片的后期处理。注意这里对图片的处理不是 Stable Diffusion 本身的能力,都是额外扩展的。

图片放大

对于分辨率比较小的图片,如果强制用较大的分辨率展示,会出现图片模糊的情况,这时候就可以使用 SD WebUI 的图片放大功能。所谓图片放大就是在保持图片清晰度的前提下增加图片的分辨率,它还有个专业点的名词:超分辨率技术,简称为'超分'。

具体操作方式如下:

  1. 主菜单中点击进入'额外功能'。
  2. 点击'单张图像',也就是一次只处理一张图片。后边的'批量处理'可以上传多张图片进行处理,'批量处理目录下图像'可以指定处理一个目录下的所有图片。
  3. 点击上传一张要处理的图片。
  4. 选择缩放比例。这里有两种方式:按照比例缩放和指定分辨率缩放,指定分辨率时可以设置是否自动裁剪。
  5. Upscaler1 用来指定放大算法,常见的放大算法有下面几个:
    • 无/None:单纯的放大,不做任何优化处理。
    • Lanczos:使用加权平均插值方法,利用原始图像自身的像素信息,增加图像的细节,从而提高图像的分辨率。传统的纯数学算法,效果一般。
    • Nearest:使用简单的插值方法,基于最近邻像素的值进行插值,从而增加图像的细节和提高分辨率。传统的纯数学算法,效果一般。
    • LDSR:基于深度学习,通过使用轻量级的网络结构和残差学习,实现较高的超分性能和计算效率。
    • ESRGAN:全称 Enhanced Super-Resolution Generative Adversarial Networks(增强超分生成对抗网络),基于深度学习的超分辨率算法。增加了很多看上去很真实的纹理,但是有时可能会过度拟合。
    • 4x-UltraSharp:基于 ESRGAN 做了优化,比较适合处理真人。
    • ESRGAN_4x:Real ESRGAN,完全使用纯合成数据来尽量贴近真实数据进行训练。
    • R-ESRGAN 4x+:基于 Real ESRGAN 的优化模型,适合放大真实风格的图片,常用。
    • R-ESRGAN 4x+ Anime6B:基于 Real ESRGAN 的优化模型,适合放大动漫风格的图片,常用。
    • ScuNET GAN:基于深度学习,使用生成对抗网络(GAN)进行训练。主要用在提高图像的视觉效果和感知质量。
    • ScuNET PSNR:基于深度学习,使用均方误差(PSNR)进行训练。主要用在提高图像的客观质量和准确性。
    • SwinIR_4x:使用 Swin Transformer 思想,基于自注意力机制的 Transformer 结构,适合各种图像的超分,比较通用。

这些算法会在首次使用它们时分别下载,你也可以提前下载它们,并放到指定的目录。

  1. Upscaler2 用来避免 Upscaler1 过度处理的问题,比如磨皮太严重。可以使用一些普通方法算法,比如 Lanczos。Upscaler2 可见度是指图片放大时使用 Upscaler2 算法进行处理的比例,为 0 时完全不使用 Upscaler2,为 1 时只使用 Upscaler2。
  2. 点击'生成'。
  3. 放大后的图片在这里显示。

小结

这个图片放大功能主要是为了放大 Stable Diffusion 生成的低分辨率图片,因为图片分辨率越大对显存的要求也越大,所以对于显存较小的同学,可以先在文生图中生成一张低分辨率图片,然后再在这里放大。

对于修复模糊图片,这个图片放大功能其实能力有限,实际测试 WebUI 默认自带的放大算法也就是能去去噪点,消消锯齿,出图的效果并不是很好,特别是原本就很糊的图片。

不过可能存在其它的算法具备较好的模糊图片修复效果,大家可以找来试试。

修脸

虽然图片放大本身对修复模糊图片的效果有限,但是它附带了一个修脸的参数。如果文生图生成的人脸效果不好,比如磨皮太严重、人脸变形等,都可以在这里试试。对于模糊的人脸,也有比较好的修复效果。

修脸方法支持两个模型:GFPGAN 和 CodeFormer,操作方法如下:

  1. GFPGAN:腾讯开源的一个修脸模型,修复的细节比较清晰,人物形象的还原度比较高,气质保持的好。
  2. CodeFormer:另一个修脸模型,修图的细节也比较清晰,皮肤纹理更真实一些,不过这个模型对牙齿的处理效果不好。这个模型还有一个面部重建权重的参数,取值范围 0-1,0 的时候模型会补充很多细节,面部改变较大;1 的时候面部基本没有改变,不会补充很多细节,但是也有修脸的效果。

这两个模型可以一起使用,我们可以通过 GFPGAN visibility 和 CodeFormer visibility 来设置它们的参与度。

以下是几组示例说明:

  1. 原图是 Stable Diffusion 生成的,我用图片管理工具缩小了分辨率。可以看到,相比仅放大,加上修脸之后,人物的面部有了明显的改善。
  2. 这是一张从网上收集的图片,原图就是比较模糊的老照片,分别单独使用 GFPGAN 和 CodeFormer 的效果。GFPGAN 的人物气质拿捏的比较到位,CodeFormer 面部纹理更真实一些,但是不宜将重建权重值设置的过小。
  3. 这也是从网上收集的图片,这张照片破损比较严重,使用的 GFPGAN 模型,能修复一些破损。

以上内容即为稳定扩散额外功能的核心介绍。

目录

  1. Stable Diffusion 教程:额外功能、后期处理与高清化
  2. 图片放大
  3. 修脸
  • 💰 8折买阿里云服务器限时8折了解详情
  • Magick API 一键接入全球大模型注册送1000万token查看
  • 🤖 一键搭建Deepseek满血版了解详情
  • 一键打造专属AI 智能体了解详情
极客日志微信公众号二维码

微信扫一扫,关注极客日志

微信公众号「极客日志V2」,在微信中扫描左侧二维码关注。展示文案:极客日志V2 zeeklog

更多推荐文章

查看全部
  • OneNet 平台 Android Studio GET 获取数据与安全鉴权实现
  • Effective Modern C++ 条款 37:确保 std::thread 在所有路径上不可结合
  • 系统开发成本为何居高不下:低代码的工程化降本路径
  • OpenClaw Web 管理面板调试与大模型配置指南
  • 前端监控实战:错误、性能与用户行为追踪
  • STC89C52 智能家居温湿度控制系统设计
  • Web 开发者转型 AI:多模态 Agent 图像识别 Skills 全栈实战
  • Python 与 SQLAlchemy:数据库管理入门指南
  • Java 对象的序列化和反序列化
  • 微服务架构下的智能路由、故障自愈与日志分析实践
  • Visual C++运行库修复指南:解决程序启动失败问题
  • MCP 插件配置实战:browser-tools-mcp 示例
  • 前端 Base64 文件上传详解:原理、实现与最佳实践
  • SG 函数详解:博弈论通用解法与实战
  • 从零构建可扩展 Flutter 应用:v1.0 到 v2.0 架构演进详解
  • Python 基础算法实战:滑动窗口详解
  • 在线学生成绩综合统计分析系统的设计与实现
  • OpenClaw 腾讯云服务器部署与飞书对接实战指南
  • Flutter 三方库 arcade 的鸿蒙化适配指南
  • 人工智能与大模型核心技术体系及学习路径指南

相关免费在线工具

  • 加密/解密文本

    使用加密算法(如AES、TripleDES、Rabbit或RC4)加密和解密文本明文。 在线工具,加密/解密文本在线工具,online

  • RSA密钥对生成器

    生成新的随机RSA私钥和公钥pem证书。 在线工具,RSA密钥对生成器在线工具,online

  • Mermaid 预览与可视化编辑

    基于 Mermaid.js 实时预览流程图、时序图等图表,支持源码编辑与即时渲染。 在线工具,Mermaid 预览与可视化编辑在线工具,online

  • 随机西班牙地址生成器

    随机生成西班牙地址(支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选),支持数量快捷选择、显示全部与下载。 在线工具,随机西班牙地址生成器在线工具,online

  • Gemini 图片去水印

    基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印,支持批量处理与下载。 在线工具,Gemini 图片去水印在线工具,online

  • curl 转代码

    解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。 在线工具,curl 转代码在线工具,online