第五节.Stable Diffusion大模型

优质文章学习记录

10 Apr 2026 — 8 min read

🍉大模型（Stable Diffusion 模型）

大模型，也叫 Stable Diffusion 模型，是 Stable Diffusion 绘图的核心基础，所有生成效果都依赖它。

常见版本

大模型已迭代出多个版本，常见的有：

Stable Diffusion 1.4（SD1.4）
Stable Diffusion 1.5（SD1.5）
Stable Diffusion 2.0（SD2.0）
Stable Diffusion 2.1（SD2.1）
Stable Diffusion XL（SDXL）
Playground、Stable Cascade 等

对初学者来说，重点记住两个主流版本：

SD1.5：最经典、生态最成熟，适合大多数场景
SDXL：新一代大模型，画质更高、细节更强

其他版本可以后续慢慢了解。

重要注意事项

SD1.5 和 SDXL 不通用：

SD1.5 必须搭配 SD1.5 专用 的 ControlNet 等模型
SDXL 必须搭配 SDXL 专用 的 ControlNet 等模型用错版本会直接报错，后面会结合案例详细说明。

🍉为什么要切换不同的大模型？

要理解为什么要切换大模型，核心是搞清楚 SD1.5 和 SDXL 这两代主力模型的区别：

1. 理论层面：SDXL 更 “强”

SDXL（新版本）：训练用的是 1024×1024 分辨率图像
- 理论上出图效果更好
- 能理解更多词汇
- 画面更精致、细节更丰富
SD1.5（老版本）：训练用的是 512×512 分辨率图像
- 基础能力不如 SDXL

2. 现实层面：SD1.5 更 “好用”

SD1.5
- 发布早，生态极其成熟
- 有海量微调模型、LoRA、ControlNet 等配套资源
- 出图效果已经很好，商用场景大多够用
- 对显卡要求低，生成速度快
SDXL
- 发布晚，生态还在追赶
- 模型体积大，对显卡要求高
- 微调难度大，间接拖慢生态发展
- 出图速度比 SD1.5 慢好几倍
- 这些限制导致普及速度较慢

简单总结：

追求画质、细节、表现力 → 优先用 SDXL
追求速度、兼容性、生态资源 → 优先用 SD1.5

2026.1现状：SDXL 生态变好，但 SD1.5 仍主流

到 2026 年 1 月，SDXL 的生态已经比刚发布时完善很多，但 SD1.5 依然是很多人的首选。这一点很重要，因为后面用别人的 ComfyUI 工作流时，必须先看作者用的是哪个版本的大模型，再做对应调整，否则容易报错。

加速模型：LCM / Turbo / Lightning

除了官方版本，你还会遇到带 LCM、Turbo、Lightning 等后缀的模型，它们都属于加速模型。

背景：SDXL 对电脑性能要求高，生成速度慢，所以官方和第三方都在做加速方案。
代价：加速通常会牺牲一点画质（优秀的加速模型，画质损失很小）。
用途：适合需要快速出图、预览效果的场景。

刚才花了一点时间，了解两大版本的差别，那么为什么每个版本下，会有那么多的第三方模型呢？

主要是为了增强某些方面的特殊优化。

优化之后，有些模型会更适合画写实类的画面，有些是二次元，还有一些模型会很适合画幻想元素等等。这个就好比，第三节提到的“雕刻师”都是转职过的，技能上会有所偏向，平时大家使用的，也大多是这些微调的大模型，效果会更好。

🍉模型下载网站：

LibLib（哩布哩布）

LibLib 是国内的大模型分享平台，无需科学上网即可访问。

经过一年多发展，已沉淀大量优质模型，包含不少原创作者的作品；
同时也搬运了许多国外优秀模型，下载方便；
虽有部分模型不开放下载，但绝大多数可免费获取。

官方地址：https://www.liblib.art/

Civitai（C 站）

Civitai 是业内老牌的模型网站，也被称作 C 站。

特点：模型全、更新快，配有缩略图，方便筛选；
限制：需要科学上网 (魔法)才能访问；
官方地址：https://civitai.com/

Hugging Face（抱脸）

Hugging Face 也被称作 “抱脸”，是一个可以下载插件、模型和代码的平台。

特点：更偏向开发者，而非设计师，查找资源的操作门槛相对较高；
访问限制：早期无需科学上网，现在需要科学上网才能正常访问；
官方地址：https://huggingface.co/

🍉模型推荐

面对众多模型，如何挑选效果好的？

其实没有绝对标准，核心是按任务和目标选择：

做漫画 → 选二次元风格大模型
做摄影 → 选写实类大模型

这也是 AI 绘画需要大容量硬盘的原因 —— 很多人会下载几十 G 甚至上百 G 的模型，来覆盖不同场景。

当然，也有一些公认优秀的模型，下面做简单推荐，大家可以先下载，后续使用时就不用临时等待下载了。

这里我将一些常用的模型存到了网盘里，大家可以去一键下载。
链接: https://pan.baidu.com/s/1zUVEfCKQmvYUx7JAN_1rvw 提取码: g2wp

SD1.5

写实类模型推荐

majicMIX realistic（麦橘写实）

这是一款非常优秀的真人写实模型，深受摄影师群体喜爱；
生成美女等写实人像效果稳定、靠谱；
下载地址：majicMIX realistic 麦橘写实

ChilloutMix

一款老牌写实真人模型，在早期非常流行；
虽然现在看技术上稍显落后，但日常使用依然可行；
下载地址：ChilloutMix

Realistic Vision

一款通用型写实大模型，适用场景广、通用性强；
缺点：生成亚洲面孔时，效果不如 majicMIX realistic、ChilloutMix 出色；
优点：在其他写实场景（如风景、静物、欧美人像等）中表现实用；
下载地址：Realistic Vision V6.0

2.5D 模型

ReVAnimated

实用性非常高，已默认打包在提供的 ComfyUI 中；
若不慎删除，可在相关网站或网盘中重新下载；
下载地址：ReVAnimated

动漫模型

Counterfeit-V2.5

经典动漫风格大模型，适合二次元插画、角色生成；
下载地址：Counterfeit-V2.5

SDXL 写实类模型推荐

XXMix_9realisticSDXL

专门针对 SDXL 版本 的写实模型；
解决了默认 SDXL 模型生成亚洲面孔效果不佳的问题，适合生成亚洲人像；
下载地址：XXMix_9realisticSDXL

realisticStockPhoto_v20

一款通用性很强的 SDXL 写实类模型；
下载地址：realisticStockPhoto_v20

其他模型

Juggernaut XL

一款通用性较强的模型，在数字艺术类作品的生成上表现出色；
下载地址：Juggernaut XL

🍉模型下载后，如何安装？

在 ComfyUI 中，大模型无需安装，只需放到指定文件夹即可。

下载的 Stable Diffusion 大模型，放在 models 下的 checkpoints 文件夹中；
可以在 checkpoints 里建二级文件夹分类存放，也可以直接放进去，ComfyUI 都能识别。

下一节，我们就基于一个实际案例，来讲解如何通过大模型来生成一张不错的图片，大家不见不散。

提升效率：llama.cpp启动优化指南 | 从分钟级到秒级的蜕变

提升效率：llama.cpp启动优化指南 | 从分钟级到秒级的蜕变【免费下载链接】llama.cppPort of Facebook's LLaMA model in C/C++ 项目地址: https://gitcode.com/GitHub_Trending/ll/llama.cpp 在开源项目llama.cpp的本地部署过程中，模型启动速度慢是开发者和用户普遍面临的痛点。漫长的启动等待不仅降低开发调试效率，也严重影响用户体验。本文将聚焦性能调优，通过系统化的优化策略，帮助你实现从分钟级到秒级的启动速度提升，让本地部署的大模型真正发挥其实用价值。问题定位：启动缓慢的根源分析 llama.cpp启动过程涉及模型加载、计算资源初始化、预热推理等多个环节，任何一个环节的低效都会导致整体启动延迟。通过对src/llama.cpp核心代码的分析，我们发现主要瓶颈集中在三个方面：未优化的模型加载流程、默认线程配置不合理以及预热策略缺乏针对性。这些问题在不同环境下表现各异，开发环境中频繁重启的场景受影响尤为明显，而生产环境则更关注稳定的首次响应时间。

Qwen2.5-7B-Instruct应用案例：打造你的专属AI写作助手

Qwen2.5-7B-Instruct应用案例：打造你的专属AI写作助手 1. 为什么你需要一个真正懂写作的AI助手？你有没有过这样的经历： * 写周报时卡在第一句，改了三遍还是觉得干巴巴； * 给客户写方案，反复调整语气却总差那么点专业感； * 想写一篇2000字的行业分析，查资料两小时，动笔五分钟就停住； * 甚至只是想给朋友圈配一段不落俗套的文字，翻遍灵感库也没找到合适的表达。这些不是“不会写”，而是写作这件事本身太消耗认知资源——你要同时兼顾逻辑、结构、语气、细节、场景适配……人脑不是CPU，没法并行处理这么多维度。而Qwen2.5-7B-Instruct，不是又一个“能生成文字”的模型，它是专为真实写作任务打磨出来的高阶文本伙伴。70亿参数不是数字游戏，它意味着：能一口气写出结构完整、段落有呼吸感的2000字长文；理解“给技术总监看的汇报”和“发给实习生的提醒”本质是两种语言；在你写到第三段时，还记得第一段埋下的伏笔；把“帮我润色这句话”真的当成一个编辑请求，而不是机械替换同义词。这不是替代你写作，而是把那些重复性、消耗性的脑力劳动接过去

熟练使用 GitHub Copilot、Cursor、JetBrains AI Assistant 的实战指南

这三款工具都是当前最强的 AI 编程助手，能显著提升你的开发效率。掌握它们后，你可以让 AI 处理繁琐的基础工作，专注于核心业务逻辑。以下是针对你提出的 4 个核心需求的详细操作指南，包含具体步骤、最佳实践和注意事项。一、让 AI 为你生成单元测试和边界测试用例为什么需要边界测试？ * 单元测试只覆盖正常场景，边界测试（如 null、极值、异常输入）能暴露隐藏 Bug。 * AI 容易遗漏边界情况，必须明确要求才会生成。 📌 操作步骤（分工具说明） 1. GitHub Copilot（适用于 VS Code、JetBrains IDE 等）适用场景：在代码编写时实时生成测试用例。步骤： 1. 编写被测函数（例如一个计算器函数）： def

FLUX.1-dev创意工作流：从Midjourney迁移指南+Prompt工程适配最佳实践

FLUX.1-dev创意工作流：从Midjourney迁移指南+Prompt工程适配最佳实践如果你是从Midjourney转向本地部署的创作者，或者正在寻找一个画质顶尖、永不崩溃的AI绘图方案，那么这篇文章就是为你准备的。 Midjourney以其出色的艺术表现力，成为了许多人的AI绘图启蒙工具。但你是否也遇到过这些问题：生成次数有限制、排队等待时间长、无法深度定制生成参数、或者对生成内容的隐私性有顾虑？当你的创作需求从“玩一玩”升级到“生产力”时，一个稳定、私密、可控的本地化方案就显得尤为重要。今天，我们将深入探讨如何将你的创意工作流，从Midjourney平滑迁移到FLUX.1-dev旗舰版。这不仅仅是一个工具替换，更是一次创作能力的全面升级。我们将重点解决两个核心问题：如何快速上手这个强大的本地系统，以及如何将你熟悉的Midjourney Prompt技巧，完美适配到FLUX模型上，让你无缝衔接，甚至获得更惊艳的成果。 1. 为什么选择FLUX.1-dev作为你的下一站？在深入迁移细节之前，我们先来了解一下这个“新家”到底强在哪里。你拿到的这个FLUX.1-de