本地使用 ComfyUI 运行 Stable Diffusion 3.5-FP8
你有没有试过用一张消费级显卡,在不到两分钟内生成一张细节拉满的 1024×1024 分辨率图像?现在,这已经不是幻想。随着 Stable Diffusion 3.5-FP8 的发布,开源文生图模型正式迈入'高效推理'时代——不仅画质不输原版,速度更快、显存更省,甚至能在 RTX 3060 上流畅跑起来。
而搭配 ComfyUI 这个高度模块化的前端工具,整个部署过程变得异常轻量且可控。本文将带你从零开始,一步步在本地搭建这套高性能量化系统,并避开国内用户最头疼的网络和路径问题。
硬件要求没你想的那么高
很多人一听到 SD3.5 就下意识觉得'得上专业卡',其实那是针对未量化的大模型版本。FP8 版本通过 8-bit 浮点精度压缩,大幅降低了计算负载和内存占用。
实测表明:
- RTX 3060 12GB:可稳定生成 1024×1024 图像,单张耗时约 90 秒
- RTX 4060 Ti / 4070:60 秒左右,支持小批量并发
- RTX 4090:最快可在 35 秒内完成推理
💡 显存建议 ≥12GB。若只有 8GB 显卡,可尝试降分辨率至 768×768 并启用
--fp8-storage参数优化加载策略。
其他配置方面:
- 操作系统:Windows 10/11 或 Linux(本文以 Win11 为例)
- 存储空间:预留至少 15GB(含缓存与临时文件)
- CUDA 支持:需安装最新 NVIDIA 驱动(推荐 550+)
最关键的是,我们不需要手动装 Python、torch 或 xformers —— 一切都可以通过便携包搞定。
下载与部署:绕开 Hugging Face 的国内方案
直接访问 Hugging Face 下载 SD3.5 模型对很多用户来说等于'断续下载 + 超时失败'。好消息是,魔塔社区(ModelScope)已同步上线了完整 FP8 版本镜像,下载速度快、文件完整,是国内用户的首选。
第一步:获取 ComfyUI 便携环境
前往 GitHub 官方 releases 页面下载适用于 NVIDIA 显卡的便携版:
解压到任意目录,例如:
D:\AI\ComfyUI_windows_portable
这个包已经内置了 Python 3.10 和所有必要依赖,双击即可运行,完全免安装。
第二步:下载 SD3.5-FP8 核心模型
打开 ModelScope 页面:
👉 https://www.modelscope.cn/models/stabilityai/stable-diffusion-3.5-fp8
点击'模型文件'标签,找到以下五个关键文件并下载:
| 文件名 | 类型 | 推荐存放路径 |
|---|---|---|
sd3.5_fp8_e4m3fn.safetensors | 主模型 |

