本地使用ComfyUI运行Stable Diffusion 3.5 | 极客日志

Python

本地使用ComfyUI运行Stable Diffusion 3.5

本地使用 ComfyUI 运行 Stable Diffusion 3.5-FP8 你有没有试过用一张消费级显卡，在不到两分钟内生成一张细节拉满的 1024×1024 分辨率图像？现在，这已经不是幻想。随着 **Stable Diffusion 3.5-FP8** 的发布，开源文生图模型正式迈入'高效推理'时代——不仅画质不输原版，速度更快、显存更省，甚至能在 RTX 3060 上流畅跑起来。而搭…

DataScient发布于 2026/4/6更新于 2026/5/2365K 浏览

本地使用 ComfyUI 运行 Stable Diffusion 3.5-FP8

你有没有试过用一张消费级显卡，在不到两分钟内生成一张细节拉满的 1024×1024 分辨率图像？现在，这已经不是幻想。随着 Stable Diffusion 3.5-FP8 的发布，开源文生图模型正式迈入'高效推理'时代——不仅画质不输原版，速度更快、显存更省，甚至能在 RTX 3060 上流畅跑起来。

而搭配 ComfyUI 这个高度模块化的前端工具，整个部署过程变得异常轻量且可控。本文将带你从零开始，一步步在本地搭建这套高性能量化系统，并避开国内用户最头疼的网络和路径问题。

硬件要求没你想的那么高

很多人一听到 SD3.5 就下意识觉得'得上专业卡'，其实那是针对未量化的大模型版本。FP8 版本通过 8-bit 浮点精度压缩，大幅降低了计算负载和内存占用。

实测表明：

RTX 3060 12GB：可稳定生成 1024×1024 图像，单张耗时约 90 秒
RTX 4060 Ti / 4070：60 秒左右，支持小批量并发
RTX 4090：最快可在 35 秒内完成推理

💡 显存建议 ≥12GB。若只有 8GB 显卡，可尝试降分辨率至 768×768 并启用 --fp8-storage 参数优化加载策略。

其他配置方面：
- 操作系统：Windows 10/11 或 Linux（本文以 Win11 为例）
- 存储空间：预留至少 15GB（含缓存与临时文件）
- CUDA 支持：需安装最新 NVIDIA 驱动（推荐 550+）

最关键的是，我们不需要手动装 Python、torch 或 xformers —— 一切都可以通过便携包搞定。

下载与部署：绕开 Hugging Face 的国内方案

直接访问 Hugging Face 下载 SD3.5 模型对很多用户来说等于'断续下载 + 超时失败'。好消息是，魔塔社区（ModelScope）已同步上线了完整 FP8 版本镜像，下载速度快、文件完整，是国内用户的首选。

第一步：获取 ComfyUI 便携环境

前往 GitHub 官方 releases 页面下载适用于 NVIDIA 显卡的便携版：

👉 https://github.com/comfyanonymous/ComfyUI/releases/latest/download/ComfyUI\_windows\_portable\_nvidia.7z

解压到任意目录，例如：

D:\AI\ComfyUI_windows_portable

这个包已经内置了 Python 3.10 和所有必要依赖，双击即可运行，完全免安装。

第二步：下载 SD3.5-FP8 核心模型

打开 ModelScope 页面：

👉 https://www.modelscope.cn/models/stabilityai/stable-diffusion-3.5-fp8

点击'模型文件'标签，找到以下五个关键文件并下载：

文件名	类型	推荐存放路径
`sd3.5_fp8_e4m3fn.safetensors`	主模型

相关免费在线工具

curl 转代码
解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。在线工具，curl 转代码在线工具，online
Base64 字符串编码/解码
将字符串编码和解码为其 Base64 格式表示形式即可。在线工具，Base64 字符串编码/解码在线工具，online
Base64 文件转换器
将字符串、文件或图像转换为其 Base64 表示形式。在线工具，Base64 文件转换器在线工具，online
Markdown转HTML
将 Markdown（GFM）转为 HTML 片段，浏览器内 marked 解析；与 HTML转Markdown 互为补充。在线工具，Markdown转HTML在线工具，online
HTML转Markdown
将 HTML 片段转为 GitHub Flavored Markdown，支持标题、列表、链接、代码块与表格等；浏览器内处理，可链接预填。在线工具，HTML转Markdown在线工具，online
JSON 压缩
通过删除不必要的空白来缩小和压缩JSON。在线工具，JSON 压缩在线工具，online

run_nvidia_gpu.bat

Starting server To see the GUI go to: http://127.0.0.1:8188

节点名称	应选模型
CLIP Text Encode (G)	`clip_g.safetensors`
CLIP Text Encode (L)	`clip_l.safetensors`
CLIP Text Encode (T5)	`t5xxl_fp8_e4m3fn.safetensors`

A futuristic city floating above clouds, neon lights, cyberpunk style, 8K ultra-detailed, cinematic lighting

blurry, low quality, distorted face, extra limbs, watermark

参数	建议值	说明
Steps	30	FP8 模型收敛快，20~40 步足够
Sampler	Euler a	稳定且细节丰富
CFG Scale	7	控制提示词权重，过高易失真
Width / Height	1024 × 1024	最大支持分辨率（取决于显存）
Seed	留空	使用随机种子探索多样性

GPU	单图平均耗时
RTX 3060 12GB	~90 秒
RTX 4060 Ti 16GB	~65 秒
RTX 4090 24GB	~35 秒

本地使用ComfyUI运行Stable Diffusion 3.5

本地使用 ComfyUI 运行 Stable Diffusion 3.5-FP8

硬件要求没你想的那么高

下载与部署：绕开 Hugging Face 的国内方案

第一步：获取 ComfyUI 便携环境

第二步：下载 SD3.5-FP8 核心模型

更多推荐文章

相关免费在线工具

文件放置说明：

启动服务与加载工作流

关键设置：三段式文本编码必须配对

开始生成你的第一张图

推荐初始参数设置：

为什么你应该选择 SD3.5-FP8？

⚡ 推理速度提升近一倍

📉 显存占用降低 30%

🎨 完整继承 SD3.5 的顶级能力

常见问题排查指南

❗ 启动时报错 'CUDA out of memory'

❗ 提示 'File not found: t5xxl_fp8_e4m3fn.safetensors'

❗ 图像模糊、结构混乱或人物畸形

写在最后：轻量部署，旗舰体验

下一步你可以尝试：

更多推荐文章

相关免费在线工具

本地使用ComfyUI运行Stable Diffusion 3.5

本地使用 ComfyUI 运行 Stable Diffusion 3.5-FP8

硬件要求没你想的那么高

下载与部署：绕开 Hugging Face 的国内方案

第一步：获取 ComfyUI 便携环境

第二步：下载 SD3.5-FP8 核心模型

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

文件放置说明：

启动服务与加载工作流

关键设置：三段式文本编码必须配对

开始生成你的第一张图

推荐初始参数设置：

为什么你应该选择 SD3.5-FP8？

⚡ 推理速度提升近一倍

📉 显存占用降低 30%

🎨 完整继承 SD3.5 的顶级能力

常见问题排查指南

❗ 启动时报错 'CUDA out of memory'

❗ 提示 'File not found: t5xxl_fp8_e4m3fn.safetensors'

❗ 图像模糊、结构混乱或人物畸形

写在最后：轻量部署，旗舰体验

下一步你可以尝试：

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具