2025最新如何在本地部署 Stable Diffusion3.5超详细完整教程

2025最新如何在本地部署 Stable Diffusion3.5超详细完整教程

在本地部署 Stable Diffusion 3.5:让 AI 绘图更便捷

前言

随着人工智能的快速发展,图像生成技术日益成熟,Stable Diffusion 3.5 作为一款强大的 AI 绘图工具,广泛应用于设计师、创作者等人群的视觉内容生成。它能够通过文本提示生成高质量图像,且具备较高的可控性和细腻的生成效果。

然而,默认情况下,Stable Diffusion 3.5 仅能在局域网内运行,远程操作或者出门时调整参数、查看进度会受到限制。在本文中,我们将通过本地部署的方式,帮助您克服这一限制,实现更加灵活的使用。

提示:不同型号的 Stable Diffusion 对硬件要求有所不同。以 Large Turbo 版本为例,推荐配备至少 8GB 显存以保证流畅运行。
文章目录在本地部署 Stable Diffusion 3.5:让 AI 绘图更便捷前言1. 本地部署 ComfyUI环境准备步骤 1:下载 ComfyUI步骤 2:选择合适的脚本步骤 3:启动 ComfyUI步骤 4:设置中文语言2. 下载 Stable Diffusion 3.5 模型模型选择步骤 1:下载模型文件步骤 2:下载 Clip 编码器文件步骤 3:运行 ComfyUI 服务3. 演示文生图步骤 1:加载示例工作流步骤 2:设置模型步骤 3:输入提示词并生成图像总结

1. 本地部署 ComfyUI

环境准备

  • 操作系统:Windows 11 专业版
  • 显卡要求:至少 8GB 显存

步骤 1:下载 ComfyUI

访问 ComfyUI 的官方 GitHub 页面,下载最新版的免安装版:

打开 GitHub 页面后,找到免安装版并下载解压至本地目录。

ComfyUI GitHub 下载页面

步骤 2:选择合适的脚本

在解压后的文件夹中,您会看到 run_cpurun_nvidia_gpu 两个脚本。run_cpu 是通过 CPU 解码,而 run_nvidia_gpu 则是通过 NVIDIA 显卡加速,后者运行速度更快。

选择适合您硬件的脚本,双击运行。

ComfyUI 运行脚本

步骤 3:启动 ComfyUI

运行脚本后,打开浏览器并访问 http://127.0.0.1:8188,即可进入 ComfyUI 的控制界面。

ComfyUI 页面

默认界面是英文,我们接下来设置为中文,以便更好地进行操作。

步骤 4:设置中文语言

  1. 下载中文语言包:中文插件下载链接
  2. 将解压后的文件放入 ComfyUI 根目录下的 custom_nodes 文件夹中。
中文语言包配置
  1. 回到 ComfyUI,进入设置并选择中文语言。
ComfyUI 设置中文

至此,ComfyUI 界面已经切换为中文,操作更加直观。

2. 下载 Stable Diffusion 3.5 模型

模型选择

Stable Diffusion 3.5 系列有多个版本,本教程使用的是 Stable Diffusion 3.5 Large Turbo 版本。

  • Stable Diffusion 3.5 Large:适合需要高质量图像的专业用户,建议使用 16GB 以上显存。
  • Stable Diffusion 3.5 Large Turbo:速度更快,生成过程更高效,推荐 8GB 显存。
  • Stable Diffusion 3.5 Medium:较为轻量,适合消费级硬件。

点击以下链接下载 Large Turbo 版本模型文件:

步骤 1:下载模型文件

在下载页面找到 sd3.5_large_turbo.safetensors 文件,并将其保存到 ComfyUI 的 models/checkpoint 文件夹中。

模型下载

步骤 2:下载 Clip 编码器文件

接下来,下载以下 Clip 编码器文件并将其保存至 ComfyUI 的 models/clip 文件夹中:

Clip 编码器下载

步骤 3:运行 ComfyUI 服务

回到 ComfyUI 根目录,运行一键脚本启动服务。

3. 演示文生图

步骤 1:加载示例工作流

将下载的 SD3.5L_Turbo_example_workflow.json 文件拖入 ComfyUI 界面中。

加载工作流

步骤 2:设置模型

在左侧的 Clip 设置中,选择刚刚下载的模型。

设置模型

步骤 3:输入提示词并生成图像

在中间的 CLIP 文本编码器中输入提示词,点击右侧的“添加提示词队列”按钮。

生成图像

生成图像后,您就可以看到在本地成功运行的 Stable Diffusion 3.5 模型生成的图像,操作更加便捷。

总结

恭喜您!通过本教程,您已经成功在本地部署了 Stable Diffusion 3.5 模型,并搭建了自己的 AI 绘画工作站。以下是整个部署过程的总结:

  • 第一步:搭建工作台
    • 下载并解压 ComfyUI 免安装版。
    • 启动服务,安装中文插件,完成环境配置。
  • 第二步:安装模型
    • 下载并安装 Stable Diffusion 3.5 Large Turbo 模型及所需的 Clip 编码器。
    • 将模型文件准确放入 ComfyUI 对应文件夹。
  • 第三步:启动并测试
    • 重启 ComfyUI 服务,加载示例工作流。
    • 输入提示词并生成第一张图像。

您已成功完成本地部署,并可以开始探索更多的功能和高级工作流。如果您希望将其转换为公网地址,便于远程访问,建议参考相关教程进行配置。

感谢您跟随本教程完成部署,祝您的创作之旅愉快!

Read more

Whisper语音识别:开启本地智能音频处理新时代

Whisper语音识别:开启本地智能音频处理新时代 【免费下载链接】whisper-base.en 项目地址: https://ai.gitcode.com/hf_mirrors/openai/whisper-base.en 在数字化浪潮席卷各行各业的今天,语音识别技术正以前所未有的速度改变着我们的工作与生活方式。作为OpenAI推出的革命性语音识别模型,Whisper凭借其卓越的本地处理能力和多语言支持,正在重新定义音频内容处理的边界。 技术演进:从云端到本地的范式转移 语音识别技术经历了从传统算法到深度学习的跨越式发展。早期的语音识别系统依赖复杂的声学模型和语言模型,处理精度有限且对计算资源要求极高。随着Transformer架构的广泛应用,语音识别进入了新的发展阶段。 行业洞察:传统云端语音识别虽然便捷,但面临着数据隐私、网络延迟和成本控制三大挑战。Whisper的本地部署方案恰好解决了这些痛点,让用户能够在完全离线的环境中享受专业级的语音转文字服务。 真实场景:语音识别如何重塑工作流程 案例一:法律行业的数字化转型 张律师是一家知名律所的合伙人,每天需要处理

PyTorch实战——基于文本引导的图像生成技术与Stable Diffusion实践

PyTorch实战——基于文本引导的图像生成技术与Stable Diffusion实践

PyTorch实战——基于文本引导的图像生成技术与Stable Diffusion实践 * 0. 前言 * 1. 基于扩散模型的文本生成图像 * 2. 将文本输入编码为嵌入向量 * 3. 条件 UNet 模型中的文本数据融合机制 * 4. 使用 Stable Diffusion 模型生成图像 * 相关链接 0. 前言 在本节中,我们将为扩散模型添加文本控制能力。学习如何通过文字描述来引导图像生成过程,实现从"纯噪声+文本"生成图像,而不仅是从纯噪声生成。 1. 基于扩散模型的文本生成图像 在扩散模型的 UNet 模型训练流程中,我们仅训练模型从含噪图像中预测噪声。为实现文生图功能,需使用以下架构,将文本作为额外输入注入 UNet 模型: 这样的 UNet 模型称为条件 UNet 模型 ,或者更精确地说,是文本条件 UNet

ROS1机器人SLAM系列(四):Gmapping算法详解与实战

ROS1机器人SLAM系列(四):Gmapping算法详解与实战 本文将深入讲解Gmapping算法的原理,并通过实战演示如何使用Gmapping进行2D激光SLAM建图。 1. Gmapping算法简介 1.1 什么是Gmapping? Gmapping是一种基于**粒子滤波(Rao-Blackwellized Particle Filter, RBPF)**的2D激光SLAM算法。它由Giorgio Grisetti等人于2007年提出,是ROS中最经典、应用最广泛的SLAM算法之一。 主要特点: * 基于粒子滤波的概率框架 * 适用于2D激光雷达 * 需要里程计信息 * 实现成熟,稳定可靠 * 适合中小规模室内环境 1.2 算法流程概述 Gmapping算法流程 里程计数据 运动预测 Motion Model 粒子集合更新 激光雷达数据 扫描匹配 Scan Matching 观测更新 Sensor Model 粒子权重计算 重采样 Resample 地图更新 2. 核心算法原理

VSCode在WSL环境下无法使用Github Copilot(网络问题)

概要 本文记录了一个案例:VSCode 在 WSL 环境下无法使用 Github Copilot,但是原生 Windows 下使用没问题。 问题表现 使用 VsCode 连接到 WSL 后,Copilot 无法进行自动或手动补全,在聊天窗口输入信息后始终显示“正在准备 Copilot”。 使用 Ctrl+` 打开面板,点击“输出”面板,右上角选择"Github Copilot Chat",可以看到错误日志如下: 2025-09-03 15:54:27.648 [info] [GitExtensionServiceImpl] Initializing Git extension service. 2025-09-03 15:54:27.