跳到主要内容
极客日志极客日志面向AI+效率的开发者社区
首页博客GitHub 精选镜像工具UI配色美学隐私政策关于联系
搜索内容 / 工具 / 仓库 / 镜像...⌘K搜索
注册
博客列表
PythonAI算法

Windows 本地部署 ComfyUI 运行 Qwen-Image 大模型详细步骤

综述由AI生成Windows 环境下使用 ComfyUI 部署阿里 Qwen-Image 文生图大模型的完整流程。涵盖模型下载、环境配置、工作流加载及 LoRA 风格扩展,对比了不同生成效果,并分析了资源消耗情况。

imJackJia发布于 2026/2/8更新于 2026/5/2323 浏览
Windows 本地部署 ComfyUI 运行 Qwen-Image 大模型详细步骤

前言

Stable Diffusion 本地部署往往面临显卡驱动、环境配置等繁琐问题。随着阿里推出 Qwen-Image 开源文生图模型,结合 ComfyUI 工作流可以更方便地实现高质量图像生成。本文将详细介绍在 Windows 环境下部署 ComfyUI 并加载 Qwen-Image 模型的完整流程。

ComfyUI 部署与配置

环境准备

确保已安装 Python 环境及 CUDA 驱动。下载 ComfyUI 官方版本,解压至本地目录。

启动脚本: 双击 ComfyUI 根路径下的 run_nvidia_gpu.bat 文件。 终端窗口将自动初始化,随后默认浏览器会打开 ComfyUI 操作界面。

模型下载

需下载以下核心模型文件(基于 HuggingFace):

  1. Diffusion Model: qwen_image_fp8_e4m3fn.safetensors

  2. Text Encoder: qwen_2.5_vl_7b_fp8_scaled.safetensors

  3. VAE: qwen_image_vae.safetensors

建议目录结构如下:

📂 ComfyUI/
├── 📂 models/
│ ├── 📂 diffusion_models/
│ │ └── qwen_image_fp8_e4m3fn.safetensors
│ ├── 📂 vae/
│ │ └── qwen_image_vae.safetensors
│ └── 📂 text_encoders/
│ └── qwen_2.5_vl_7b_fp8_scaled.safetensors

运行步骤

  1. 加载模型节点:

    • Load Diffusion Model: 加载 qwen_image_fp8_e4m3fn.safetensors
    • Load CLIP: 加载 qwen_2.5_vl_7b_fp8_scaled.safetensors
    • Load VAE: 加载 qwen_image_vae.safetensors
  2. 设置参数:

    • 设定图像尺寸(如 1024x1024)。
    • 输入提示词。
  3. 生成图片: 点击生成按钮等待输出结果。

阿里模型简介

Qwen-Image 是通义千问系列的文生图开源模型,参数量达 20B,采用 MMDiT 多模态扩散架构,遵循 Apache 2.0 许可证。该模型擅长中文文本渲染,能够准确将文字内容嵌入图像细节中,支持背景替换、颜色调整等操作。

配置 ComfyUI 相关内容以及 Qwen-Image Json WorkFlow

下载工作流

官方示例工作流地址: https://comfyanonymous.github.io/ComfyUI_examples/qwen_image/

JSON 模板链接: https://raw.githubusercontent.com/Comfy-Org/workflow_templates/refs/heads/main/templates/image_qwen_image.json

启动 ComfyUI 加载工作流

  1. 打开 ComfyUI 界面。
  2. 将下载的 .json 工作流文件拖拽至 ComfyUI 界面中。
  3. 界面会自动解析出对应的节点连线结构。
  4. 在对应输入框填入官方推荐的提示词。

示例提示词:

宫崎骏的动漫风格。平视角拍摄,阳光下的古街热闹非凡。一个穿着青衫、手里拿着写着'阿里云'卡片的逍遥派弟子站在中间。旁边两个小孩惊讶的看着他。左边有一家店铺挂着'云存储'的牌子,里面摆放着发光的服务器机箱,门口两个侍卫守护者。右边有两家店铺,其中一家挂着'云计算'的牌子,一个穿着旗袍的美丽女子正看着里面闪闪发光的电脑屏幕;另一家店铺挂着'云模型'的牌子,门口放着一个大酒缸,上面写着'千问',一位老板娘正在往里面倒发光的代码溶液。

LoRA 模型加持

如需特定写实风格,可额外下载 LoRA 模型(通常后缀为 .safetensors 或 .ckpt)。

  1. 从模型分享网站(如 CivitAI)搜索并下载所需风格的 LoRA。
  2. 将 LoRA 文件拖入 ComfyUI 界面。
  3. 在工作流中找到 Load Lora 节点,关联文件名。
  4. 重新输入提示词并生成。

可灵、即梦、Qwen-Image 对比

使用同一混合中英文提示词进行测试:

"A warm, golden-lit ancient tower interior in Tang dynasty style..."

测试结果对比显示,Qwen-Image FP8 量化版本在 ComfyUI 中运行时,画面锐度、文字渲染准确性及光影质感表现优异,尤其在中文场景描述上具有显著优势。

资源消耗

根据官方实测数据,FP8 精度模型对显存需求相对友好。用户可根据硬件条件尝试 BF16 精度以获得更佳效果,具体资源占用视显存大小而定。

总结

通过本地部署 ComfyUI 并结合 Qwen-Image 模型,可以实现高质量的中文文生图任务。无需依赖特定云平台,本地 GPU 即可满足推理需求。该方案适合需要精细控制生成过程及处理中文文本渲染的用户。

目录

  1. 前言
  2. ComfyUI 部署与配置
  3. 环境准备
  4. 模型下载
  5. 运行步骤
  6. 阿里模型简介
  7. 配置 ComfyUI 相关内容以及 Qwen-Image Json WorkFlow
  8. 下载工作流
  9. 启动 ComfyUI 加载工作流
  10. LoRA 模型加持
  11. 可灵、即梦、Qwen-Image 对比
  12. 资源消耗
  13. 总结
  • 💰 8折买阿里云服务器限时8折了解详情
  • Magick API 一键接入全球大模型注册送1000万token查看
  • 🤖 一键搭建Deepseek满血版了解详情
  • 一键打造专属AI 智能体了解详情
极客日志微信公众号二维码

微信扫一扫,关注极客日志

微信公众号「极客日志V2」,在微信中扫描左侧二维码关注。展示文案:极客日志V2 zeeklog

更多推荐文章

查看全部
  • VS Code 集成 Overleaf 插件实现 AI 辅助 LaTeX 写作
  • 机器人动态控制:重力补偿技术实战指南
  • 攻防世界 Web 题解:Lottery 与 ics-05 漏洞分析
  • Windows 系统升级后无法删除 Windows.old?TrustedInstaller 权限获取指南
  • 多轮对话中实现 AI 长期记忆的 8 种优化方法及代码示例
  • 网络爬虫基础概念与开发者工具使用指南
  • 大模型常用架构及优缺点分析
  • 阿里 RynnBrain 具身智能模型:30B MoE 时空记忆架构与机器人开发实战
  • 超越代码生成器:深度解析 Triton-Copilot 的人机协同设计哲学
  • 数据结构:单向链表与双向链表核心操作及实现
  • LLaMA-Factory 数据集制作与 Qwen3 模型微调评估
  • 本地 Web 服务器搭建指南:Web Server for Chrome 使用详解
  • ibbot(智体机灵):国产开源 AI 智能体平台解析
  • WebSSH2:基于浏览器的 SSH 终端搭建与配置
  • 复旦微 FMQL45T900 搭建 ARM+FPGA 开发环境指南
  • 清华大学与智谱团队探索 RLHF 的 Scaling Laws
  • 腾讯 WorkBuddy 一键部署与 AI 办公智能体使用指南
  • 数据结构:快慢指针原理及链表环检测
  • Linux diff 与 patch 命令实战指南
  • Docker 本地部署 Dify 教程

相关免费在线工具

  • 加密/解密文本

    使用加密算法(如AES、TripleDES、Rabbit或RC4)加密和解密文本明文。 在线工具,加密/解密文本在线工具,online

  • RSA密钥对生成器

    生成新的随机RSA私钥和公钥pem证书。 在线工具,RSA密钥对生成器在线工具,online

  • Mermaid 预览与可视化编辑

    基于 Mermaid.js 实时预览流程图、时序图等图表,支持源码编辑与即时渲染。 在线工具,Mermaid 预览与可视化编辑在线工具,online

  • 随机西班牙地址生成器

    随机生成西班牙地址(支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选),支持数量快捷选择、显示全部与下载。 在线工具,随机西班牙地址生成器在线工具,online

  • Gemini 图片去水印

    基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印,支持批量处理与下载。 在线工具,Gemini 图片去水印在线工具,online

  • curl 转代码

    解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。 在线工具,curl 转代码在线工具,online