跳到主要内容
极客日志极客日志面向AI+效率的开发者社区
首页博客GitHub 精选镜像工具UI配色美学隐私政策关于联系
搜索内容 / 工具 / 仓库 / 镜像...⌘K搜索
注册
博客列表
PythonAI

本地运行 Qwen-Image:Windows 上 ComfyUI 部署记录

记录在 Windows 上使用 ComfyUI 加载 Qwen-Image 20B 文生图模型的完整过程,涵盖环境配置、模型下载、工作流导入及 LoRA 扩展,无需云平台即可完成中文文本嵌入图像的高质量生成。FP8 量化版本显存友好,适合追求本地控制的用户。

imJackJia发布于 2026/6/300 浏览
本地运行 Qwen-Image:Windows 上 ComfyUI 部署记录

想在 Windows 上本地跑 Qwen-Image 文生图?用 ComfyUI 搭一套是最直接的路子。最近试了一下,过程比预想的简单,记录一下步骤和踩过的小坑。

环境准备

先确认机器上装了 Python 和 CUDA 驱动。ComfyUI 本身是绿色包,直接从官方 Download 即可,解压到本地目录。

启动也方便:双击 ComfyUI 根目录下的 run_nvidia_gpu.bat,终端窗口自动初始化后会弹出浏览器打开操作界面。

模型文件

需要从 HuggingFace 下载三个核心文件:

  • Diffusion 模型:qwen_image_fp8_e4m3fn.safetensors
  • Text Encoder:qwen_2.5_vl_7b_fp8_scaled.safetensors
  • VAE:qwen_image_vae.safetensors

注意第一个 Diffusion 模型链接点进去其实是 text_encoders 目录下的文件,但官方给的路径就是这样,直接下载就行。存放到 ComfyUI 的对应目录:

📂 ComfyUI/
├── 📂 models/
│   ├── 📂 diffusion_models/
│   │   └── qwen_image_fp8_e4m3fn.safetensors
│   ├── 📂 vae/
│   │   └── qwen_image_vae.safetensors
│   └── 📂 text_encoders/
│       └── qwen_2.5_vl_7b_fp8_scaled.safetensors

加载模型与生成

打开 ComfyUI 界面后,节点配置很简单:

  • Load Diffusion Model 节点选 qwen_image_fp8_e4m3fn.safetensors
  • Load CLIP 节点选 qwen_2.5_vl_7b_fp8_scaled.safetensors
  • Load VAE 节点选 qwen_image_vae.safetensors

设置图像尺寸(比如 1024×1024),填入提示词,点生成即可。

工作流 JSON 导入

ComfyUI 支持直接拖入工作流文件。官方示例和模板在这:

  • 示例页面:https://comfyanonymous.github.io/ComfyUI_examples/qwen_image/
  • 直接下载 JSON:https://raw.githubusercontent.com/Comfy-Org/workflow_templates/refs/heads/main/templates/image_qwen_image.json

把下好的 .json 文件拖进 ComfyUI 界面,节点连线会自动铺好。替换提示词就能跑。

示例提示词(中文):

宫崎骏的动漫风格。平视角拍摄,阳光下的古街热闹非凡。一个穿着青衫、手里拿着写着'阿里云'卡片的逍遥派弟子站在中间。旁边两个小孩惊讶的看着他。左边有一家店铺挂着'云存储'的牌子,里面摆放着发光的服务器机箱,门口两个侍卫守护者。右边有两家店铺,其中一家挂着'云计算'的牌子,一个穿着旗袍的美丽女子正看着里面闪闪发光的电脑屏幕;另一家店铺挂着'云模型'的牌子,门口放着一个大酒缸,上面写着'千问',一位老板娘正在往里面倒发光的代码溶液。

顺便提下 LoRA

如果觉得默认风格不够,可以上 LoRA。去 CivitAI 之类的地方找个喜欢的风格模型(通常是 .safetensors 或 .ckpt),拖到 ComfyUI 界面里,然后在工作流中加入 Load Lora 节点并关联文件名,重新生成即可。

关于 Qwen-Image 模型

Qwen-Image 是通义千问系列的开源文生图模型,20B 参数,用的 MMDiT 多模态扩散架构,Apache 2.0 许可。它最大的亮点是对中文文本渲染的准确性,能直接把文字嵌进图像细节里,背景替换、颜色调整也顺手。

小范围对比

我用同一个混合中英文提示词分别在几个模型上试了下:

"A warm, golden-lit ancient tower interior in Tang dynasty style..."

结果来看,Qwen-Image FP8 量化版在画面锐度、光影质感上表现不错,特别是在理解中文场景描述时优势明显,文字生成也更靠谱。

资源消耗

官方数据显示 FP8 精度对显存需求比较友好,我 12GB 显存跑起来没啥压力。如果卡够好,可以尝试 BF16 精度追求更高画质。


这样整套环境就跑起来了,无需依赖特定云平台,本地折腾一把挺有意思。对于需要精细控制生图过程、尤其是中文文字嵌入的场景,这个方案足够用。

目录

  1. 环境准备
  2. 模型文件
  3. 加载模型与生成
  4. 工作流 JSON 导入
  5. 顺便提下 LoRA
  6. 关于 Qwen-Image 模型
  7. 小范围对比
  8. 资源消耗
  • 免费图片AI生成工具免费生成了解详情
  • Magick API 一键接入全球大模型注册送1000万token查看
  • 免费图片视频在线生成30秒,将你的创意变成现实开始设计
  • X/Twitter免费视频下载器免登陆无限额度免费视频解析下载了解详情
  • 100+免费在线小游戏爽一把
极客日志微信公众号二维码

微信扫一扫,关注极客日志

微信公众号「极客日志V2」,在微信中扫描左侧二维码关注。展示文案:极客日志V2 zeeklog

更多推荐文章

查看全部
  • Copilot、Cursor、JetBrains 实战四场景:从测试到 CRUD 的关键写法
  • 昇腾 NPU 部署 Llama-2-7B 的踩坑与经验
  • 用 Claude 在 Android Studio 里 10 分钟搭好 WebView 模块
  • 前端地图开发核心概念:坐标系、SDK与GeoHash实践
  • 前端错误处理:try/catch 与 Promise 的正确姿势
  • JDK 21 安装实录:Windows 与 macOS 双平台配置
  • 宜搭低代码实践:待办应用从表单到列表全流程
  • 股票实时行情 API 调用:Python、JavaScript、Java 示例
  • PCA实战笔记:降维、代码与避坑思路
  • Python 实战体感:爬虫、后端和人工智能这几年
  • JS 流程控制:条件与循环核心用法
  • 昇腾平台 DeepSeek-R1 与 Qwen2.5 RL 训练优化及 cann-recipes-train 仓库解析
  • Hx0 鹰眼:在浏览器侧栏完成抓包、重放与 AI 审计
  • CVE-2015-7450:WebSphere 反序列化漏洞的攻击链分析
  • 把 Dify 连上 MySQL:用 MCP 直接让大模型查数据库
  • 在飞书里用 Openclaw 运行多个机器人:配置与分工实践
  • Whisper-large-v3 离线部署实战:摆脱 HuggingFace Hub 的网络依赖
  • Python 异步编程简明指南:协程、任务与 asyncio
  • 用 AstrBot+NapCat 搭个 QQ 机器人,再打通公网
  • Qwen3-VL 的双模式是怎么工作的?Instruct 与 Thinking 实践对比

相关免费在线工具

  • RSA密钥对生成器

    生成新的随机RSA私钥和公钥pem证书。 在线工具,RSA密钥对生成器在线工具,online

  • Mermaid 预览与可视化编辑

    基于 Mermaid.js 实时预览流程图、时序图等图表,支持源码编辑与即时渲染。 在线工具,Mermaid 预览与可视化编辑在线工具,online

  • 随机西班牙地址生成器

    随机生成西班牙地址(支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选),支持数量快捷选择、显示全部与下载。 在线工具,随机西班牙地址生成器在线工具,online

  • curl 转代码

    解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。 在线工具,curl 转代码在线工具,online

  • Base64 字符串编码/解码

    将字符串编码和解码为其 Base64 格式表示形式即可。 在线工具,Base64 字符串编码/解码在线工具,online

  • Base64 文件转换器

    将字符串、文件或图像转换为其 Base64 表示形式。 在线工具,Base64 文件转换器在线工具,online