想在 Windows 上本地跑 Qwen-Image 文生图?用 ComfyUI 搭一套是最直接的路子。最近试了一下,过程比预想的简单,记录一下步骤和踩过的小坑。
环境准备
先确认机器上装了 Python 和 CUDA 驱动。ComfyUI 本身是绿色包,直接从官方 Download 即可,解压到本地目录。
启动也方便:双击 ComfyUI 根目录下的 run_nvidia_gpu.bat,终端窗口自动初始化后会弹出浏览器打开操作界面。
模型文件
需要从 HuggingFace 下载三个核心文件:
- Diffusion 模型:qwen_image_fp8_e4m3fn.safetensors
- Text Encoder:qwen_2.5_vl_7b_fp8_scaled.safetensors
- VAE:qwen_image_vae.safetensors
注意第一个 Diffusion 模型链接点进去其实是 text_encoders 目录下的文件,但官方给的路径就是这样,直接下载就行。存放到 ComfyUI 的对应目录:
📂 ComfyUI/
├── 📂 models/
│ ├── 📂 diffusion_models/
│ │ └── qwen_image_fp8_e4m3fn.safetensors
│ ├── 📂 vae/
│ │ └── qwen_image_vae.safetensors
│ └── 📂 text_encoders/
│ └── qwen_2.5_vl_7b_fp8_scaled.safetensors
加载模型与生成
打开 ComfyUI 界面后,节点配置很简单:
- Load Diffusion Model 节点选
qwen_image_fp8_e4m3fn.safetensors - Load CLIP 节点选
qwen_2.5_vl_7b_fp8_scaled.safetensors - Load VAE 节点选
qwen_image_vae.safetensors
设置图像尺寸(比如 1024×1024),填入提示词,点生成即可。
工作流 JSON 导入
ComfyUI 支持直接拖入工作流文件。官方示例和模板在这:
- 示例页面:https://comfyanonymous.github.io/ComfyUI_examples/qwen_image/
- 直接下载 JSON:https://raw.githubusercontent.com/Comfy-Org/workflow_templates/refs/heads/main/templates/image_qwen_image.json
把下好的 .json 文件拖进 ComfyUI 界面,节点连线会自动铺好。替换提示词就能跑。
示例提示词(中文):
宫崎骏的动漫风格。平视角拍摄,阳光下的古街热闹非凡。一个穿着青衫、手里拿着写着'阿里云'卡片的逍遥派弟子站在中间。旁边两个小孩惊讶的看着他。左边有一家店铺挂着'云存储'的牌子,里面摆放着发光的服务器机箱,门口两个侍卫守护者。右边有两家店铺,其中一家挂着'云计算'的牌子,一个穿着旗袍的美丽女子正看着里面闪闪发光的电脑屏幕;另一家店铺挂着'云模型'的牌子,门口放着一个大酒缸,上面写着'千问',一位老板娘正在往里面倒发光的代码溶液。


