Qwen-Image 结合 ComfyUI 的 AI 绘画入门指南
你是否尝试过在本地安装 ComfyUI,却卡在 Python 环境、依赖冲突、模型路径或节点报错上?是否看到别人用 Qwen-Image 生成的海报、插画很惊艳,却不知道从哪开始?
这是一份为零基础用户写的实操指南。不需要懂 CUDA、不用查报错日志、不碰命令行(除非你点一下鼠标右键)。你只需要一台具备 GPU 算力的云主机,和一点好奇心。
下面所有步骤按真实操作时的界面顺序编写,连按钮在哪、该点哪个标签页、弹窗里选什么,都标清楚。
1. 镜像部署:3 步完成
Qwen-Image-2512-ComfyUI 镜像是一个'开箱即用'的完整环境,它已经预装了:
- ComfyUI 最新稳定版(含全部常用节点)
- Qwen-Image 2512 官方模型(含基础权重、VAE、Tokenizer)
- 所有必需依赖(PyTorch + CUDA + xformers 优化)
- 内置工作流(无需手动加载 JSON)
你不需要自己下载模型、不用配置路径、不用改任何配置文件。
1.1 创建算力实例
登录你的 AI 算力平台,选择:
- 显卡:NVIDIA RTX 4090D(单卡足够)
- 系统镜像:选择 'Qwen-Image-2512-ComfyUI'(注意名称完全一致,带版本号)
- 硬盘:建议≥100GB(镜像本身约 68GB,留出缓存和生成图空间)
- 启动后等待 2–3 分钟,直到状态变为'运行中'
小贴士:4090D 显存 24GB,完美支持 Qwen-Image 2512 的 FP16 推理,出图快、显存不爆、细节稳。如果你只有 3090 或 4090,也能跑,但建议关闭'高分辨率修复'选项。
1.2 一键启动服务
进入实例终端(Web SSH 或远程桌面),执行以下命令:
cd /root && ./start.sh
你会看到一串绿色文字滚动(这是 ComfyUI 启动日志),最后出现类似这样的提示:
[INFO] ComfyUI server started on http://127.0.0.1:8188 [INFO] Web UI is available at http://<你的实例 IP>:8188
这说明服务已就绪。不用记 IP,也不用复制链接——下一秒你就用得上。
1.3 打开网页界面:真正的'点开即用'
回到算力平台控制台页面,找到【我的算力】列表,点击你刚启动的实例右侧的 'ComfyUI 网页' 按钮(不是'VNC'、不是'SSH',是明确写着'ComfyUI 网页'的那个)。
浏览器会自动打开新标签页,加载一个深色界面——这就是 ComfyUI。 它没有登录页、没有广告、没有跳转,直接就是工作区。
注意:如果打不开,请确认浏览器没拦截弹窗;若提示'连接被拒绝',请返回终端再执行一次
./start.sh(脚本有守护机制,重复执行无害)。
2. 第一张图:3 次点击,10 秒出图
现在你面对的是一个全黑背景、左侧空荡荡的工作流面板、中间大片空白画布的界面。别慌——这不是 bug,是 ComfyUI 的默认状态。
我们跳过所有'加载模型''连接节点''设置采样器'的复杂环节,直接用镜像自带的预置工作流。
2.1 加载内置工作流(1 次点击)
在左侧工具栏,找到并点击 '工作流' 标签页(图标是两个重叠方块)。 向下滚动,你会看到一组已命名的工作流,其中第一个就是:
Qwen-Image-2512-Base-Workflow
点击它,右侧画布立刻填满一整套节点:从'Load Checkpoint'到'KSampler',再到'Save Image',全部连好、参数设好、模型路径正确。
这个工作流已预设:
- 使用 Qwen-Image 2512 主模型(
qwen2512_fp16.safetensors) - 分辨率:1024×1024(兼顾质量与速度)
- 步数:25(效果与速度平衡点)
- CFG 值:6.0(不过曝、不发散)
- 采样器:DPM++ 2M Karras(Qwen-Image 实测最稳)
你完全不需要修改任何参数,就能得到高质量输出。
2.2 输入提示词(2 次点击 + 打字)
找画布中名为 'CLIP Text Encode (Prompt)' 的节点(黄色,带'T'图标),双击它,弹出编辑框。
在 'text' 输入框里,输入一句你想画的内容,比如:
a cyberpunk street at night, neon signs, rain-wet pavement, cinematic lighting, ultra-detailed
(中文也完全支持,例如:'一只戴墨镜的橘猫坐在太空舱里,赛博朋克风格,高清写实')
输入完,直接关掉弹窗。不用点'确定',不用保存——ComfyUI 实时监听。
2.3 点击生成(1 次点击,见证奇迹)
在顶部菜单栏,找到并点击 'Queue Prompt' 按钮(蓝色,位于右上角,图标是播放三角形 ▶)。
你会立刻看到:
- 左下角出现排队提示:'Queued prompt #1'
- 画布中'KSampler'节点变亮,显示'Running…'
- 几秒后,'Save Image'节点下方出现一张缩略图——你的第一张 Qwen-Image 作品诞生了!
实测耗时:4090D 单卡,1024×1024 尺寸,平均 8.2 秒/张。比很多 WebUI 快 30%,且首帧即成图,无预热延迟。
3. 调出更好效果:3 个小白必调参数
刚才那张图已经不错,但 Qwen-Image 2512 的真正实力,藏在几个关键开关里。它们都在同一个地方,调起来比换手机壁纸还简单。
3.1 提升细节清晰度:打开'高分辨率修复'
在画布中找到 'Upscale Model' 节点(紫色,名字含'upscale'),双击它。
把 'enabled' 勾选框打上勾 其余保持默认(使用 ESRGAN_4x-FullV2 模型,专为 Qwen-Image 优化)
→ 下次生成时,会在基础图基础上自动超分,细节锐利度提升明显,尤其对建筑纹理、毛发、文字等小元素更友好。
3.2 让画面更可控:启用'图像引导'
Qwen-Image 2512 原生支持图像输入引导(Image Guidance),无需额外 ControlNet。
找节点 'Qwen Image Load Image'(浅蓝,带图片图标),双击它。
点击 'Choose File',上传一张参考图(比如你想画'这张照片里的沙发,换成金色') 然后在旁边的 'strength' 滑块,拉到 0.4–0.6 之间(太低没效果,太高失真)
→ 这样生成的图,构图、视角、主体位置会高度贴近你的参考图,适合电商换背景、设计稿迭代等场景。
3.3 避免常见翻车:关掉'随机种子'
在 'KSampler' 节点(红色,名字含'Sampler')里,找到 'seed' 参数。
把默认的 -1 改成一个固定数字,比如 12345
(这样每次点'Queue Prompt',只要提示词不变,出图就完全一致,方便反复微调)
这 3 个操作加起来不到 20 秒,但能让你的出图质量从'能看'跃升到'可用'。
4. 进阶不踩坑:3 类常见问题速查手册
即使是最简流程,新手也会遇到几个高频疑问。这里不列报错代码,只说'你看到了什么 → 该怎么做'。
4.1 问题:点'Queue Prompt'没反应,左下角没排队提示
可能原因与解法:
- 浏览器卡住了:刷新页面(Ctrl+R),重新点'ComfyUI 网页'按钮
- 服务崩了:回终端执行
ps aux | grep comfy,若无进程,再运行./start.sh - 显存占满:关闭其他占用 GPU 的程序(如 Jupyter、Stable Diffusion WebUI),或重启实例
4.2 问题:生成图模糊/发灰/结构错乱
先检查这三项:
- 提示词是否太抽象?换成具体名词 + 质感词(如把'漂亮风景'改成'阿尔卑斯山雪峰,冰川蓝,晨光,f/16 景深')
- 'KSampler'里的步数是否低于 15?建议设为 20–30
- 是否误启用了

