Qwen-Image-2512 搭建 AI 绘画工作流指南
本指南介绍如何在 ComfyUI 中使用 Qwen-Image-2512 模型搭建 AI 绘画工作流。无需懂 Python、不用配环境变量,只要会点鼠标、有带 4090D 显卡的机器(或租用云算力),就能完成部署、启动、选工作流、输提示词并生成高清图。
1. 镜像部署与一键启动
Qwen-Image-2512-ComfyUI 是预置镜像,已集成阿里通义实验室最新发布的 Qwen-Image 2512 版本模型、完整 ComfyUI 运行环境、常用 ControlNet 支持包及内置工作流。无需手动下载模型、不用配置依赖、不碰命令行——真正的开箱即用。
1.1 部署前确认事项
- 硬件要求:单张 NVIDIA RTX 4090D 显卡(显存≥24GB)即可流畅运行;若使用云算力,请选择'4090D 单卡'规格实例
- 系统环境:镜像已预装 Ubuntu 22.04 + CUDA 12.1 + PyTorch 2.3,无需额外安装
- 存储空间:镜像体积约 18GB,建议预留至少 30GB 空闲磁盘空间(用于缓存和生成图)
注意:该镜像不兼容 A 卡、Mac 芯片、低显存显卡(如 3060 12G 以下)。若你用的是其他显卡,请勿强行部署,否则大概率卡在模型加载阶段。
1.2 四步完成部署与启动
按顺序执行以下操作,每一步都有明确反馈:
- 进入镜像管理平台,搜索'Qwen-Image-2512-ComfyUI',点击【立即部署】
- 选择算力规格(务必选'4090D 单卡'),设置实例名称(如
qwen-paint-01),点击【创建实例】
运行一键启动脚本(注意是数字'1',不是字母'l'):
bash "1 键启动.sh"
实例启动后,进入控制台,切换到 /root 目录:
cd /root
脚本执行时会自动:
- 检查 CUDA 与 PyTorch 版本兼容性
- 启动 ComfyUI 服务(端口默认
8188) - 输出访问地址(形如
http://xxx.xxx.xxx.xxx:8188)
成功标志:终端最后出现 ComfyUI is running on http://0.0.0.0:8188,且网页可正常打开。
小贴士:如果浏览器打不开页面,请检查云服务商安全组是否放行
8188端口;本地部署用户请确认防火墙未拦截。
2. 网页界面初识与内置工作流调用
ComfyUI 不像 WebUI 那样点点就出图,它靠'节点连线'驱动流程。但别怕——这个镜像已为你准备好开箱即用的内置工作流,你只需要点几下,就能直接生成图片。
2.1 登录 ComfyUI 主界面
- 在浏览器中打开上一步获得的地址(如
http://123.45.67.89:8188) - 页面加载完成后,你会看到左侧一栏菜单:
Queue(队列)、Manager(管理)、Load(加载)、Save(保存)等 - 重点看左上角'ComfyUI'Logo 右侧的'工作流'按钮(图标为两个重叠方块)→ 点击它
此时页面左侧会弹出一个文件树面板,显示所有预置工作流。
2.2 找到并加载 Qwen-Image 专用工作流
镜像内置了三类工作流,全部放在 /root/ComfyUI/custom_nodes/Qwen-Image-Workflows/ 目录下:
| 工作流名称 | 适用场景 | 特点 |
|---|---|---|
Qwen-Image-Base.json | 纯文生图入门 | 最简结构,仅含提示词 + 采样器 + 模型加载,适合测试基础效果 |
Qwen-Image-ControlNet-Canny.json | 线稿控制绘图 | 支持上传手绘草图或自动生成 Canny 边缘图,精准控制构图 |
Qwen-Image-ControlNet-Union.json | 多模式自由切换 | 集成 InstantX ControlNet Union 模型,一键切换 canny/depth/openpose/softedge 四种控制方式 |
小白首推:直接双击打开 Qwen-Image-Base.json ——这是你今天要跑通的第一张图的起点。
提示:工作流加载后,中间画布会自动显示节点图。若节点重叠或位置混乱,按
Ctrl+Shift+R(Windows/Linux)或Cmd+Shift+R(Mac)一键重排布局。
3. 基础文生图:三分钟生成你的第一张图
我们以 Qwen-Image-Base.json 为例,手把手走完从输入到出图的全流程。所有操作都在网页内完成,无需改代码、不碰配置文件。
3.1 关键节点说明(只看这 4 个就够了)
| 节点名称 | 位置 | 作用 | 小白怎么操作 |
|---|---|---|---|
CLIP Text Encode (Prompt) | 左侧中部 | 输入正向提示词(你想要的画面) | 双击节点 → 在 text 框里输入中文描述,如'一只橘猫坐在窗台上,阳光洒在毛发上,写实风格,高清细节' |
CLIP Text Encode (Negative Prompt) | 左侧偏下 | 输入反向提示词(你不想要的东西) | 双击 → 输入'模糊、畸变、多手指、文字、水印、低质量'(镜像已预填,可直接用) |
KSampler | 中部偏右 | 控制出图质量与速度 | 保持默认值即可:steps=20, cfg=7, sampler=euler, scheduler=normal |
Save Image | 右下角 | 保存生成的图片 | 不用改!它已自动连接输出,生成后会存到 /root/ComfyUI/output/ |
重要提醒:Qwen-Image 对中文提示词支持极好,直接写中文,不用翻译成英文。比如写'水墨山水画'比写'ink painting landscape'效果更稳。
3.2 实操:生成一张高清橘猫图
- 点击顶部菜单栏的
Queue→Queue Prompt(或直接按Ctrl+Enter) - 等待右下角状态栏显示
Running...→Done(通常需 45–90 秒,4090D 单卡) - 刷新
/root/ComfyUI/output/目录(或点击左侧Manager→Browse→output),找到最新生成的 PNG 文件
双击 CLIP Text Encode (Negative Prompt) 节点,确认内容为(或补充):
模糊、畸变、多肢体、多余爪子、文字、logo、水印、低分辨率、JPEG 伪影、3D 渲染感
双击 CLIP Text Encode (Prompt) 节点,在文本框中输入:
一只胖橘猫慵懒地趴在老式木窗台上,窗外是春日樱花,阳光透过玻璃在猫毛上形成光斑,毛发根根分明,胶片质感,8k 高清
你刚刚完成了一次完整的 Qwen-Image 文生图流程。没有报错、没有黑图、没有反复调试——这就是预置镜像的价值。
4. 进阶控图:用 ControlNet 让画面听你指挥
纯文生图很酷,但有时你想'指定猫坐的位置''让窗台角度更斜一点''保留手绘草图的线条感'——这时候就得请出 ControlNet。镜像已集成三种主流方案,我们只讲最易上手、效果最稳、适配性最强的一种。
4.1 推荐方案:InstantX Qwen-Image-ControlNet-Union
为什么选它?
- 单一模型文件(
qwen_image_controlnet_union.safetensors),装一次就搞定全部控制类型 - 预处理器集成在 Aux 节点中,点选即用,不用手动找 canny/depth 模型
- 官方工作流已优化,节点少、逻辑清、容错高
- ❌ 不推荐 DiffSynth 的 Model Patch 方案(需手动加载多个 patch,新手易配错路径)
4.2 三步启用 ControlNet 控图
以'用线稿控制橘猫姿势'为例:
- 加载工作流:在左侧工作流面板中,双击打开
Qwen-Image-ControlNet-Union.json - 上传参考图:
- 点击画布中
Load Image节点 →Choose File→ 上传一张手绘草图(或用在线工具生成 Canny 图) - 或直接使用内置预处理器:找到
Preprocessor节点 → 点击下拉菜单 → 选canny→ 再点Run Preprocessor(自动生成边缘图)
- 点击画布中
- 选择控制类型 & 出图:
- 找到
ControlNetApplyAdvanced节点 → 点击control_net_name下拉框 → 选qwen_image_controlnet_union.safetensors - 在
control_mode中选balanced(平衡模式,兼顾构图与细节) - 点击
Queue Prompt,等待出图
- 找到
🖼 效果对比小实验:用同样提示词'橘猫坐窗台',纯文生图可能猫头偏大或窗台比例失真;加入 Canny 线稿后,猫的轮廓、窗台边缘、光影走向会严格贴合你的草图——这才是真正'可控'的 AI 绘画。
5. 常见问题与避坑指南(小白必读)
这些坑,我全替你踩过了。照着做,省下至少两小时 debug 时间。
5.1 出图失败?先看这三点
| 现象 | 原因 | 解决方法 |
|---|---|---|
点击 Queue Prompt 后无反应,状态栏一直显示 Queued | ComfyUI 服务未完全启动或端口冲突 | 重新运行 /root/1 键启动.sh,确认终端末尾出现 Starting server 字样 |
| 生成图是纯黑/纯灰/严重色偏 | 图像尺寸过大(>1024×1024)导致显存溢出 | 在工作流中找到 Scale Image 节点 → 将 width 和 height 改为 896(Qwen-Image 最佳分辨率) |
| 提示词写了中文但生成图完全不相关 | 使用了旧版 ComfyUI 内核(<2025.08.20) | 进入 /root/ComfyUI 目录 → 运行 git pull && git checkout main && python main.py --skip-prompt 更新 |
5.2 怎么让图更精细?三个实用技巧
- 技巧 1:微调 CFG 值
KSampler节点中的cfg(Classifier-Free Guidance)控制提示词遵循强度。默认7适合通用场景;想更贴合描述,可调至9–10;想保留更多创意发散,可降至5–6。 - 技巧 2:加'高清修复'节点
镜像已内置Ultimate SD Upscale节点。将Save Image的输入端,改为接Ultimate SD Upscale的输出 → 设置upscale_by=1.5→ 再出图,细节锐度提升明显。 - 技巧 3:用负向提示词'压住'常见缺陷
Qwen-Image 偶有生成多余肢体或结构错乱,可在反向提示词末尾追加:
extra limbs, disfigured hands, floating objects, broken anatomy, extra fingers
5.3 模型与工作流存放位置(方便你后续扩展)
所有资源均按标准 ComfyUI 结构组织,路径清晰可查:
| 类型 | 存放路径 | 说明 |
|---|---|---|
| Qwen-Image 主模型 | /root/ComfyUI/models/checkpoints/ | 文件名含 qwen_image_2512 |
| ControlNet 模型 | /root/ComfyUI/models/controlnet/ | InstantX 方案在此,DiffSynth 方案在 model_patches/ 和 loras/ |
| 内置工作流 | /root/ComfyUI/custom_nodes/Qwen-Image-Workflows/ | 所有 .json 文件,可直接复制到其他 ComfyUI 环境 |
| 生成图保存位置 | /root/ComfyUI/output/ | 每次生成自动按日期建子文件夹 |
进阶提示:想换其他风格?把工作流中
CheckpointLoaderSimple节点的模型名,换成/root/ComfyUI/models/checkpoints/下其他.safetensors文件名即可,无需重启服务。
6. 总结:你已经掌握了 Qwen-Image 工作流的核心能力
回顾一下,今天我们完成了:
- 部署零门槛:一行命令启动,4090D 单卡即跑
- 界面不迷路:认准'工作流'按钮,三类预置流程各司其职
- 出图三分钟:中文提示词直输,反向提示词预设,KSampler 参数不动也能出好图
- 控图有抓手:InstantX ControlNet Union 方案,点选即用,线稿/深度/姿态全支持
- 避坑有清单:黑图、卡队列、色偏等问题,对应解法已验证有效
这不是终点,而是你 AI 绘画工作流的起点。接下来你可以:
→ 把 Qwen-Image-ControlNet-Union.json 复制到自己电脑的 ComfyUI 里,离线使用;
→ 用 /root/ComfyUI/custom_nodes/Qwen-Image-Workflows/ 里的工作流为模板,定制电商海报、插画分镜、设计草图;
→ 结合镜像中已安装的 Impact Pack 节点,实现自动人脸检测 + 局部重绘;
→ 甚至把 Qwen-Image 接入你的企业知识库,生成符合品牌调性的营销图。
技术不难,难的是有人帮你把路铺平。现在,路已通,图已出,剩下的,就是你拿起提示词,开始创作。

