Qwen-Image 2512 基于 ComfyUI 镜像快速上手指南

本地部署 ComfyUI 常因环境依赖和模型路径问题卡住，导致无法出图。Qwen-Image 生成的图像质量虽高，但配置门槛让新手望而却步。本指南专注于实操，无需配置复杂环境，只需一台支持 4090D 显卡的云端算力实例，即可在浏览器中完成绘图。

1. 镜像部署：3 步完成

Qwen-Image-2512-ComfyUI 镜像是一个'开箱即用'的完整环境，已预装 ComfyUI 最新稳定版、Qwen-Image 2512 官方模型及所有必需依赖。你不需要自己下载模型或修改配置文件。

1.1 创建算力实例

登录主流 AI 算力平台，选择 NVIDIA RTX 4090D（单卡足够），系统镜像选择'Qwen-Image-2512-ComfyUI'，硬盘建议≥100GB。启动后等待状态变为'运行中'。

小贴士：4090D 显存 24GB，完美支持 Qwen-Image 2512 的 FP16 推理。若使用 3090 或 4090，建议关闭'高分辨率修复'选项。

1.2 一键启动服务

进入实例终端，执行以下命令：

cd /root && ./1 键启动.sh

看到绿色日志滚动，最后提示 Web UI 地址即表示就绪。

1.3 打开网页界面

回到控制台，点击实例右侧的'ComfyUI 网页'按钮。浏览器会自动加载深色工作区界面，无登录页和广告。

2. 第一张图：3 次点击，10 秒出图

面对默认空白画布，直接使用镜像自带的预置工作流。

2.1 加载内置工作流

左侧工具栏点击'工作流'标签页，找到并点击 Qwen-Image-2512-Base-Workflow。右侧画布将自动填充节点，包括 Load Checkpoint、KSampler 和 Save Image。

该工作流已预设使用主模型、分辨率 1024×1024、步数 25、CFG 值 6.0 及 DPM++ 2M Karras 采样器。完全无需修改参数即可输出高质量结果。

2.2 输入提示词

双击名为'CLIP Text Encode (Prompt)'的黄色节点，在'text'输入框中输入内容。例如：

a cyberpunk street at night, neon signs, rain-wet pavement, cinematic lighting, ultra-detailed

中文同样支持，如：'一只戴墨镜的橘猫坐在太空舱里，赛博朋克风格，高清写实'。输入后直接关闭弹窗，ComfyUI 会实时监听。

2.3 点击生成

顶部菜单栏点击'Queue Prompt'按钮。左下角显示排队提示，画布中 KSampler 节点变亮。几秒后 Save Image 节点下方出现缩略图。

实测耗时：4090D 单卡，1024×1024 尺寸，平均 8.2 秒/张。

3. 调出更好效果：3 个小白必调参数

3.1 提升细节清晰度

找到'Upscale Model'节点，勾选'enabled'。其余保持默认，使用 ESRGAN_4x-FullV2 模型。下次生成时会自动超分，提升细节锐利度。

3.2 启用图像引导

Qwen-Image 2512 原生支持图像输入引导。找节点'Qwen Image Load Image'，上传参考图，将'strength'滑块拉到 0.4–0.6 之间。构图和主体位置将高度贴近参考图。

3.3 固定随机种子

在'KSampler'节点中，将'seed'参数从 -1 改为固定数字，如 12345。这样只要提示词不变，出图就完全一致，方便微调。

Qwen-Image 2512 基于 ComfyUI 镜像快速上手指南