Qwen-Image 2512 基于 ComfyUI 镜像快速上手指南
本地部署 ComfyUI 常因环境依赖和模型路径问题卡住,导致无法出图。Qwen-Image 生成的图像质量虽高,但配置门槛让新手望而却步。本指南专注于实操,无需配置复杂环境,只需一台支持 4090D 显卡的云端算力实例,即可在浏览器中完成绘图。
1. 镜像部署:3 步完成
Qwen-Image-2512-ComfyUI 镜像是一个'开箱即用'的完整环境,已预装 ComfyUI 最新稳定版、Qwen-Image 2512 官方模型及所有必需依赖。你不需要自己下载模型或修改配置文件。
1.1 创建算力实例
登录主流 AI 算力平台,选择 NVIDIA RTX 4090D(单卡足够),系统镜像选择'Qwen-Image-2512-ComfyUI',硬盘建议≥100GB。启动后等待状态变为'运行中'。
小贴士:4090D 显存 24GB,完美支持 Qwen-Image 2512 的 FP16 推理。若使用 3090 或 4090,建议关闭'高分辨率修复'选项。
1.2 一键启动服务
进入实例终端,执行以下命令:
cd /root && ./1 键启动.sh
看到绿色日志滚动,最后提示 Web UI 地址即表示就绪。
1.3 打开网页界面
回到控制台,点击实例右侧的'ComfyUI 网页'按钮。浏览器会自动加载深色工作区界面,无登录页和广告。
2. 第一张图:3 次点击,10 秒出图
面对默认空白画布,直接使用镜像自带的预置工作流。
2.1 加载内置工作流
左侧工具栏点击'工作流'标签页,找到并点击 Qwen-Image-2512-Base-Workflow。右侧画布将自动填充节点,包括 Load Checkpoint、KSampler 和 Save Image。
该工作流已预设使用主模型、分辨率 1024×1024、步数 25、CFG 值 6.0 及 DPM++ 2M Karras 采样器。完全无需修改参数即可输出高质量结果。
2.2 输入提示词
双击名为'CLIP Text Encode (Prompt)'的黄色节点,在'text'输入框中输入内容。例如:
a cyberpunk street at night, neon signs, rain-wet pavement, cinematic lighting, ultra-detailed
中文同样支持,如:'一只戴墨镜的橘猫坐在太空舱里,赛博朋克风格,高清写实'。输入后直接关闭弹窗,ComfyUI 会实时监听。
2.3 点击生成
顶部菜单栏点击'Queue Prompt'按钮。左下角显示排队提示,画布中 KSampler 节点变亮。几秒后 Save Image 节点下方出现缩略图。
实测耗时:4090D 单卡,1024×1024 尺寸,平均 8.2 秒/张。
3. 调出更好效果:3 个小白必调参数
3.1 提升细节清晰度
找到'Upscale Model'节点,勾选'enabled'。其余保持默认,使用 ESRGAN_4x-FullV2 模型。下次生成时会自动超分,提升细节锐利度。
3.2 启用图像引导
Qwen-Image 2512 原生支持图像输入引导。找节点'Qwen Image Load Image',上传参考图,将'strength'滑块拉到 0.4–0.6 之间。构图和主体位置将高度贴近参考图。
3.3 固定随机种子
在'KSampler'节点中,将'seed'参数从 -1 改为固定数字,如 12345。这样只要提示词不变,出图就完全一致,方便微调。

