Qwen-Image-2512 V2 模型特性与 ComfyUI/WebUI 部署指南
Qwen-Image-2512 是 Qwen-Image 文生图基础模型的 12 月更新版本,这是一个最新的文本生成图像模型,特点是画面更真实、细节更精致,提升了人物与自然细节的真实感,适合在创意设计、教育展示、内容生产等领域使用。
今天分享的 Qwen-Image-2512 V2 版基于阿里最新开源的 Qwen-Image-2512 的 FP8 量化版(同时支持 BF16),支持消费级显卡最低 12G 显存流畅运行,支持更适合小白操作的 WebUI 模式和专业选手的 ComfyUI 两种模式。相比较旧版本,V2 版因使用精度更高的 FP8 模型,所以在生成效果上更好,同时对硬件的要求也更高,大家根据需要选择适合自己的版本。
模型特点
- 更真实的人物表现:相比旧版本,人物的面部细节、表情和环境都更自然,不再有明显的'AI 感'。
- 更精细的自然细节:风景、动物毛发、水流等元素渲染更逼真,层次感更强。
- 更准确的文字渲染:在生成带文字的图像(如海报、PPT)时,排版和字体更清晰,图文融合更好。
- 更强的整体性能:在超过一万次盲测中,表现优于大多数开源模型,甚至接近闭源顶级模型。
应用领域
- 创意设计:用于插画、广告、海报、角色设定。
- 教育与培训:生成教学用图、科普展示、信息图表。
- 内容生产:辅助媒体、社交平台快速生成高质量配图。
- 虚拟场景构建:游戏、美术、影视前期概念设计。
使用教程
(建议 N 卡,显存 12G 起,支持 50 系显卡)
整合包包含所需所有节点,下载主程序和模型(ComfyUI 文件夹),解压主程序后,将 ComfyUI 文件夹移动到主程序目录下即可。
支持自定义模型切换,模型下载,显卡≥16G 显存的用户,可以使用更高精度的 BF16 模型,生成效果最佳。
WebUI
启动后,输入提示词,设置参数,生成即可。
ComfyUI 工作流
双击启动,浏览器输入 http://127.0.0.1:8188/ 进入页面后,点击左侧的工作流程,选择对应的工作流,如需切换模型,UNET 加载器切换自己需要的模型。输入提示词,设置参数,最后运行即可。
支持 LoRA 扩展,目前少有支持 Qwen-Image-2512 的 LoRA 模型,WebUI 和 ComfyUI 都留有 LoRA 支持,后期有对应 LoRA 模型,可以直接使用。
软件目录结构
📂 qwen-image-package/
├── 📂 ComfyUI/
│ ├── 📂 models/
│ │ ├── 📂 diffusion_models/
│ │ │ └── qwen_image_2512_fp8_e4m3fn.safetensors
│ │ ├── 📂 text_encoders/
│ │ │ └── qwen_2.5_vl_7b_fp8_scaled.safetensors
│ │ └── 📂 loras/
│ │ └── Qwen-Image-2512-Lightning-4steps-V1.0-bf16.safetensors
├── 📂 ...


