
Qwen-Image-2512 是通义千问团队推出的最新文生图基础模型,画面更真实、细节更精致,显著提升了人物与自然场景的渲染质量。该版本适合创意设计、教育展示及内容生产等场景。
本次分享的 Qwen-Image-2512 V2 版整合包基于阿里开源模型的 FP8 量化版本(同时支持 BF16),针对消费级显卡进行了优化,最低 12G 显存即可流畅运行。整合包同时提供了适合新手的 WebUI 模式和面向专业用户的 ComfyUI 模式,用户可根据硬件条件选择精度更高的 BF16 模型以获得最佳生成效果。
核心特性
相比旧版本,V2 版在多个维度有明显提升:
- 更真实的人物表现:面部细节、表情和环境光影更自然,减少了明显的'AI 感'。
- 精细的自然细节:风景、动物毛发、水流等元素渲染逼真,层次感更强。
- 准确的文字渲染:生成海报或 PPT 配图时,排版和字体清晰,图文融合度更高。
- 整体性能增强:在大量盲测中表现优异,接近闭源顶级模型水平。
部署与使用
建议配置 NVIDIA 显卡,显存 12G 起,支持 50 系显卡。解压主程序后,将 ComfyUI 文件夹移动至主程序目录下即可启动。
WebUI 模式
启动程序后,直接在界面输入提示词并调整参数即可生成图像。支持自定义模型切换,若显卡显存大于等于 16G,可加载更高精度的 BF16 模型。
ComfyUI 工作流
双击启动程序,浏览器访问 http://127.0.0.1:8188/ 进入页面。点击左侧'工作流程'选择对应模板,如需切换模型,可在 UNET 加载器中选择目标文件。输入提示词设置参数后运行即可。
目前已有少量支持 Qwen-Image-2512 的 LoRA 模型,WebUI 和 ComfyUI 均预留了扩展接口,后续有新模型可直接加载使用。
目录结构参考
📂 ComfyUI/
├── 📂 models/
│ ├── 📂 diffusion_models/
│ │ └── qwen_image_2512_fp8_e4m3fn.safetensors
│ ├── 📂 text_encoders/
│ │ └── qwen_2.5_vl_7b_fp8_scaled.safetensors
│ └── 📂 loras/
│ └── Qwen-Image-2512-Lightning-4steps-V1.0-bf16.safetensors
📂 project_root/
└── ... (其他依赖文件)
模型资源可从官方仓库获取,确保下载路径正确以便程序识别。


