Qwen-Image-2512 V2 版
Qwen-Image-2512 是 Qwen-Image 文生图基础模型的 12 月更新版本,这是一个最新的文本生成图像模型,特点是画面更真实、细节更精致,提升了人物与自然细节的真实感,适合在创意设计、教育展示、内容生产等领域使用。
模型特点
- 更真实的人物表现:相比旧版本,人物的面部细节、表情和环境都更自然,不再有明显的'AI 感'。
- 更精细的自然细节:风景、动物毛发、水流等元素渲染更逼真,层次感更强。
- 更准确的文字渲染:在生成带文字的图像(如海报、PPT)时,排版和字体更清晰,图文融合更好。
- 更强的整体性能:在超过一万次盲测中,表现优于大多数开源模型,甚至接近闭源顶级模型。
应用领域
- 创意设计:用于插画、广告、海报、角色设定。
- 教育与培训:生成教学用图、科普展示、信息图表。
- 内容生产:辅助媒体、社交平台快速生成高质量配图。
- 虚拟场景构建:游戏、美术、影视前期概念设计。
使用教程
整合包包含所需所有节点,下载主程序和模型(ComfyUI 文件夹),解压主程序一键包,将 ComfyUI 文件夹移动到主程序目录下即可。
环境要求
建议 NVIDIA 显卡,显存 12GB 起。FP8 量化版支持消费级显卡流畅运行,BF16 精度更高但需要更大显存(≥16G)。
WebUI 模式
启动后,输入提示词,设置参数,生成即可。支持自定义模型切换。
ComfyUI 工作流
双击启动,浏览器访问 http://127.0.0.1:8188/ 进入页面后,点击左侧的工作流程,选择对应的工作流。如需切换模型,在 UNET 加载器处切换自己需要的模型。输入提示词,设置参数,最后运行即可。
支持 LoRA 扩展,目前已有部分支持 Qwen-Image-2512 的 LoRA 模型,WebUI 和 ComfyUI 均留有 LoRA 支持接口,后期有对应 LoRA 模型可直接使用。
目录结构
📂 ComfyUI/
├── 📂 models/
│ ├── 📂 diffusion_models/
│ │ └── qwen_image_2512_fp8_e4m3fn.safetensors
│ ├── 📂 text_encoders/
│ │ └── qwen_2.5_vl_7b_fp8_scaled.safetensors
│ └── 📂 loras/
│ └── Qwen-Image-2512-Lightning-4steps-V1.0-bf16.safetensors
📂 deepface/
......


