项目概述
WuliArt Qwen-Image Turbo 是一个专为个人 GPU 用户设计的轻量级文本生成图像系统。该项目基于阿里通义千问的 Qwen-Image-2512 模型,并融合了 Wuli-Art 专属的 Turbo LoRA 微调权重,让普通用户也能在本地设备上享受高质量的文生图体验。
这套系统的核心优势在于对硬件要求友好,无需昂贵的专业显卡即可运行。无论是创作者、设计师,还是对 AI 图像生成感兴趣的爱好者,都能快速上手。
核心优势
稳定生成不黑图
传统文生图模型常遇到生成过程中出现黑图或异常图像的问题。WuliArt Qwen-Image Turbo 通过 BFloat16 精度支持彻底解决了这一痛点。RTX 4090 等显卡原生支持这种精度,让生成过程更加稳定可靠。
极速生成体验
相比传统模型需要几十步推理,本系统仅需 4 步 就能生成高清图像。速度提升达到 5-10 倍,大幅减少等待时间。
显存优化出色
系统集成了多重显存优化技术,包括 VAE 分块编码和解码、顺序 CPU 显存卸载以及可扩展显存段管理。这些优化使得 24G 显存的显卡就能流畅运行,无需追求大显存的专业卡。
高质量图像输出
默认生成 1024×1024 分辨率的高清图像,输出格式为 JPEG 且保持 95% 的高画质。在保证文件大小合理的同时,提供了出色的视觉效果。
灵活扩展能力
系统预留了 LoRA 权重独立目录,支持快速替换自定义的微调权重。这意味着你可以根据自己的需求,轻松扩展不同风格的图像生成能力。
环境准备与安装
系统要求
要运行 WuliArt Qwen-Image Turbo,你的电脑需满足以下配置:
- 操作系统:Linux 或 Windows
- 显卡:NVIDIA 显卡,显存建议 24G 或以上(推荐 RTX 4090)
- Python 版本:3.8 或更高
- CUDA 版本:11.7 或更高
快速安装步骤
安装过程非常简单,只需几个命令即可完成:
# 克隆项目代码
git clone https://github.com/wuli-art/qwen-image-turbo.git
cd qwen-image-turbo
# 创建 Python 虚拟环境
python -m venv venv
# 激活虚拟环境
# Linux/Mac
source venv/bin/activate
# Windows
venv\Scripts\activate
# 安装依赖包
pip install -r requirements.txt
# 下载模型权重(如需手动下载)
# 请按照项目文档说明下载并放置到指定目录
一键启动服务
安装完成后,使用以下命令启动服务:
python app.py --port 7860 --share
服务启动后,终端会显示类似这样的输出:
Running on local URL: http://127.0.0.1:7860
Running on public URL: https://xxxxxx.gradio.live

