Lychee-Rerank-MM 本地图文重排序部署教程
1. 为什么你需要这个重排序工具
在处理大量产品图、设计稿或活动照片时,快速找出最匹配某段文案的图片是常见痛点。例如写好小红书文案后需翻图库找配图,或在整理 AI 生成图时面对上百张输出难以判断哪张符合复杂描述。
传统做法靠人工比对或简单关键词匹配,但图片无文字索引,文本描述千变万化。lychee-rerank-mm 专为图文匹配打磨:不联网、不传图、不调 API,所有计算在本地 RTX 4090 显卡完成。输入一句话,上传一堆图,几秒内排出名次,每张图附带 0–10 分相关性打分。
它基于 Qwen2.5-VL 视觉语言理解能力,叠加精细化打分策略,针对 4090 显卡做 BF16 精度与显存调度优化。没有云服务依赖,没有账号注册,连 WiFi 关着也能跑。
2. 环境准备与一键部署
2.1 硬件与系统要求
本方案严格适配 NVIDIA RTX 4090(24GB 显存),其他显卡暂不保证效果:
- 必需:RTX 4090(驱动版本 ≥535,CUDA 12.1+)
- 推荐系统:Ubuntu 22.04 / Windows 11(WSL2 环境更稳定)
- Python 版本:3.10 或 3.11(不支持 3.12 及以上)
- 不支持:Mac M 系列芯片、AMD 显卡、笔记本低功耗模式下的 4090 移动版
提示:部署前请确认
nvidia-smi能正常显示 GPU 状态,且torch已安装支持 CUDA 的版本(推荐使用pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu121)
2.2 三步完成本地部署
整个过程无需编译、不改配置、不碰 Docker,纯 Python 生态一键拉起:
# 第一步:创建独立环境(推荐,避免包冲突)
python3 -m venv lychee-env
source lychee-env/bin/activate # Linux/macOS
# lychee-env\Scripts\activate # Windows
# 第二步:安装核心依赖(含 Qwen2.5-VL 官方包 + Lychee 专用重排序模块)
pip install --upgrade pip
pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu121
pip install transformers accelerate sentence-transformers pillow streamlit gradio
# 第三步:安装 Lychee-rerank-mm 主程序(含预置模型权重与 UI)
git clone https://github.com/lychee-ai/lychee-rerank-mm.git
cd lychee-rerank-mm
pip install -e .
注意:首次运行会自动下载约 3.2GB 的 Qwen2.5-VL-7B-Instruct 模型权重(含视觉编码器),下载位置默认为
~/.cache/huggingface/hub/。如已存在同名模型,将跳过下载直接加载。
2.3 启动 Web 界面
部署完成后,直接运行启动命令:
streamlit run app.py --server.port=8501 --server.address=127.0.0.1
终端将输出类似提示:
You can now view your Streamlit app in your browser. Local URL: http://localhost: Network URL: http:.:

