Lychee-Rerank-MM 本地部署教程:无网依赖图文重排序
1. 为什么你需要这个重排序工具
你有没有遇到过这样的场景:手头有一堆产品图、设计稿或活动照片,想快速找出最匹配某段文案的那几张?比如写好了一条小红书文案'阳光洒在复古咖啡馆的木质吧台上,一杯拿铁冒着热气',却要一张张翻图库找最贴切的配图;又或者在整理 AI 生成图时,面对上百张输出,靠肉眼判断哪张最符合'赛博朋克风格 + 穿银色机甲的女性 + 雨夜霓虹街道'这种复杂描述,耗时又容易出错。
传统做法要么靠人工反复比对,要么用简单关键词匹配——但图片没有文字索引,文本描述又千变万化。这时候,一个能真正'看懂图 + 读懂文'的本地化工具就变得特别实在。
lychee-rerank-mm 就是为此而生:它不联网、不传图、不调 API,所有计算都在你自己的 RTX 4090 显卡上完成。输入一句话,上传一堆图,点一下按钮,几秒内就能给你排出名次,每张图都附带 0–10 分的相关性打分,第一名还自带高亮边框——就像给你的图库装了个'多模态直觉'。
它不是通用大模型套壳,而是专为图文匹配打磨的轻量级重排序引擎:基于 Qwen2.5-VL 视觉语言理解能力,叠加 Lychee-rerank-mm 的精细化打分策略,再针对 4090 显卡做 BF16 精度与显存调度双重优化。没有云服务依赖,没有账号注册,没有网络权限请求,连 WiFi 关着也能跑。
如果你正需要一个安静、可控、响应快、结果准的本地图文筛选助手,这篇教程就是为你写的。
2. 环境准备与一键部署
2.1 硬件与系统要求
本方案严格适配 NVIDIA RTX 4090(24GB 显存),其他显卡暂不保证效果:
- 必需:RTX 4090(驱动版本 ≥535,CUDA 12.1+)
- 推荐系统:Ubuntu 22.04 / Windows 11(WSL2 环境更稳定)
- Python 版本:3.10 或 3.11(不支持 3.12 及以上)
- 不支持:Mac M 系列芯片、AMD 显卡、笔记本低功耗模式下的 4090 移动版
提示:部署前请确认
nvidia-smi能正常显示 GPU 状态,且torch已安装支持 CUDA 的版本(推荐使用pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu121)
2.2 三步完成本地部署
整个过程无需编译、不改配置、不碰 Docker,纯 Python 生态一键拉起:
# 第一步:创建独立环境(推荐,避免包冲突)
python3 -m venv lychee-env
source lychee-env/bin/activate # Linux/macOS
# lychee-env\Scripts\activate # Windows
# 第二步:安装核心依赖(含 Qwen2.5-VL 官方包 + Lychee 专用重排序模块)
pip install --upgrade pip
pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu121
pip install transformers accelerate sentence-transformers pillow streamlit gradio
# 第三步:安装 Lychee-rerank-mm 主程序(含预置模型权重与 UI)
git clone https://github.com/lychee-ai/lychee-rerank-mm.git
cd lychee-rerank-mm
pip install -e .
注意:首次运行会自动下载约 3.2GB 的 Qwen2.5-VL-7B-Instruct 模型权重(含视觉编码器),下载位置默认为
~/.cache/huggingface/hub/。如已存在同名模型,将跳过下载直接加载。
2.3 启动 Web 界面
部署完成后,直接运行启动命令:

