Lychee-Rerank-MM 本地图文重排序部署教程 | 极客日志

PythonAI算法

Lychee-Rerank-MM 本地图文重排序部署教程

介绍 Lychee-Rerank-MM 的本地化部署教程，该工具基于 Qwen2.5-VL 视觉语言模型实现图文重排序。支持纯本地运行，无需联网，适配 NVIDIA RTX 4090 显卡。通过 Streamlit 提供 Web 界面，用户输入文本描述即可对上传图片进行相关性打分排序。文章涵盖环境准备、一键部署步骤、实操演示及关键技术解析（BF16 推理、显存调度）。旨在为开发者提供一个安静、可控、响应快的本地图文筛选助手，提升素材筛选效率。

念念不忘发布于 2026/4/5更新于 2026/7/1754 浏览

Lychee-Rerank-MM 本地图文重排序部署教程

1. 为什么你需要这个重排序工具

在处理大量产品图、设计稿或活动照片时，快速找出最匹配某段文案的图片是常见痛点。例如写好小红书文案后需翻图库找配图，或在整理 AI 生成图时面对上百张输出难以判断哪张符合复杂描述。

传统做法靠人工比对或简单关键词匹配，但图片无文字索引，文本描述千变万化。lychee-rerank-mm 专为图文匹配打磨：不联网、不传图、不调 API，所有计算在本地 RTX 4090 显卡完成。输入一句话，上传一堆图，几秒内排出名次，每张图附带 0–10 分相关性打分。

它基于 Qwen2.5-VL 视觉语言理解能力，叠加精细化打分策略，针对 4090 显卡做 BF16 精度与显存调度优化。没有云服务依赖，没有账号注册，连 WiFi 关着也能跑。

2. 环境准备与一键部署

2.1 硬件与系统要求

本方案严格适配 NVIDIA RTX 4090（24GB 显存），其他显卡暂不保证效果：

必需：RTX 4090（驱动版本 ≥535，CUDA 12.1+）
推荐系统：Ubuntu 22.04 / Windows 11（WSL2 环境更稳定）
Python 版本：3.10 或 3.11（不支持 3.12 及以上）
不支持：Mac M 系列芯片、AMD 显卡、笔记本低功耗模式下的 4090 移动版

提示：部署前请确认 nvidia-smi 能正常显示 GPU 状态，且 torch 已安装支持 CUDA 的版本（推荐使用 pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu121）

2.2 三步完成本地部署

整个过程无需编译、不改配置、不碰 Docker，纯 Python 生态一键拉起：

# 第一步：创建独立环境（推荐，避免包冲突）
python3 -m venv lychee-env
source lychee-env/bin/activate # Linux/macOS
# lychee-env\Scripts\activate # Windows

# 第二步：安装核心依赖（含 Qwen2.5-VL 官方包 + Lychee 专用重排序模块）
pip install --upgrade pip
pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu121
pip install transformers accelerate sentence-transformers pillow streamlit gradio

# 第三步：安装 Lychee-rerank-mm 主程序（含预置模型权重与 UI）
git clone https://github.com/lychee-ai/lychee-rerank-mm.git
cd lychee-rerank-mm
pip install -e .

注意：首次运行会自动下载约 3.2GB 的 Qwen2.5-VL-7B-Instruct 模型权重（含视觉编码器），下载位置默认为 ~/.cache/huggingface/hub/。如已存在同名模型，将跳过下载直接加载。

2.3 启动 Web 界面

部署完成后，直接运行启动命令：

streamlit run app.py --server.port=8501 --server.address=127.0.0.1

终端将输出类似提示：

You can now view your Streamlit app in your browser. Local URL: http://localhost: Network URL: http:.:

相关免费在线工具

加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
RSA密钥对生成器
生成新的随机RSA私钥和公钥pem证书。在线工具，RSA密钥对生成器在线工具，online
Mermaid 预览与可视化编辑
基于 Mermaid.js 实时预览流程图、时序图等图表，支持源码编辑与即时渲染。在线工具，Mermaid 预览与可视化编辑在线工具，online
随机西班牙地址生成器
随机生成西班牙地址（支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选），支持数量快捷选择、显示全部与下载。在线工具，随机西班牙地址生成器在线工具，online
Gemini 图片去水印
基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印，支持批量处理与下载。在线工具，Gemini 图片去水印在线工具，online
curl 转代码
解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。在线工具，curl 转代码在线工具，online

输入描述	模型是否正确理解	原因说明
`a red dress, standing on beach at sunset`	是	英文主谓宾结构清晰
`夕阳下的海滩，一条红色连衣裙`	是	中文主谓宾 + 场景状语完整
`red dress + 海滩 + 夕阳`	是	符号分隔仍能识别核心实体
`dress red beach sunset`（无冠词无介词）	是	Qwen2.5-VL 对碎片化输入有强泛化能力
`红色裙子？海边！夕阳！！`（标点混乱）	是	经过 Prompt 工程强化，忽略标点干扰

现象	可能原因	解决方法
点击按钮无反应，进度条不动	Streamlit 未正确绑定端口	检查终端是否报错 `OSError: [Errno 98] Address already in use`，换端口重试：`--server.port=8502`
上传图片后提示'无法读取格式'	图片含损坏元数据或非标准编码	用 Photoshop 或 GIMP 另存为'标准 PNG/JPG'，禁用'保存为 Web 所用格式'
所有图片分数都是 0 分	查询词含不可见 Unicode 字符（如零宽空格）	全选输入框内容 → 粘贴到记事本 → 重新复制粘贴回界面
第一名边框未显示	浏览器缩放比例非 100%	按 `Ctrl+0` 重置缩放，或检查浏览器控制台是否有 CSS 加载失败
处理速度明显变慢（>3 秒/张）	系统启用 Windows Defender 实时扫描	临时关闭或添加 `lychee-rerank-mm` 文件夹至排除列表

from lychee.rerank import Reranker

# 初始化（仅需一次，模型常驻显存）
reranker = Reranker(model_name="Qwen2.5-VL-7B-Instruct", device="cuda")

# 批量打分（返回 [(score, image_path), ...] 列表）
results = reranker.rank(
    query="一只柴犬在雪地里奔跑，吐着舌头，背景是松树",
    image_paths=["./img1.jpg", "./img2.png", "./img3.webp"]
)

# 按分数排序并打印
for score, path in sorted(results, key=lambda x: x[0], reverse=True):
    print(f"{path}: {score:.1f}分")

Lychee-Rerank-MM 本地图文重排序部署教程

Lychee-Rerank-MM 本地图文重排序部署教程

1. 为什么你需要这个重排序工具

2. 环境准备与一键部署

2.1 硬件与系统要求

2.2 三步完成本地部署

2.3 启动 Web 界面

更多推荐文章

相关免费在线工具

3. 实操演示：从输入到排序结果全流程

3.1 界面分区说明（极简但不简陋）

3.2 一次真实操作：用'秋日银杏大道'找最匹配图片

步骤 1：输入精准描述词

步骤 2：上传 6 张候选图

步骤 3：点击'开始重排序'

4. 关键技术实现解析（不讲原理，只说你怎么受益）

4.1 BF16 高精度推理：为什么 4090 上跑得又快又准

4.2 显存智能调度：批量处理不崩、不卡、不 OOM

4.3 中英文混合容错：不用纠结语序和语法

5. 实用技巧与避坑指南

5.1 让排序更准的 3 个描述心法

5.2 常见问题速查表

5.3 进阶用法：命令行直调，绕过 UI 批量处理

6. 总结：它不是另一个玩具模型，而是你图库的'多模态守门员'

更多推荐文章

相关免费在线工具

Lychee-Rerank-MM 本地图文重排序部署教程

Lychee-Rerank-MM 本地图文重排序部署教程

1. 为什么你需要这个重排序工具

2. 环境准备与一键部署

2.1 硬件与系统要求

2.2 三步完成本地部署

2.3 启动 Web 界面

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

3. 实操演示：从输入到排序结果全流程

3.1 界面分区说明（极简但不简陋）

3.2 一次真实操作：用'秋日银杏大道'找最匹配图片

步骤 1：输入精准描述词

步骤 2：上传 6 张候选图

步骤 3：点击'开始重排序'

4. 关键技术实现解析（不讲原理，只说你怎么受益）

4.1 BF16 高精度推理：为什么 4090 上跑得又快又准

4.2 显存智能调度：批量处理不崩、不卡、不 OOM

4.3 中英文混合容错：不用纠结语序和语法

5. 实用技巧与避坑指南

5.1 让排序更准的 3 个描述心法

5.2 常见问题速查表

5.3 进阶用法：命令行直调，绕过 UI 批量处理

6. 总结：它不是另一个玩具模型，而是你图库的'多模态守门员'

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具