Lychee-Rerank-MM 本地部署教程：无网依赖图文重排序 | 极客日志

PythonAI算法

Lychee-Rerank-MM 本地部署教程：无网依赖图文重排序

介绍 Lychee-Rerank-MM 的本地部署与使用方法。该工具基于 Qwen2.5-VL 视觉语言模型，专为图文匹配设计，支持 RTX 4090 显卡离线运行。部署过程无需 Docker，通过 Python 环境一键安装。主要功能包括上传多张图片并根据文本描述进行相关性重排序，输出分数及解释。技术亮点包括 BF16 高精度推理、显存智能调度及中英文混合输入容错。适合需要本地化、隐私安全且高效筛选图片的场景。

咸鱼开飞机发布于 2026/4/5更新于 2026/5/2023 浏览

Lychee-Rerank-MM 本地部署教程：无网依赖图文重排序

1. 为什么你需要这个重排序工具

你有没有遇到过这样的场景：手头有一堆产品图、设计稿或活动照片，想快速找出最匹配某段文案的那几张？比如写好了一条小红书文案'阳光洒在复古咖啡馆的木质吧台上，一杯拿铁冒着热气'，却要一张张翻图库找最贴切的配图；又或者在整理 AI 生成图时，面对上百张输出，靠肉眼判断哪张最符合'赛博朋克风格 + 穿银色机甲的女性 + 雨夜霓虹街道'这种复杂描述，耗时又容易出错。

传统做法要么靠人工反复比对，要么用简单关键词匹配——但图片没有文字索引，文本描述又千变万化。这时候，一个能真正'看懂图 + 读懂文'的本地化工具就变得特别实在。

lychee-rerank-mm 就是为此而生：它不联网、不传图、不调 API，所有计算都在你自己的 RTX 4090 显卡上完成。输入一句话，上传一堆图，点一下按钮，几秒内就能给你排出名次，每张图都附带 0–10 分的相关性打分，第一名还自带高亮边框——就像给你的图库装了个'多模态直觉'。

它不是通用大模型套壳，而是专为图文匹配打磨的轻量级重排序引擎：基于 Qwen2.5-VL 视觉语言理解能力，叠加 Lychee-rerank-mm 的精细化打分策略，再针对 4090 显卡做 BF16 精度与显存调度双重优化。没有云服务依赖，没有账号注册，没有网络权限请求，连 WiFi 关着也能跑。

如果你正需要一个安静、可控、响应快、结果准的本地图文筛选助手，这篇教程就是为你写的。

2. 环境准备与一键部署

2.1 硬件与系统要求

本方案严格适配 NVIDIA RTX 4090（24GB 显存），其他显卡暂不保证效果：

必需：RTX 4090（驱动版本 ≥535，CUDA 12.1+）
推荐系统：Ubuntu 22.04 / Windows 11（WSL2 环境更稳定）
Python 版本：3.10 或 3.11（不支持 3.12 及以上）
不支持：Mac M 系列芯片、AMD 显卡、笔记本低功耗模式下的 4090 移动版

提示：部署前请确认 nvidia-smi 能正常显示 GPU 状态，且 torch 已安装支持 CUDA 的版本（推荐使用 pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu121）

2.2 三步完成本地部署

整个过程无需编译、不改配置、不碰 Docker，纯 Python 生态一键拉起：

# 第一步：创建独立环境（推荐，避免包冲突）
python3 -m venv lychee-env
source lychee-env/bin/activate # Linux/macOS
# lychee-env\Scripts\activate # Windows

# 第二步：安装核心依赖（含 Qwen2.5-VL 官方包 + Lychee 专用重排序模块）
pip install --upgrade pip
pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu121
pip install transformers accelerate sentence-transformers pillow streamlit gradio

# 第三步：安装 Lychee-rerank-mm 主程序（含预置模型权重与 UI）
git clone https://github.com/lychee-ai/lychee-rerank-mm.git
cd lychee-rerank-mm
pip install -e .

注意：首次运行会自动下载约 3.2GB 的 Qwen2.5-VL-7B-Instruct 模型权重（含视觉编码器），下载位置默认为 ~/.cache/huggingface/hub/。如已存在同名模型，将跳过下载直接加载。

2.3 启动 Web 界面

部署完成后，直接运行启动命令：

相关免费在线工具

加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
RSA密钥对生成器
生成新的随机RSA私钥和公钥pem证书。在线工具，RSA密钥对生成器在线工具，online
Mermaid 预览与可视化编辑
基于 Mermaid.js 实时预览流程图、时序图等图表，支持源码编辑与即时渲染。在线工具，Mermaid 预览与可视化编辑在线工具，online
随机西班牙地址生成器
随机生成西班牙地址（支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选），支持数量快捷选择、显示全部与下载。在线工具，随机西班牙地址生成器在线工具，online
Gemini 图片去水印
基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印，支持批量处理与下载。在线工具，Gemini 图片去水印在线工具，online
curl 转代码
解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。在线工具，curl 转代码在线工具，online

streamlit run app.py --server.port=8501 --server.address=127.0.0.1

You can now view your Streamlit app in your browser. Local URL: http://localhost:8501 Network URL: http://192.168.1.100:8501

输入描述	模型是否正确理解	原因说明
`a red dress, standing on beach at sunset`	是	英文主谓宾结构清晰
`夕阳下的海滩，一条红色连衣裙`	是	中文主谓宾 + 场景状语完整
`red dress + 海滩 + 夕阳`	是	符号分隔仍能识别核心实体
`dress red beach sunset`（无冠词无介词）	是	Qwen2.5-VL 对碎片化输入有强泛化能力
`红色裙子？海边！夕阳！！`（标点混乱）	是	经过 Prompt 工程强化，忽略标点干扰

现象	可能原因	解决方法
点击按钮无反应，进度条不动	Streamlit 未正确绑定端口	检查终端是否报错 `OSError: [Errno 98] Address already in use`，换端口重试：`--server.port=8502`
上传图片后提示'无法读取格式'	图片含损坏元数据或非标准编码	用 Photoshop 或 GIMP 另存为'标准 PNG/JPG'，禁用'保存为 Web 所用格式'
所有图片分数都是 0 分	查询词含不可见 Unicode 字符（如零宽空格）	全选输入框内容 → 粘贴到记事本 → 重新复制粘贴回界面
第一名边框未显示	浏览器缩放比例非 100%	按 `Ctrl+0` 重置缩放，或检查浏览器控制台是否有 CSS 加载失败
处理速度明显变慢（>3 秒/张）	系统启用 Windows Defender 实时扫描	临时关闭或添加 `lychee-rerank-mm` 文件夹至排除列表

from lychee.rerank import Reranker

# 初始化（仅需一次，模型常驻显存）
reranker = Reranker(model_name="Qwen2.5-VL-7B-Instruct", device="cuda")

# 批量打分（返回 [(score, image_path), ...] 列表）
results = reranker.rank(
    query="一只柴犬在雪地里奔跑，吐着舌头，背景是松树",
    image_paths=["./img1.jpg", "./img2.png", "./img3.webp"]
)

# 按分数排序并打印
for score, path in sorted(results, key=lambda x: x[0], reverse=True):
    print(f"{path}: {score:.1f}分")

Lychee-Rerank-MM 本地部署教程：无网依赖图文重排序

Lychee-Rerank-MM 本地部署教程：无网依赖图文重排序

1. 为什么你需要这个重排序工具

2. 环境准备与一键部署

2.1 硬件与系统要求

2.2 三步完成本地部署

2.3 启动 Web 界面

更多推荐文章

相关免费在线工具

3. 实操演示：从输入到排序结果全流程

3.1 界面分区说明（极简但不简陋）

3.2 一次真实操作：用'秋日银杏大道'找最匹配图片

步骤 1：输入精准描述词

步骤 2：上传 6 张候选图

步骤 3：点击'开始重排序'

4. 关键技术实现解析（不讲原理，只说你怎么受益）

4.1 BF16 高精度推理：为什么 4090 上跑得又快又准

4.2 显存智能调度：批量处理不崩、不卡、不 OOM

4.3 中英文混合容错：不用纠结语序和语法

5. 实用技巧与避坑指南

5.1 让排序更准的 3 个描述心法

5.2 常见问题速查表

5.3 进阶用法：命令行直调，绕过 UI 批量处理

6. 总结：它不是另一个玩具模型，而是你图库的'多模态守门员'

更多推荐文章

相关免费在线工具

Lychee-Rerank-MM 本地部署教程：无网依赖图文重排序

Lychee-Rerank-MM 本地部署教程：无网依赖图文重排序

1. 为什么你需要这个重排序工具

2. 环境准备与一键部署

2.1 硬件与系统要求

2.2 三步完成本地部署

2.3 启动 Web 界面

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

3. 实操演示：从输入到排序结果全流程

3.1 界面分区说明（极简但不简陋）

3.2 一次真实操作：用'秋日银杏大道'找最匹配图片

步骤 1：输入精准描述词

步骤 2：上传 6 张候选图

步骤 3：点击'开始重排序'

4. 关键技术实现解析（不讲原理，只说你怎么受益）

4.1 BF16 高精度推理：为什么 4090 上跑得又快又准

4.2 显存智能调度：批量处理不崩、不卡、不 OOM

4.3 中英文混合容错：不用纠结语序和语法

5. 实用技巧与避坑指南

5.1 让排序更准的 3 个描述心法

5.2 常见问题速查表

5.3 进阶用法：命令行直调，绕过 UI 批量处理

6. 总结：它不是另一个玩具模型，而是你图库的'多模态守门员'

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具