LightRAG 简介
LightRAG 是一个旨在实现简单、快速检索增强生成(RAG)的框架。它通过从文档中构建知识图谱来增强传统 RAG,能够更深入、更具上下文感知地理解源材料。相比简单的基于关键词的检索,它利用广泛上下文和具体细节,实现了双层检索范式。
核心功能
LightRAG 配备了一系列功能,旨在提供一个灵活、强大且可观测的 RAG 系统。

技术栈选型
大型语言模型 (LLM)
建议使用参数至少 320 亿的模型。上下文长度至少需要 32KB,建议 64KB 以获得最佳性能。在文档索引阶段,避免使用主要专注于推理的模型;查询阶段则建议使用比索引阶段更强大的模型以获得更好的结果。
Embedding 模型
一个高性能、多语言的 embedding 模型至关重要。推荐 BAAI/bge-m3 或 text-embedding-3-large。一致性是关键:文档索引和查询必须使用相同的 embedding 模型。如果更换模型,需清除现有的向量数据,以便 LightRAG 使用正确的维度重新生成。
重排序器模型 (Reranker model)
集成 reranker 模型可以显著提高检索性能,尤其是在使用'mix'查询模式时。推荐 BAAI/bge-reranker-v2-m3 或 Jina 等提供商的商业产品。
优化机制:
- 语义相关性评分:将用户查询与候选文档输入同一模型(如 Cross-Encoder),输出 0-1 的相似度分数,基于上下文深度分析语义匹配度。
- 结果重排序:按分数对文档降序排列,优先保留最相关片段,过滤冗余信息。
部署指南
环境准备
- Python 3.10.5
- PyCharm
- LightRAG-1.4.9.10
- Windows 11
1. 配置 PyCharm 与安装 Bun
在 PyCharm 中配置好 Python 3.10.5 环境后,打开 LightRAG 源代码目录。在终端中使用 PowerShell 安装 Bun:
powershell -c "irm bun.sh/install.ps1|iex"
2. 安装服务器与运行服务
依次执行以下命令安装依赖并构建前端:
pip install "lightrag-hku[api]"
pip install lightrag-hku
# 构建前端代码
cd lightrag_webui
bun install --frozen-lockfile
bun run build
cd ..
# 配置 env 文件
cp env.example .env
# 使用你的 LLM 和 Embedding 模型访问参数更新.env 文件
# 启动 API-WebUI 服务
lightrag-server
.env 配置示例




