RAG 框架全景解析:7 个 GraphRAG 及 17 个传统框架汇总
引言
检索增强生成(Retrieval-Augmented Generation, RAG)技术已成为连接大语言模型与私有知识的关键桥梁。随着企业级应用对信息准确性、实时性和可解释性要求的提升,RAG 架构不断演进。从传统的向量检索到引入知识图谱的图检索,技术路线日益丰富。
本文基于当前开源社区的最新进展,梳理了现有的主流 RAG 框架体系。我们将现有框架分为两大类:17 个传统 RAG 框架和 7 个 GraphRAG 框架。通过对这些框架的核心机制、适用场景及技术特点进行归纳,旨在为开发者提供选型参考和技术实现思路。
一、十七个传统 RAG 框架
传统 RAG 框架通常遵循'文档处理 - 向量化 - 存储 - 检索 - 生成'的标准流水线。其核心在于通过不同的策略适应多样化的文档结构和检索需求,如文档切分粒度、混合检索策略、重排序(Rerank)等。
1. AnythingLLM
具备完整的 RAG 和 AI 代理能力。支持多种本地和云端模型,内置向量数据库,适合快速搭建个人知识库或小型团队应用。地址:https://github.com/Mintplex-Labs/anything-llm
2. MaxKB
基于大型语言模型的知识库问答系统。设计为即插即用,支持快速嵌入到第三方业务系统,强调部署的便捷性和集成能力。地址:https://github.com/1Panel-dev/MaxKB
3. RAGFlow
一个基于深度文档理解的开源 RAG 引擎。其特色在于对复杂文档结构(如表格、公式、多栏排版)的深度解析能力,能显著提升非结构化数据的检索精度。地址:https://github.com/infiniflow/ragflow
4. Dify
一个开源的大型语言模型应用开发平台。Dify 直观的界面结合了 AI 工作流、RAG 流程、代理能力、模型管理、可观测性功能等,让您能快速从原型阶段过渡到生产阶段。地址:https://github.com/langgenius/dify
5. FastGPT
基于 LLM 构建的知识型平台,提供即开即用的数据加工和模型调用能力,允许通过流程可视化进行工作流编排。适合需要自定义业务流程的场景。地址:https://github.com/labring/FastGPT
6. Langchain-Chatchat
基于 Langchain 和 ChatGLM 等不同大模型的本地知识库问答。注重隐私保护和本地化部署,支持多种开源模型接入。地址:https://github.com/chatchat-space/Langchain-Chatchat
7. QAnything
基于 Anything 的问题和答案。网易有道出品,强调对中文语境的理解以及多模态数据的处理能力,支持 OCR 识别。地址:https://github.com/netease-youdao/QAnything
8. Quivr
使用 Langchain、GPT 3.5/4 turbo、Private、Anthropic、VertexAI、Ollama、LLMs、Groq 等与文档(PDF、CSV 等)和应用程序交互,本地和私有的替代 OpenAI GPTs 和 ChatGPT。地址:https://github.com/QuivrHQ/quivr



