基于 LangChain 快速搭建 RAG 知识库实战

基于 LangChain 和 FastAPI 搭建 RAG（检索增强生成）知识库的完整流程。内容涵盖 RAG 技术原理、文档加载与切片、向量数据库构建、Prompt 设计及代码实现。通过具体示例展示了如何快速构建一个支持自然语言问答的服务端，并提供了环境依赖、QA 组织方式及测试方法。文章最后总结了知识库动态更新、混合检索、系统扩展性等优化方向，旨在帮助开发者高效利用大模型能力解决垂直领域的知识问答问题。

宁静发布于 2025/2/7更新于 2026/7/2346 浏览

背景

在日常工作中，对接第三方合作方时往往面临文档繁多、沟通不及时、问题排查繁琐以及工作重复性高等挑战。传统的工单处理模式（门户网站->产品部门->开发人员->回复）流程较长，效率较低。

如何利用前期积累的问题日志、对接规范、指导手册和接口文档，让开发、产品及合作方有效获取知识？大模型具备强大的自然语言理解和文档整理能力，但缺乏垂类领域知识。RAG（检索增强生成技术）恰好能在大模型与私有知识库之间建立桥梁，实现精准问答。

1. RAG 技术介绍

RAG (Retrieval-Augmented Generation) 是一种结合了检索和生成的混合式深度学习模型，常用于处理复杂的自然语言处理任务。RAG 模型通过将外部知识库中的信息与生成模型结合在一起，可以提供更准确和上下文相关的答案。具体来说，RAG 由两个部分组成：

检索模块：负责从预先建立的知识库中检索与输入问题最相关的文档或信息片段。这通常通过向量检索技术实现，支持语义匹配，提高了检索的准确性。
生成模块：接收检索到的内容并生成最终的自然语言响应。该模块通常基于大型生成模型（如 GPT-4），能够理解和生成复杂的自然语言。

这种技术的优势在于利用海量外部数据进行知识补充，提升回答质量和准确性，特别适用于动态性强、知识库更新频繁的场景。

2. RAG 搭建常见流程

在实际应用中，搭建一个基于 RAG 的知识库通常包括以下几个步骤：

文档加载，并按一定条件切割成片段；
将切割的文本片段灌入向量数据库；
封装检索接口；
构建调用流程：Query -> 检索 -> Prompt -> LLM -> 回复。

3. 编码实现

下面使用极少的代码快速搭建一个 RAG 系统，包括服务端和 Web 界面，仅用于 Demo 展示。生产级的 RAG 系统会更加复杂。

项目结构

核心代码

如果纯自己编码实现 RAG，可能需要上千行代码。这里借助成熟的大模型开发框架来简化开发过程，把重心放到流程上。本例使用了 LangChain，关键代码已添加注释。

LangChain：一套在大模型能力上封装的工具框架（SDK），为开发者提供了一系列工具和组件，以简化语言模型在复杂任务中的集成和应用。

import uvicorn
from fastapi import FastAPI, HTTPException
from pydantic import BaseModel
from langchain.chains import RetrievalQA
from langchain_openai import ChatOpenAI
from langchain_community.vectorstores import FAISS
from langchain_openai import OpenAIEmbeddings
from dotenv import load_dotenv, find_dotenv
 langchain_community.document_loaders  TextLoader
 langchain_text_splitters  RecursiveCharacterTextSplitter
 langchain.prompts  ChatPromptTemplate
 starlette.middleware.cors  CORSMiddleware


_ = load_dotenv(find_dotenv())


llm = ChatOpenAI(model=, temperature=)


loader = TextLoader(, encoding=)
documents = loader.load()


text_splitter = RecursiveCharacterTextSplitter.from_language(language=, chunk_size=, chunk_overlap=)
texts = text_splitter.create_documents(
    [documents[].page_content]
)


db = FAISS.from_documents(texts, OpenAIEmbeddings(model=))

retriever = db.as_retriever(search_kwargs={: })


prompt_template = ChatPromptTemplate.from_messages([
    (, ),
    (, )
])


chain_type_kwargs = {
    : prompt_template,
}


qa_chain = RetrievalQA.from_chain_type(
    llm=llm,
    chain_type=,  
    chain_type_kwargs=chain_type_kwargs,
    retriever=retriever
)


app = FastAPI()


app.add_middleware(
    CORSMiddleware,
    allow_origins=[],
    allow_credentials=,
    allow_methods=[],
    allow_headers=[],
)


 ():
    question: 


 ():
    answer: 



  ():
    :
        user_question = request.question
        (user_question)

        
        answer = qa_chain.run(user_question)

        
         AnswerResponse(answer=answer)
     Exception  e:
         HTTPException(status_code=, detail=(e))

 __name__ == :
    uvicorn.run(app, host=, port=)

背景

1. RAG 技术介绍

检索模块：负责从预先建立的知识库中检索与输入问题最相关的文档或信息片段。这通常通过向量检索技术实现，支持语义匹配，提高了检索的准确性。
生成模块：接收检索到的内容并生成最终的自然语言响应。该模块通常基于大型生成模型（如 GPT-4），能够理解和生成复杂的自然语言。

这种技术的优势在于利用海量外部数据进行知识补充，提升回答质量和准确性，特别适用于动态性强、知识库更新频繁的场景。

2. RAG 搭建常见流程

在实际应用中，搭建一个基于 RAG 的知识库通常包括以下几个步骤：

文档加载，并按一定条件切割成片段；
将切割的文本片段灌入向量数据库；
封装检索接口；
构建调用流程：Query -> 检索 -> Prompt -> LLM -> 回复。

3. 编码实现

下面使用极少的代码快速搭建一个 RAG 系统，包括服务端和 Web 界面，仅用于 Demo 展示。生产级的 RAG 系统会更加复杂。

项目结构

核心代码

LangChain：一套在大模型能力上封装的工具框架（SDK），为开发者提供了一系列工具和组件，以简化语言模型在复杂任务中的集成和应用。

import uvicorn
from fastapi import FastAPI, HTTPException
from pydantic import BaseModel
from langchain.chains import RetrievalQA
from langchain_openai import ChatOpenAI
from langchain_community.vectorstores import FAISS
from langchain_openai import OpenAIEmbeddings
from dotenv import load_dotenv, find_dotenv
 langchain_community.document_loaders  TextLoader
 langchain_text_splitters  RecursiveCharacterTextSplitter
 langchain.prompts  ChatPromptTemplate
 starlette.middleware.cors  CORSMiddleware


_ = load_dotenv(find_dotenv())


llm = ChatOpenAI(model=, temperature=)


loader = TextLoader(, encoding=)
documents = loader.load()


text_splitter = RecursiveCharacterTextSplitter.from_language(language=, chunk_size=, chunk_overlap=)
texts = text_splitter.create_documents(
    [documents[].page_content]
)


db = FAISS.from_documents(texts, OpenAIEmbeddings(model=))

retriever = db.as_retriever(search_kwargs={: })


prompt_template = ChatPromptTemplate.from_messages([
    (, ),
    (, )
])


chain_type_kwargs = {
    : prompt_template,
}


qa_chain = RetrievalQA.from_chain_type(
    llm=llm,
    chain_type=,  
    chain_type_kwargs=chain_type_kwargs,
    retriever=retriever
)


app = FastAPI()


app.add_middleware(
    CORSMiddleware,
    allow_origins=[],
    allow_credentials=,
    allow_methods=[],
    allow_headers=[],
)


 ():
    question: 


 ():
    answer: 



  ():
    :
        user_question = request.question
        (user_question)

        
        answer = qa_chain.run(user_question)

        
         AnswerResponse(answer=answer)
     Exception  e:
         HTTPException(status_code=, detail=(e))

 __name__ == :
    uvicorn.run(app, host=, port=)

基于 LangChain 快速搭建 RAG 知识库实战

背景

1. RAG 技术介绍

2. RAG 搭建常见流程

3. 编码实现

项目结构

核心代码

基于 LangChain 快速搭建 RAG 知识库实战

背景

1. RAG 技术介绍

2. RAG 搭建常见流程

3. 编码实现

项目结构

核心代码

更多推荐文章

相关免费在线工具

运行环境

QA 准备

效果展示

4. 总结与优化点

5. 测试与部署

更多推荐文章

相关免费在线工具

基于 LangChain 快速搭建 RAG 知识库实战

背景

1. RAG 技术介绍

2. RAG 搭建常见流程

3. 编码实现

项目结构

核心代码

基于 LangChain 快速搭建 RAG 知识库实战

背景

1. RAG 技术介绍

2. RAG 搭建常见流程

3. 编码实现

项目结构

核心代码

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

运行环境

QA 准备

效果展示

4. 总结与优化点

5. 测试与部署

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具