Langchain 与纯手搓实现 RAG 系统的对比与实践

Langchain 与纯手搓实现 RAG 系统的对比与实践 | 极客日志

维度	Langchain 实现	纯手搓实现
开发时间	~25 分钟	~180 分钟
代码行数	少（高层 API）	多（底层集成）
调试难度	低	高
典型应用场景	快速原型、企业系统	教学演示、边缘设备

维度	Langchain 实现	纯手搓实现
开发时间	~25 分钟	~180 分钟
代码行数	少（高层 API）	多（底层集成）
调试难度	低	高
典型应用场景	快速原型、企业系统、复杂 Agent 编排	教学演示、资源受限环境、极致性能优化

pip install langchain langchain-openai langchain-text-splitters chromadb faiss-cpu openai python-dotenv

# .env 文件内容
OPENAI_API_KEY=your_actual_api_key_here

from langchain_community.document_loaders import TextLoader 
# 创建 TextLoader 实例，加载名为"knowledge.txt"的文本文件
loader = TextLoader("knowledge.txt", encoding="utf-8")
documents = loader.load()

from langchain.text_splitter import RecursiveCharacterTextSplitter 
# 初始化递归字符切分器
text_splitter = RecursiveCharacterTextSplitter(
    chunk_size=500, # 每个文本块约 500 个字符
    chunk_overlap=50, # 块之间重叠 50 个字符
    separators=["\n\n","\n","。",".","!","?"] # 分割符优先级
)
chunks = text_splitter.split_documents(documents)

from langchain_openai import OpenAIEmbeddings 
from langchain_community.vectorstores import Chroma 
# 使用 OpenAI 的嵌入模型将文本块转为向量
embeddings = OpenAIEmbeddings(model="text-embedding-3-large")
vectorstore = Chroma.from_documents(
    chunks, 
    embedding=embeddings, 
    persist_directory="./chroma_db" # 将数据库持久化保存到本地
)
vectorstore.persist() # 确保数据已写入磁盘

retriever = vectorstore.as_retriever(search_kwargs={"k":3})

from langchain_openai import ChatOpenAI 
llm = ChatOpenAI(model_name="gpt-3.5-turbo", temperature=0)

from langchain_core.prompts import ChatPromptTemplate 
from langchain.schema.runnable import RunnablePassthrough 
from langchain.schema.output_parser import StrOutputParser 
# 定义一个提示模板，明确告诉大模型如何利用上下文
prompt = ChatPromptTemplate.from_template("请基于以下上下文回答问题，若无法找到答案请回答'我不知道'。\n" + """上下文：{context}\n\n问题：{question}""") 
# 构建核心链条：接收问题 -> 检索相关文档 -> 填充提示模板 -> 调用大模型 -> 解析字符串输出
rag_chain = ({"context": retriever,"question": RunnablePassthrough()} | prompt | llm | StrOutputParser()) 
# 执行查询
result = rag_chain.invoke("阿司匹林的禁忌症是什么？")
print("AI 回答：", result)

# 手动读取文本文件
with open("knowledge.txt", "r", encoding="utf-8") as f:
    text = f.read()
# 使用简单的滑动窗口进行切分
chunk_size = 500
overlap = 50
chunks = [text[i:i + chunk_size] for i in range(0, len(text), chunk_size - overlap)]
print(f"✅ 切分为 {len(chunks)} 个文本块")

from sentence_transformers import SentenceTransformer 
import numpy as np 
# 加载一个轻量级的开源嵌入模型
embedding_model = SentenceTransformer('all-MiniLM-L6-v2')
# 将所有文本块批量编码为向量
chunk_vectors = embedding_model.encode(chunks, show_progress_bar=True)
dimension = chunk_vectors.shape[1] # 获取向量维度

import faiss 
# 创建一个基于欧氏距离（L2）的索引
index = faiss.IndexFlatL2(dimension)
# 将所有文本块的向量添加到索引中
index.add(np.array(chunk_vectors))
# 将索引持久化保存，避免每次启动都重新计算
faiss.write_index(index, "faiss_index.bin")

query = "阿司匹林的禁忌症是什么？"
# 将查询问题也编码为向量
query_vector = embedding_model.encode([query])
# 在向量库中搜索与查询向量最相似的 3 个结果
distances, indices = index.search(np.array(query_vector), k=3)
# 根据检索到的索引，取出对应的文本块
retrieved_chunks = [chunks[i] for i in indices[0]]
context = "\n".join(retrieved_chunks) # 将多个相关片段合并为一段上下文

from transformers import pipeline 
# 创建一个文本生成管道，这里使用较小的 gpt2 模型作为示例
generator = pipeline("text-generation", model="gpt2")
# 构造增强提示词
prompt = f"根据以下资料回答问题：\n{context}\n\n问题：{query}\n回答："
# 调用模型生成回答
output = generator(prompt, max_new_tokens=150, do_sample=False)
# 提取出模型生成的回答部分，去掉前面的提示词
answer = output[0]['generated_text'][len(prompt):].strip()
print("AI 回答：", answer)

# 创建名为 rag_env 的虚拟环境
python -m venv rag_env 
# 激活虚拟环境 (Linux/Mac)
source rag_env/bin/activate 
# 激活虚拟环境 (Windows)
rag_env\Scripts\activate 
# 安装依赖
pip install langchain sentence-transformers faiss-cpu openai chromadb PyPDF2

问题类型	表现	解决方案
Python 版本冲突	ImportError: cannot import name 'AsyncGenerator'	使用 Python 3.9–3.11
API 密钥未设置	AuthenticationError	检查 `.env` 文件中的 `OPENAI_API_KEY` 是否正确
中文路径报错	invalid utf-8 sequence	将项目放在纯英文路径下，例如 `C:\projects\rag_demo`
模型下载失败	.model.part 残留	检查网络连接，或使用代理；也可尝试离线预载模型

Langchain 与纯手搓实现 RAG 系统的对比与实践

一、什么是 RAG？——让大模型'开卷考试'

1.1 RAG 的核心思想

1.2 RAG 的工作流程

二、两种实现方式对比：Langchain vs 纯手搓

更多推荐文章

相关免费在线工具

2.1 开发效率对比

2.2 代码复杂度与维护成本

2.3 适用场景总结表

三、Langchain 实现：高效构建你的第一个 RAG 系统

3.1 环境准备

3.2 步骤详解与代码实现

步骤 1：加载文档

步骤 2：文本切分

步骤 3：向量化并存入数据库

步骤 4：创建检索器

步骤 5：初始化语言模型

步骤 6：构建 RAG 生成链

四、纯手搓实现：深入理解 RAG 底层机制

4.1 不依赖框架的意义

4.2 步骤详解与代码实现

步骤 1：加载并切分文本

步骤 2：调用嵌入模型生成向量

步骤 3：构建 Faiss 向量索引

步骤 4：相似度检索

步骤 5：拼接 Prompt 并调用 LLM 生成

五、环境配置与新手避坑指南

5.1 推荐开发环境

5.2 虚拟环境与依赖管理

5.3 新手常见问题与解决方案

5.4 最佳实践建议

六、总结与学习建议

更多推荐文章

相关免费在线工具

Langchain 与纯手搓实现 RAG 系统的对比与实践

一、什么是 RAG？——让大模型'开卷考试'

1.1 RAG 的核心思想

1.2 RAG 的工作流程

二、两种实现方式对比：Langchain vs 纯手搓

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

2.1 开发效率对比

2.2 代码复杂度与维护成本

2.3 适用场景总结表

三、Langchain 实现：高效构建你的第一个 RAG 系统

3.1 环境准备

3.2 步骤详解与代码实现

步骤 1：加载文档

步骤 2：文本切分

步骤 3：向量化并存入数据库

步骤 4：创建检索器

步骤 5：初始化语言模型

步骤 6：构建 RAG 生成链

四、纯手搓实现：深入理解 RAG 底层机制

4.1 不依赖框架的意义

4.2 步骤详解与代码实现

步骤 1：加载并切分文本

步骤 2：调用嵌入模型生成向量

步骤 3：构建 Faiss 向量索引

步骤 4：相似度检索

步骤 5：拼接 Prompt 并调用 LLM 生成

五、环境配置与新手避坑指南

5.1 推荐开发环境

5.2 虚拟环境与依赖管理

5.3 新手常见问题与解决方案

5.4 最佳实践建议

六、总结与学习建议

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具