RAG 系统实战：Langchain 框架与纯手搓方案对比

你是否曾为大模型'一本正经地胡说八道'而困扰？或者希望它能回答关于你个人笔记或公司内部文档的问题？今天，我们就来一起动手搭建一个简单 RAG 系统，让你的大模型从'闭卷考试'变成'开卷考试'，大幅提升回答的准确性和实用性。

了解了 RAG 的基本原理后，我们来看看如何动手实现它。

RAG 核心架构图

一、什么是 RAG？——让大模型'开卷考试'

1.1 RAG 的核心思想

RAG 概念示意图

想象一下，你正在参加一场考试。如果只能靠记忆答题，遇到不熟悉的知识点就容易答错甚至瞎编——这就像没有 RAG 的传统大语言模型（LLM）。它们的知识被'固化'在训练数据中，无法获取新信息，也容易产生'幻觉'。

而 RAG（Retrieval-Augmented Generation，检索增强生成）技术，就是给大模型发了一本'参考书'。当用户提问时，系统会先从这本'参考书'（你的知识库）里查找相关信息，再把找到的内容和问题一起交给大模型去生成答案。

这种'开卷考试'的方式带来了三大优势：

✅ 事实更准确：答案基于真实文档，大幅减少胡编乱造。
✅ 知识可更新：只需更新你的知识库文件，就能让大模型掌握最新信息。
✅ 支持私有数据：你可以让它读取你的 PDF 报告、Word 文档、网页内容，解答专属问题。

1.2 RAG 的工作流程

RAG 工作流程图

RAG 系统的工作可以分为两个阶段：离线准备和在线查询。

在你开始使用之前，需要先完成'离线准备'阶段，也就是把你的知识文档处理好，方便后续快速查找。

这个过程包含五个核心步骤：

用户提问：'阿司匹林的禁忌症是什么？'
查询向量化：将你的问题转换成一串数字（向量），这是计算机理解语义的方式。
向量检索：在存储着无数文档片段向量的数据库中，找出与问题向量最相似的几个片段。
提示增强：把检索到的相关片段和原始问题拼接起来，形成一个新的、信息更丰富的提示词。
大模型生成：把这个增强后的提示词交给大模型，它就能结合这些参考资料，生成一个有据可依的答案。

整个过程通常在几秒内完成，为你提供精准可靠的信息。

二、两种实现方式对比：Langchain vs 纯手搓

对比示意图

维度	Langchain 实现	纯手搓实现
开发时间	~25 分钟	~180 分钟
代码行数	少（高层 API）	多（底层集成）
调试难度	低	高
典型应用场景	快速原型、企业系统	教学演示、边缘设备

维度	Langchain 实现	纯手搓实现
开发时间	~25 分钟	~180 分钟
代码行数	少（高层 API）	多（底层集成）
调试难度	低	高
典型应用场景	快速原型、企业系统、复杂 Agent 编排	教学演示、资源受限环境、极致性能优化

问题类型	表现	解决方案
Python 版本冲突	ImportError: cannot import name 'AsyncGenerator'	使用 Python 3.9–3.11
API 密钥未设置	AuthenticationError	检查 `.env` 文件中的 `OPENAI_API_KEY` 是否正确
中文路径报错	invalid utf-8 sequence	将项目放在纯英文路径下，例如 `C:\projects\rag_demo`
模型下载失败	.model.part 残留	检查网络连接，或使用代理；也可尝试离线预载模型

RAG 系统实战：Langchain 框架与纯手搓方案对比

一、什么是 RAG？——让大模型'开卷考试'

1.1 RAG 的核心思想

1.2 RAG 的工作流程

二、两种实现方式对比：Langchain vs 纯手搓

更多推荐文章

相关免费在线工具

2.1 开发效率对比

2.2 代码复杂度与维护成本

2.3 适用场景总结表

三、Langchain 实现：高效构建你的第一个 RAG 系统

3.1 环境准备

3.2 步骤详解与代码实现

加载文档

文本切分

向量化并存入数据库

创建检索器

初始化语言模型

构建 RAG 生成链

四、纯手搓实现：深入理解 RAG 底层机制

4.1 不依赖框架的意义

4.2 步骤详解与代码实现

加载并切分文本

调用嵌入模型生成向量

构建 Faiss 向量索引

相似度检索

拼接 Prompt 并调用 LLM 生成

五、环境配置与新手避坑指南

5.1 推荐开发环境

5.2 虚拟环境与依赖管理

5.3 新手常见问题与解决方案

5.4 最佳实践建议

六、总结与学习建议

更多推荐文章

相关免费在线工具

RAG 系统实战：Langchain 框架与纯手搓方案对比

一、什么是 RAG？——让大模型'开卷考试'

1.1 RAG 的核心思想

1.2 RAG 的工作流程

二、两种实现方式对比：Langchain vs 纯手搓

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

2.1 开发效率对比

2.2 代码复杂度与维护成本

2.3 适用场景总结表

三、Langchain 实现：高效构建你的第一个 RAG 系统

3.1 环境准备

3.2 步骤详解与代码实现

加载文档

文本切分

向量化并存入数据库

创建检索器

初始化语言模型

构建 RAG 生成链

四、纯手搓实现：深入理解 RAG 底层机制

4.1 不依赖框架的意义

4.2 步骤详解与代码实现

加载并切分文本

调用嵌入模型生成向量

构建 Faiss 向量索引

相似度检索

拼接 Prompt 并调用 LLM 生成

五、环境配置与新手避坑指南

5.1 推荐开发环境

5.2 虚拟环境与依赖管理

5.3 新手常见问题与解决方案

5.4 最佳实践建议

六、总结与学习建议

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具