LangChain 核心解析：从 LLM 调用到 Agent 架构

LangChain 是面向大模型应用开发的工程化框架，解决模型接口不统一、提示词难管理、业务流程复杂等痛点。文章详解其五大核心能力层，重点剖析 LCEL 如何通过管道式编排实现流式输出与异步处理，对比 RAG 与 Agent 的落地场景。结合 Qdrant 向量库与 Tarvos API 的完整代码示例，展示从文档加载、切片向量化到检索生成的全流程。强调企业级实践中 Prompt 独立管理、日志追踪及版本锁定的最佳实践，帮助开发者从单纯调用 API 转向设计可维护的 AI 工作流。

魔法巫师发布于 2026/3/22更新于 2026/5/67 浏览

一、为什么要用 LangChain？

自从 OpenAI 推出 ChatGPT 之后，大模型能力迅速普及。越来越多的开发者开始将 LLM 接入业务系统，但很快会遇到三个现实问题：

模型接口不统一 —— 今天用 OpenAI，明天换国内模型，代码要大改
Prompt 难管理 —— 提示词到处拼字符串，无法版本控制
业务流程复杂 —— RAG、Agent、多工具调用，全是胶水代码

这时候，LangChain 就登场了。

LangChain 本质是一套'面向大模型应用开发的工程化框架'，它把模型调用、Prompt 管理、知识检索、流程编排、Agent 调度全部抽象成可组合模块，让你像搭积木一样构建 AI 应用。

二、LangChain 架构全景

LangChain 可以理解为五大核心能力层：

在这里插入图片描述

记住一句话：LangChain = LLM 调用标准化 + RAG 工程化 + Agent 自动化

三、模型封装：统一不同大模型接口

LangChain 最大的优势之一，是统一模型接口。

你可以在不修改业务逻辑的前提下，在不同模型之间切换：

OpenAI GPT 系列
Anthropic Claude
国内文心一言
本地模型（Ollama / Llama）

你只需要更换模型初始化方式，其余调用方式一致。

这在企业级项目里极其重要 —— 模型可替换性 = 风险可控性。

四、Prompt 工程：把提示词变成函数

很多开发者刚开始接触 LLM 时，喜欢直接写：

f"给我讲一个关于{topic}的笑话"

问题是：

Prompt 无法版本管理
逻辑和提示词耦合
难以团队协作优化

LangChain 提供 PromptTemplate 和 ChatPromptTemplate：

支持变量占位
支持多角色（system / user / assistant）
支持文件加载
支持 Few-shot 示例

最佳实践是：Prompt 与代码彻底解耦，单独维护。

在中大型 AI 项目中，Prompt 甚至应该像 SQL 一样被当作核心资产管理。

五、RAG：给大模型注入私有知识

很多人说'模型不准'，其实问题不在模型，而在没有给模型知识。

RAG（Retrieval Augmented Generation）就是解决方案。

LangChain 的 RAG 流程通常包括：

文档加载（PDF / Word / 网页 / 数据库）
文本切分
向量化
存入向量数据库（如 FAISS）
检索 + 生成回答

在这里，LangChain 和 LlamaIndex 经常被拿来对比。

简单总结：

LangChain 强在流程编排 + Agent
LlamaIndex 强在数据索引能力

很多项目会：

用 LlamaIndex 做数据层
用 LangChain 做应用层

六、LCEL：LangChain 的灵魂

一、为什么要用 LangChain？

自从 OpenAI 推出 ChatGPT 之后，大模型能力迅速普及。越来越多的开发者开始将 LLM 接入业务系统，但很快会遇到三个现实问题：

模型接口不统一 —— 今天用 OpenAI，明天换国内模型，代码要大改
Prompt 难管理 —— 提示词到处拼字符串，无法版本控制
业务流程复杂 —— RAG、Agent、多工具调用，全是胶水代码

这时候，LangChain 就登场了。

二、LangChain 架构全景

LangChain 可以理解为五大核心能力层：

在这里插入图片描述

记住一句话：LangChain = LLM 调用标准化 + RAG 工程化 + Agent 自动化

三、模型封装：统一不同大模型接口

LangChain 最大的优势之一，是统一模型接口。

你可以在不修改业务逻辑的前提下，在不同模型之间切换：

OpenAI GPT 系列
Anthropic Claude
国内文心一言
本地模型（Ollama / Llama）

你只需要更换模型初始化方式，其余调用方式一致。

这在企业级项目里极其重要 —— 模型可替换性 = 风险可控性。

四、Prompt 工程：把提示词变成函数

很多开发者刚开始接触 LLM 时，喜欢直接写：

f"给我讲一个关于{topic}的笑话"

问题是：

Prompt 无法版本管理
逻辑和提示词耦合
难以团队协作优化

LangChain 提供 PromptTemplate 和 ChatPromptTemplate：

支持变量占位
支持多角色（system / user / assistant）
支持文件加载
支持 Few-shot 示例

最佳实践是：Prompt 与代码彻底解耦，单独维护。

在中大型 AI 项目中，Prompt 甚至应该像 SQL 一样被当作核心资产管理。

五、RAG：给大模型注入私有知识

很多人说'模型不准'，其实问题不在模型，而在没有给模型知识。

RAG（Retrieval Augmented Generation）就是解决方案。

LangChain 的 RAG 流程通常包括：

文档加载（PDF / Word / 网页 / 数据库）
文本切分
向量化
存入向量数据库（如 FAISS）
检索 + 生成回答

在这里，LangChain 和 LlamaIndex 经常被拿来对比。

简单总结：

LangChain 强在流程编排 + Agent
LlamaIndex 强在数据索引能力

很多项目会：

用 LlamaIndex 做数据层
用 LangChain 做应用层

六、LCEL：LangChain 的灵魂

from dotenv import load_dotenv import os import requests import glob # Load environment variables from .env file load_dotenv() from qdrant_client import QdrantClient from qdrant_client.models import VectorParams, Distance from langchain_community.document_loaders import PyMuPDFLoader from langchain_text_splitters import RecursiveCharacterTextSplitter from langchain_huggingface import HuggingFaceEmbeddings from langchain_qdrant import QdrantVectorStore from langchain_core.documents import Document EMBEDDING_DIM = 384 # all-MiniLM-L6-v2 模型的维度 COLLECTION_NAME = "langchain_demo" PATH = "./qdrant_db_langchain" # 设置 Tarvos API key 和 URL（从环境变量读取） TARVOS_API_KEY = os.getenv("TARVOS_API_KEY") TARVOS_API_URL = os.getenv("TARVOS_API_URL") TARVOS_MODEL = os.getenv("TARVOS_MODEL", "meta-llama/Llama-3.3-70B-Instruct") # 1. 加载本地 embedding 模型 print("正在加载本地 embedding 模型...") embeddings = HuggingFaceEmbeddings(model_name="sentence-transformers/all-MiniLM-L6-v2") # 2. 加载 ./data 目录下所有 PDF 文档 print("正在加载文档...") pdf_files = glob.glob("./data/*.pdf") if not pdf_files: raise ValueError("./data 目录下没有找到 PDF 文件，请先添加 PDF 文件") all_documents = [] for pdf_path in pdf_files: loader = PyMuPDFLoader(pdf_path) docs = loader.load() all_documents.extend(docs) print(f"共加载 {len(all_documents)} 页文档") # 3. 文档切片（chunk_size=300, chunk_overlap=100，与 llamaIndex.py 一致） print("正在切片文档...") text_splitter = RecursiveCharacterTextSplitter(chunk_size=300, chunk_overlap=100) chunks = text_splitter.split_documents(all_documents) print(f"共切分为 {len(chunks)} 个块") # 4. 创建 Qdrant Collection print("正在创建向量数据库...") qdrant_client = QdrantClient(path=PATH) if qdrant_client.collection_exists(collection_name=COLLECTION_NAME): qdrant_client.delete_collection(collection_name=COLLECTION_NAME) qdrant_client.create_collection( collection_name=COLLECTION_NAME, vectors_config=VectorParams(size=EMBEDDING_DIM, distance=Distance.COSINE) ) # 5. 将文档向量存入 Qdrant print("正在创建索引...") vector_store = QdrantVectorStore( client=qdrant_client, collection_name=COLLECTION_NAME, embedding=embeddings ) vector_store.add_documents(chunks) # 6. 创建检索器 retriever = vector_store.as_retriever(search_kwargs={"k": 3}) # 7. Tarvos API 问答函数（与 llamaIndex.py 完全一致） def ask_tarvos(question, context): headers = { "Content-Type": "application/json", "Authorization": TARVOS_API_KEY, } body = { "model": TARVOS_MODEL, "messages": [ { "role": "system", "content": "你是一个专业的 AI 助手，请根据提供的检索内容回答用户问题。如果检索内容与问题无关，请说明无法回答。" }, { "role": "user", "content": f"参考内容:\n{context}\n\n问题：{question}" } ] } try: resp = requests.post(TARVOS_API_URL, json=body, headers=headers, timeout=60) return resp.json()["choices"][0]["message"]["content"] except Exception as e: return f"调用 Tarvos API 失败：{str(e)}" # 8. 主对话循环 print("\n✅ 系统就绪！开始对话（输入空行退出）\n") while True: question = input("User: ") if question.strip() == "": break # 检索 top-k 文档 docs = retriever.invoke(question) context = "\n\n".join([doc.page_content for doc in docs]) # 调用 Tarvos API 生成答案 answer = ask_tarvos(question, context) print(f"AI: {answer}\n")

LangChain 核心解析：从 LLM 调用到 Agent 架构

LangChain 核心解析：从 LLM 调用到 Agent 架构

更多推荐文章

相关免费在线工具

更多推荐文章

相关免费在线工具

LangChain 核心解析：从 LLM 调用到 Agent 架构

LangChain 核心解析：从 LLM 调用到 Agent 架构

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具