LangChain 框架核心模块与使用指南 | 极客日志

PythonAI

LangChain 框架核心模块与使用指南

LangChain 是构建语言模型应用的框架，涵盖模型、提示、内存、索引、链和代理六大模块。通过标准化接口简化组件集成，支持检索增强生成（RAG）、多步任务编排及自主代理决策。各模块功能、代码实现及最佳实践，帮助开发者快速上手构建端到端 AI 应用。

月亮邮递员发布于 2025/2/7更新于 2026/6/331 浏览

LangChain 框架核心模块与使用指南

LangChain 是一个强大的框架，旨在帮助开发人员使用语言模型构建端到端的应用程序或各类 Agent。它提供了一套工具、组件和接口，可简化创建应用程序的过程。LangChain 可以轻松管理与 LLM 的交互，将多个组件链接在一起，并集成额外的资源。以下介绍 LangChain 框架提供的几个主要模块，这些模块按照逐渐增加的复杂性排列如下：

模型 (Models)

LangChain 支持的各种模型类型和模型集成。

LLM 模型的调用示例

llm = OpenAI(model_name="text-ada-001", n=2, best_of=2)
# 生成文本：LLM 最基本的功能就是能够调用它，传入一个字符串并返回一个字符串。
result = llm("Tell me a joke")
print(result)
# 类似的还可以传入数组，得到 llm_result.generations[] 的各种信息

Chat 模型的调用示例

chat = ChatOpenAI(temperature=0)
messages = [HumanMessage(content="Translate this sentence from English to French. I love programming.")]
response = chat(messages)
# 响应将是一条消息。LangChain 目前支持的消息类型包括 AIMessage、HumanMessage、SystemMessage 和 ChatMessage。
print(response.content)

文本嵌入模型 (Text Embedding Model) 调用示例

Embedding 类是一个用于与嵌入进行交互的类。有许多嵌入提供商（OpenAI、Cohere、Hugging Face 等）。这个类旨在为所有这些提供商提供一个标准接口。嵌入会创建文本的向量表示。这使我们可以在向量空间中执行诸如语义搜索之类的操作，寻找最相似的文本片段。

LangChain 中的基本 Embedding 类公开了两种方法：embed_documents 和 embed_query。最大的区别在于这两种方法具有不同的接口：一个适用于多个文档，而另一个适用于单个文档。

提示工程 (Prompts)

Prompt 是一种向语言模型提供特定的输入或指令，以此来引导模型生成用户期望的特定输出的提示词。通常这个提示词不仅仅是一个硬编码的字符串，而是一个模板、一些例子和用户输入的组合。提示词模板可能包含：

对语言模型的指导
一组少量示例，以帮助语言模型生成更好的响应
对语言模型的提问

LangChain 提供了几个相关的提示模板，以便轻松构建和处理提示。包括 ChatPromptTemplate、PromptTemplate、SystemMessagePromptTemplate、AIMessagePromptTemplate、HumanMessagePromptTemplate 等。

官方文档提供的示例可以使用 from_template 方法直接将自定义 template 文本作为参数建立提示词模板，也可以将 PromptTemplate 实例化后作为参数传递给 MessagePromptTemplates。

template = "You are a helpful assistant that translates {input_language} to {output_language}."
system_message_prompt = SystemMessagePromptTemplate.from_template(template)
human_template = 
human_message_prompt = HumanMessagePromptTemplate.from_template(human_template)

prompt = PromptTemplate(
    template=,
    input_variables=[, ],
)
system_message_prompt_2 = SystemMessagePromptTemplate(prompt=prompt)

 system_message_prompt == system_message_prompt_2

chat_prompt = ChatPromptTemplate.from_messages([system_message_prompt, human_message_prompt])

messages = chat_prompt.format_prompt(input_language=, output_language=, text=).to_messages()

相关免费在线工具

RSA密钥对生成器
生成新的随机RSA私钥和公钥pem证书。在线工具，RSA密钥对生成器在线工具，online
Mermaid 预览与可视化编辑
基于 Mermaid.js 实时预览流程图、时序图等图表，支持源码编辑与即时渲染。在线工具，Mermaid 预览与可视化编辑在线工具，online
随机西班牙地址生成器
随机生成西班牙地址（支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选），支持数量快捷选择、显示全部与下载。在线工具，随机西班牙地址生成器在线工具，online
curl 转代码
解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。在线工具，curl 转代码在线工具，online
Base64 字符串编码/解码
将字符串编码和解码为其 Base64 格式表示形式即可。在线工具，Base64 字符串编码/解码在线工具，online
Base64 文件转换器
将字符串、文件或图像转换为其 Base64 表示形式。在线工具，Base64 文件转换器在线工具，online

example_selector = SemanticSimilarityExampleSelector.from_examples(
    examples,
    OpenAIEmbeddings(),
    Chroma,
    k=1
)
similar_prompt = FewShotPromptTemplate(
    example_selector=example_selector,
    example_prompt=example_prompt,
    prefix="Give the antonym of every input",
    suffix="Input: {adjective}\nOutput:",
    input_variables=["adjective"],
)

['Vanilla', 'Chocolate', 'Strawberry', 'Mint Chocolate Chip', 'Cookies and Cream']

response_schemas = [
    ResponseSchema(name="answer", description="answer to the user's question"),
    ResponseSchema(name="source", description="source used to answer the user's question, should be a website.")
]
output_parser = StructuredOutputParser.from_response_schemas(response_schemas)
# 进行调用后
parsed_output = output_parser.parse(output.content)
# 结果
# {'answer': 'Paris', 'source': 'https://en.wikipedia.org/wiki/Paris'}

from langchain.indexes import VectorstoreIndexCreator
index = VectorstoreIndexCreator().from_loaders([loader])
query = "What did the president say about Ketanji Brown Jackson"
result = index.query(query)
# 下述方法可以返回查询的数据来源 sources 地址
sources = index.query_with_sources(query)

index_creator = VectorstoreIndexCreator(
    vectorstore_cls=Chroma,
    embedding=OpenAIEmbeddings(),
    text_splitter=CharacterTextSplitter(chunk_size=1000, chunk_overlap=0)
)

docsearch = Chroma.from_texts(texts, embeddings)
query = "What did the president say about Ketanji Brown Jackson"
# 搜索
docs = docsearch.similarity_search(query)
# 添加文本
docsearch.add_texts(["Ankush went to Princeton"])
# 从文档初始化向量存储。使用文本拆分器方法直接获取文档
documents = text_splitter.create_documents([state_of_the_union], metadatas=[{"source": "State of the Union"}])

# 从向量数据库 db 中初始化一个检索器
retriever = db.as_retriever()
# 默认情况下，vectorstore 检索器使用相似性搜索。如果底层的 vectorstore 支持最大边际相关性搜索，则可以指定该搜索类型。
retriever = db.as_retriever(search_type="mmr")
docs = retriever.get_relevant_documents("what did he say about ketanji brown jackson")

tools.append(
    Tool(
        name="Calculator",
        func=llm_math_chain.run,
        description="在需要回答数学问题时非常有用",
        args_schema=CalculatorInput
    )
)

from langchain.chains import SimpleSequentialChain
overall_chain = SimpleSequentialChain(chains=[chain, chain_two], verbose=True)
# Run the chain specifying only the input variable for the first chain.
catchphrase = overall_chain.run("colorful socks")
print(catchphrase)

# 准备问题
query = "What did the president say about Justice Breyer"
# 准备文档数据源&向量化存储
docsearch = Chroma.from_texts(texts, embeddings, metadatas=[{"source": str(i)} for i in range(len(texts))])
docs = docsearch.similarity_search(query)
# 使用链
chain = load_qa_with_sources_chain(OpenAI(temperature=0), chain_type="stuff")
chain({"input_documents": docs, "question": query}, return_only_outputs=True)

docsearch = Chroma.from_texts(texts, embeddings, metadatas=[{"source": f"{i}-pl"} for i in range(len(texts))])
from langchain import OpenAI
chain = RetrievalQAWithSourcesChain.from_chain_type(OpenAI(temperature=0), chain_type="stuff", retriever=docsearch.as_retriever())
chain({"question": "What did the president say about Justice Breyer"}, return_only_outputs=True)

from langchain.agents import initialize_agent, Tool
from langchain.llms import OpenAI

llm = OpenAI(temperature=0)
tools = [
    Tool(
        name="Search",
        func=search_tool.run,
        description="Useful for when you need to answer questions about current events."
    ),
    Tool(
        name="Calculator",
        func=calculator_tool.run,
        description="Useful for when you need to answer questions about math."
    )
]

agent = initialize_agent(tools, llm, agent=AgentType.ZERO_SHOT_REACT_DESCRIPTION, verbose=True)
agent.run("Who is the CEO of Tesla? What is his net worth?")

LangChain 框架核心模块与使用指南

LangChain 框架核心模块与使用指南

模型 (Models)

LLM 模型的调用示例

Chat 模型的调用示例

文本嵌入模型 (Text Embedding Model) 调用示例

提示工程 (Prompts)

更多推荐文章

相关免费在线工具

内存 (Memory)

索引 (Indexes)

链 (Chains)

代理 (Agents)

总结

更多推荐文章

相关免费在线工具

LangChain 框架核心模块与使用指南

LangChain 框架核心模块与使用指南

模型 (Models)

LLM 模型的调用示例

Chat 模型的调用示例

文本嵌入模型 (Text Embedding Model) 调用示例

提示工程 (Prompts)

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

内存 (Memory)

索引 (Indexes)

链 (Chains)

代理 (Agents)

总结

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具