大模型、检索增强生成与智能体的应用及开发实践 | 极客日志

PythonAI算法

大模型、检索增强生成与智能体的应用及开发实践

综述由AI生成大模型（LLM）、检索增强生成（RAG）和智能体（Agent）是人工智能发展的关键技术。文章阐述了三者定义与层级关系，介绍了 LLM 的工程化实践如 GPTs 和 API，详细说明了 RAG 技术原理及向量数据库选型，并通过 Python 代码对比了不同嵌入模型在 Chroma 中的推理效果。此外，还探讨了智能体的概念、开发思想及与 LangChain 的集成方案，最后展望了具身智能与 AI 伦理挑战。

战神发布于 2025/2/6更新于 2026/6/1025 浏览

引言

随着人工智能技术的飞速发展，大型语言模型（LLM）、检索增强生成（RAG）和智能体（Agent）已经成为推动该领域进步的关键技术。这些技术不仅改变了我们与机器的交互方式，而且为各种应用和服务的开发提供了前所未有的可能性。正确理解这三者的概念及其之间的关系是做好面向 AI 编程开发的基础：

	大模型（LLM）	检索增强生成（RAG）	智能体（Agent）
定义	大型语言模型（LLM），如 GPT 系列、BERT 等，是利用大量文本数据训练的模型，能够生成连贯的文本、理解语言、回答问题等。	检索增强生成技术结合了传统的信息检索技术和最新的生成式模型。它先从一个大型的知识库中检索出与查询最相关的信息，然后基于这些信息生成回答。	智能体是指具有一定智能的程序或设备，能够感知环境并根据感知结果做出响应或决策的实体。它们可以是简单的软件程序或复杂的机器人。
作用	LLM 作为基础技术，提供了强大的语言理解和生成能力，是构建复杂人工智能系统的基石。	RAG 可以视为在 LLM 基础上的扩展或应用，利用 LLM 的生成能力和外部知识库的丰富信息来提供更准确、信息丰富的输出。	智能体可以利用 LLM 进行自然语言处理，通过 RAG 技术获得和利用知识，以在更广泛的环境中做出决策和执行任务。它们通常位于应用层级，是对 LLM 和 RAG 技术在特定环境下的集成和应用。

从层级关系上看，大模型（LLM）提供了基础的语言理解和生成能力。在此基础上，检索增强生成（RAG）技术利用这种能力结合特定的知识库来生成更为准确和相关的输出。智能体（Agent）则在更高层次上使用 LLM 和 RAG，结合自身的感知和决策能力，在各种环境中执行具体的任务。

因此，可以理解为 LLM 是基础，RAG 是在 LLM 基础上的进一步应用，而智能体则是综合运用 LLM 和 RAG 以及其他技术，在更复杂环境中进行交互和任务执行的实体。这种关系体现了从基础技术到应用技术再到实际应用的逐级深入。

随着技术的快速进步，如何更高效地利用这些大模型（LLM）来解决具体问题？如何通过检索增强生成（RAG）技术提高信息的准确性和相关性？以及如何设计能够有效集成 LLM、RAG 和其他 AI 技术的智能体？这些问题的解决，不仅需要深入理解这些技术的工作原理和应用场景，还需要探索它们之间的相互作用和集成方法。

大模型（LLM）的概念与工程化实践

大型语言模型（LLM），如 OpenAI 的 GPT 系列，是一种基于深度学习的自然语言处理技术。它们能够理解、生成、翻译文本，完成问答任务，甚至编写代码。这些模型通过在大规模文本数据上的预训练，学会了语言的复杂结构和丰富的知识，使其能够在没有明确指示的情况下执行各种语言任务。GPT 系列模型基于变换器（Transformer）架构，这是一种高效的深度学习模型结构，特别适合处理序列数据，如文本。变换器利用自注意力（self-attention）机制，能够捕捉文本中长距离的依赖关系，这对于理解和生成自然语言（NLG）至关重要。

目前，OpenAI 最新版本的 LLM 工程化应用是以 GPT-4 为基础的，针对普通用户有 3 个版本，分别是免费版本（只能使用 GPT-3.5）、Plus 版本以及团队版本（Plus 的功能加上团队协同工作管理）。每个月支付 20 美元（不含税）即可使用 Plus 版本，即 ChatGPT Plus，它的主要功能有：

Chat（对话）

与'OpenAI 最强大的模型 GPT-4'进行对话，不止是文本的交互生成，还可以同时进行基于 DALL-E 的图文交互生成，以及从互联网实时获取最新知识进行辅助分析和生成。

GPTs（插件）

如果你想将自己独有的指令、知识库或任何能力的 API 服务，同预训练的 GPT-4 LLM 结合在一起，创建一个'自定义模型'，那么，可以使用'GPTs'插件功能在 OpenAI 的 Web 应用上快速构建出来。GPTs 的推出体现了 OpenAI 与众不同的工程化创新能力，其交互设计理念值得我们借鉴。使用它的步骤可以参考如下这个例子：

告诉 GPT Builder 向导（实际上这也是一个官方的 GPTs）你要做什么，它会提示你可以这样说：'制作一个帮助生成新产品视觉效果的创意人'或'制作一个帮助我格式化代码的软件工程师'。
输入'创建一个物流系统的技术支持工程师，帮助商家解答系统问题和处理异常订单'，接下来 GPT Builder 会和你做一些简单的对话，比如征求你对于命名、Logo 的建议等等。
仅需要 2 轮简短对话，一个名为'小狗物流平台技术支持'的 GPTs 被初步创建出来了。生成的'Instructions'部分可以视为 GPT 的 System Prompt（系统提示），需要特别注意按照这 4 个维度修正 Instructions，直到其准确符合你的意图：1）定位，希望 GPTs 执行什么类型的任务；2）上下文，给 GPTs 提供一些额外的信息，比如垂直领域的常识，从而引导其给出更好的回答；3）输入数据，'限定'GPTs 引导用户提出的问题，确保不偏离主题；4）输出数据，'限定'GPTs 给出指定格式和范围的输出，确保不输出无关的内容。

相关免费在线工具

加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
RSA密钥对生成器
生成新的随机RSA私钥和公钥pem证书。在线工具，RSA密钥对生成器在线工具，online
Mermaid 预览与可视化编辑
基于 Mermaid.js 实时预览流程图、时序图等图表，支持源码编辑与即时渲染。在线工具，Mermaid 预览与可视化编辑在线工具，online
随机西班牙地址生成器
随机生成西班牙地址（支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选），支持数量快捷选择、显示全部与下载。在线工具，随机西班牙地址生成器在线工具，online
Gemini 图片去水印
基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印，支持批量处理与下载。在线工具，Gemini 图片去水印在线工具，online
curl 转代码
解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。在线工具，curl 转代码在线工具，online

	小模型	大模型
设计目标和用途	通常设计为特定任务的一部分，比如将单词、句子或文档转换为向量形式，这些向量随后用于各种任务（如聚类、相似度搜索等）。	为理解文本上下文并生成文本而设计的。可以直接用于生成文本、问答、提取摘要等任务。
模型规模和复杂性	往往相对简单，参数量少，专注于有效地将数据转换为嵌入向量。一般模型主体占用数百 MB 磁盘空间。	拥有极大的参数量（从几十亿到几百亿不等），设计更为复杂，可以捕获数据中的细微语义和结构。占用 TB 级磁盘空间（AI 估算）。
训练数据和过程	训练通常基于特定任务的数据集，目标是学习良好的数据表示。	通过在庞大的数据集上进行预训练，学习语言的广泛特征和模式，然后可以在特定任务上进行微调（fine-tuning）以提高性能。
在向量数据库中的应用	产生的向量直接用于向量数据库中，以支持快速的相似性检索和推理。	产生的向量可以用于向量数据库。但通常更注重捕捉丰富的语义信息，在需要深度理解的应用场景中作用更大。

import chromadb

basePath = "/dev/chromadbDemo/"

chroma_client = chromadb.PersistentClient(path=basePath + "chromadata")
print("数据库已启动：" + str(chroma_client))

# ——————————————————————准备数据——————————————————————

# 红楼梦（千字概述，正常风格）
file_path_hlm = basePath + "book_HLM.txt"
# 金瓶梅（千字概述，正常风格）
file_path_jpm = basePath + "book_JPM.txt"
# 水浒传（千字概述，无厘头风格）
file_path_shz = basePath + "book_SHZ.txt"
# 指环王（千字概述，莎士比亚风格）
file_path_zhw = basePath + "book_ZHW.txt"
docs = [
    open(file_path_hlm, "r", encoding="utf-8").read(),
    open(file_path_jpm, "r", encoding="utf-8").read(),
    open(file_path_shz, "r", encoding="utf-8").read(),
    open(file_path_zhw, "r", encoding="utf-8").read(),
    "不可以，早晨喝牛奶不科学",
    "吃了海鲜后是不能再喝牛奶的，因为牛奶中含得有维生素 C，如果海鲜喝牛奶一起服用会对人体造成一定的伤害",
    "吃海鲜是不可以吃柠檬的因为其中的维生素 C 会和海鲜中的矿物质形成砷",
    "吃海鲜是不能同时喝牛奶吃水果，这个至少间隔 6 小时以上才可以",
]
metas = [
    {"source": file_path_hlm, "uris": file_path_hlm, "author": "曹雪芹"},
    {"source": file_path_jpm, "uris": file_path_jpm, "author": "兰陵笑笑生"},
    {"source": file_path_shz, "uris": file_path_shz, "author": "施耐庵"},
    {"source": file_path_zhw, "uris": file_path_zhw, "author": "托尔金"},
    {"source": "my_source1"},
    {"source": "my_source2"},
    {"source": "my_source3"},
    {"source": "my_source4"},
]
ids = ["id-hlm", "id-jpm", "id-shz", "id-zhw", "id1", "id2", "id3", "id4"]

# ——————————————————————定义处理数据的函数——————————————————————

# 用于将文本输入转换为 Bert 嵌入向量，默认使用 bert-base-chinese 模型和分词器处理文本。
def bert_embedding(text, modelName="bert-base-chinese"):
    from transformers import BertModel, BertTokenizer

    tokenizer = BertTokenizer.from_pretrained(modelName)
    model = BertModel.from_pretrained(modelName)
    inputs = tokenizer(
        text, return_tensors="pt", padding=True, truncation=True, max_length=512
    )
    outputs = model(**inputs)
    embeddings = outputs.last_hidden_state[:, 0, :].detach().numpy()
    return embeddings

# 插入数据
def setData(collection, embedding=None):
    if embedding is None:
        collection.upsert(
            documents=docs,
            metadatas=metas,
            ids=ids,
        )
    else:
        collection.upsert(
            embeddings=embedding,
            documents=docs,
            metadatas=metas,
            ids=ids,
        )
    return collection

# 使用指定的嵌入模型建数据集，不指定则默认为：Sentence Transformers all-MiniLM-L6-v2
def getDefaultEmbeddingCollection(embeddingModelName=""):
    collection = chroma_client.get_or_create_collection(name="collection_default")
    if embeddingModelName is None or not embeddingModelName:
        # 默认的向量模型
        setData(collection)
    else:
        embedding = bert_embedding(docs, embeddingModelName)
        collection = setData(collection, embedding)
        collection.name = "collection_" + embeddingModelName
    return collection

# 使用 OpenAI 的 text-embedding-ada-002 模型建数据集
def getOpenAIEmbeddingCollection():
    import chromadb.utils.embedding_functions as embedding_functions

    openai_ef = embedding_functions.OpenAIEmbeddingFunction(
        api_key="[填入你的 OpenAI API Key]",
        model_name="text-embedding-ada-002",
    )
    collection = chroma_client.get_or_create_collection(
        name="collection_text-embedding-ada-002", embedding_function=openai_ef
    )
    setData(collection)
    return collection

collections = chroma_client.list_collections()
print("现有数据集：" + str(collections))

# 三个问题，用来测试不同数据集和向量模型的推理能力
q1 = "我想了解中国四大名著"
q2 = "关于宋朝发生的故事"
q3 = "吃完海鲜可以喝牛奶吗?"

def testModel(collection, q, rtNum, embeddingModelName=None):
    if embeddingModelName is None:
        results = collection.query(query_texts=[q], n_results=rtNum)
        print(q + " - 查询结果：" + str(results) + "\n")
    else:
        results = collection.query(
            query_embeddings=bert_embedding(q, embeddingModelName), n_results=rtNum
        )
        print(q + " - 查询结果：" + str(results) + "\n")

modelName = "bert-base-chinese"
collection = getDefaultEmbeddingCollection(modelName)

print("当前 collection：" + str(collection) + "\n")
testModel(collection, q1, 2) #问题 1 返回 2 笔推理结果
testModel(collection, q2, 3) #问题 2 返回 3 笔推理结果
testModel(collection, q3, 5) #问题 3 返回 5 笔推理结果

当前 collection：name='collection_bert-base-chinese' id=UUID('d0fe761d-3e64-4b89-ab8a-59a7253d44a7') metadata=None tenant='default_tenant' database='default_database'

我想了解中国四大名著 - 查询结果：{'ids': [['id1', 'id4']], 'distances': [[202.48262633262166, 266.160556742396]], 'metadatas': [[{'source': 'my_source1'}, {'source': 'my_source4'}]], 'embeddings': None, 'documents': [['不可以，早晨喝牛奶不科学', '吃海鲜是不能同时喝牛奶吃水果，这个至少间隔 6 小时以上才可以']], 'uris': None, 'data': None}

关于宋朝发生的故事 - 查询结果：{'ids': [['id1', 'id3', 'id4']], 'distances': [[253.08461381250856, 300.2129506027819, 334.78790699255]], 'metadatas': [[{'source': 'my_source1'}, {'source': 'my_source3'}, {'source': 'my_source4'}]], 'embeddings': None, 'documents': [['不可以，早晨喝牛奶不科学', '吃海鲜是不可以吃柠檬的因为其中的维生素 C 会和海鲜中的矿物质形成砷', '吃海鲜是不能同时喝牛奶吃水果，这个至少间隔 6 小时以上才可以']], 'uris': None, 'data': None}

吃完海鲜可以喝牛奶吗？- 查询结果：{'ids': [['id1', 'id2', 'id4', 'id3', 'id-hlm']], 'distances': [[
  173.57739555949934, 
  201.32507459764457, 
  202.22220711154088, 
  261.7239443921094, 
  452.04586252776966]], 'metadatas': [[{'source': 'my_source1'}, {'source': 'my_source2'}, {'source': 'my_source4'}, {'source': 'my_source3'}, {'author': '曹雪芹', 'source': '/dev/chromadbDemo/book_HLM.txt', 'uris': '/dev/chromadbDemo/book_HLM.txt'}]], 'embeddings': None, 'documents': [[
  '不可以，早晨喝牛奶不科学', 
  '吃了海鲜后是不能再喝牛奶的，因为牛奶中含得有维生素 C，如果海鲜喝牛奶一起服用会对人体造成一定的伤害', 
  '吃海鲜是不能同时喝牛奶吃水果，这个至少间隔 6 小时以上才可以', 
  '吃海鲜是不可以吃柠檬的因为其中的维生素 C 会和海鲜中的矿物质形成砷', 
  '《红楼梦》是清代曹雪芹创作的一部长篇小说，被誉为中国古代四大名著之一。该作品通过贾、王、史、薛四大家族的兴衰史，细腻地描绘了封建王朝末期的社会生活，深刻揭示了封建社会的腐朽与衰败……此处省略 1000 字'
]], 'uris': None, 'data': None}

collection = getOpenAIEmbeddingCollection()

print("当前 collection：" + str(collection) + "\n")
testModel(collection, q1, 2) #问题 1 返回 2 笔推理结果
testModel(collection, q2, 3) #问题 2 返回 3 笔推理结果
testModel(collection, q3, 5) #问题 3 返回 5 笔推理结果

当前 collection：name='collection_text-embedding-ada-002' id=UUID('ec450ccf-835b-4bfb-ab2b-f4bde881cb06') metadata=None tenant='default_tenant' database='default_database'

我想了解中国四大名著 - 查询结果：{'ids': [['id-hlm', 'id-jpm']], 'distances': [[
  0.38686231602994325, 
  0.401715835018107]], 'metadatas': [[{'author': '曹雪芹', 'source': '/dev/chromadbDemo/book_HLM.txt', 'uris': '/dev/chromadbDemo/book_HLM.txt'}, {'author': '兰陵笑笑生', 'source': '/dev/chromadbDemo/book_JPM.txt', 'uris': '/chromadbDemo/book_JPM.txt'}]], 'embeddings': None, 'documents': [[
  '《红楼梦》是清代曹雪芹创作的一部长篇小说，被誉为中国古代四大名著之一。该作品通过贾、王、史、薛四大家族的兴衰史，细腻地描绘了封建王朝末期的社会生活，深刻揭示了封建社会的腐朽与衰败。小说以贾宝玉和林黛玉的爱情悲剧为主线，通过丰富的人物群像和错综复杂的情节展现了一个广阔的社会生活画卷……此处省略 1000 字', 
  '《金瓶梅》是中国文学史上的一部重要小说，被认为是明代中期的作品，作者一般被认为是兰陵笑笑生。这部小说以宋代开封为背景，详细描绘了主人公西门庆与他的家人、情人、朋友之间的复杂关系，以及由此引发的一系列社会和家庭冲突……此处省略 1000 字']], 'uris': None, 'data': None}

关于宋朝发生的故事 - 查询结果：{'ids': [['id-shz', 'id-jpm', 'id-zhw']], 'distances': [[
  0.322985944455922, 
  0.3312445684997755, 
  0.33733609769548206]], 'metadatas': [[{'author': '施耐庵', 'source': '/dev/chromadbDemo/book_SHZ.txt', 'uris': '/dev/chromadbDemo/book_SHZ.txt'}, {'author': '兰陵笑笑生', 'source': '/dev/chromadbDemo/book_JPM.txt', 'uris': '/dev/chromadbDemo/book_JPM.txt'}, {'author': '托尔金', 'source': '/dev/chromadbDemo/book_ZHW.txt', 'uris': '/dev/chromadbDemo/book_ZHW.txt'}]], 'embeddings': None, 'documents': [[
  '水浒传，一本让人眼花缭乱的古典名著，故事内容丰富得可以用来炒一大锅剧情泡面。整个故事发生在北宋时期，可以想象成一个古代的超级英雄联盟，但这些英雄不穿紧身衣，而是穿着古代汉服，横扫江湖，打击不公……此处省略 1000 字', 
  '《金瓶梅》是中国文学史上的一部重要小说，被认为是明代中期的作品，作者一般被认为是兰陵笑笑生。这部小说以宋代开封为背景，详细描绘了主人公西门庆与他的家人、情人、朋友之间的复杂关系，以及由此引发的一系列社会和家庭冲突……此处省略 1000 字', 
  '在中世纪幻想的土地，被称为中土的地方，诞生了一部伟大的故事——《指环王》。这部史诗般的作品，如同莎士比亚之笔下的戏剧，充满了权力的争斗、勇气的考验、忠诚与背叛的较量，以及对自由与爱的无尽追求。\n\n噢，听吧，那遥远的号角在召唤，就如同命运之神在低语，引领我们走向那个被称为'魔戒'的强大而又可怕的物品……此处省略 1000 字']], 'uris': None, 'data': None}

吃完海鲜可以喝牛奶吗？- 查询结果：{'ids': [['id2', 'id4', 'id3', 'id1', 'id-shz']], 'distances': [[
  0.18699816057051363, 
  0.2437766582633824, 
  0.3233349839279665, 
  0.33243019058071627, 
  0.5406020260719162]], 'metadatas': [[{'source': 'my_source2'}, {'source': 'my_source4'}, {'source': 'my_source3'}, {'source': 'my_source1'}, {'author': '施耐庵', 'source': '/dev/chromadbDemo/book_SHZ.txt', 'uris': '/dev/chromadbDemo/book_SHZ.txt'}]], 'embeddings': None, 'documents': [[
  '吃了海鲜后是不能再喝牛奶的，因为牛奶中含得有维生素 C，如果海鲜喝牛奶一起服用会对人体造成一定的伤害', 
  '吃海鲜是不能同时喝牛奶吃水果，这个至少间隔 6 小时以上才可以', 
  '吃海鲜是不可以吃柠檬的因为其中的维生素 C 会和海鲜中的矿物质形成砷', 
  '不可以，早晨喝牛奶不科学', 
  '水浒传，一本让人眼花缭乱的古典名著，故事内容丰富得可以用来炒一大锅剧情泡面。整个故事发生在北宋时期，可以想象成一个古代的超级英雄联盟，但这些英雄不穿紧身衣，而是穿着古代汉服，横扫江湖，打击不公……此处省略 1000 字']], 'uris': None, 'data': None}

大模型、检索增强生成与智能体的应用及开发实践

引言

大模型（LLM）的概念与工程化实践

Chat（对话）

GPTs（插件）

更多推荐文章

相关免费在线工具

API（开放接口）

检索增强生成（RAG）技术概述和应用

什么是检索增强生成

为什么是向量数据库

举个例子

智能体（Agent）的概念、应用和集成

智能体的概念和开发思想

举个例子

集成大模型、RAG 和智能体的方法和场景

未来展望与挑战

更多推荐文章

相关免费在线工具

大模型、检索增强生成与智能体的应用及开发实践

引言

大模型（LLM）的概念与工程化实践

Chat（对话）

GPTs（插件）

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

API（开放接口）

检索增强生成（RAG）技术概述和应用

什么是检索增强生成

为什么是向量数据库

举个例子

智能体（Agent）的概念、应用和集成

智能体的概念和开发思想

举个例子

集成大模型、RAG 和智能体的方法和场景

未来展望与挑战

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具