LLM 大模型核心技术笔记：架构、提示工程与推理框架详解

构建 AI 化需要的知识体系

Semantic Kernel

Semantic Kernel 是 Microsoft 推出的一个开源框架，旨在帮助开发者构建和部署 AI 应用，特别是那些需要理解和生成自然语言的应用。它提供了一种结构化的方式来定义和管理技能（Skills），这些技能可以是简单的函数调用，也可以是复杂的 AI 模型交互。

核心组件

Kernel: Semantic Kernel 的核心，负责技能的管理和执行，充当连接不同组件的枢纽。
Skills: 定义了应用可以执行的一系列操作，可以是本地函数，也可以是远程服务调用，支持 C#、Python 等多种语言。
Prompt Templates: 用于生成和修改自然语言的模板，支持变量注入和函数调用，允许动态调整提示词。
Memory: 提供了存储和检索应用状态的能力，可以是简单的键值对，也可以是复杂的图数据库或向量存储，用于实现上下文记忆。

LangChain

LangChain 是一个开源框架，专注于构建应用，这些应用可以利用大型语言模型（LLMs）来执行各种任务，如回答问题、生成文本、执行代码等。它提供了一种灵活的方式来组合和调用不同的 LLMs，以及管理与这些模型的交互。

核心组件

Chains: 定义了模型调用的逻辑流程，可以是简单的单步调用，也可以是复杂的多步流程，支持链式调用和条件分支。
Prompts: 用于指导模型生成特定类型输出的模板，支持多种格式和变量替换机制。
Memory: 提供了存储和检索应用状态的能力，可以用于上下文理解和历史记录，支持多种内存策略如缓冲、摘要等。
Agents: 可以自动执行任务的实体，基于给定的目标和约束，能够自主决定调用哪些工具或 API。

总结

Semantic Kernel 和 LangChain 都是为了简化 AI 应用的开发，但它们的侧重点不同。Semantic Kernel 更注重技能的定义和管理，强调与企业现有系统的集成；而 LangChain 则更侧重于大型语言模型的组合和调用，生态更为丰富。选择哪个框架取决于具体的应用场景和需求。在我们的场景里我们更多的是考虑使用 Semantic Kernel 的方式来构建，不是说 LangChain 不好，只是 LangChain 的代码侧抽象的东西太厉害，本身架构也比较重，对于后期开发的运维和迭代成本比较高，我们现在的体量还太小，感觉自身玩不太动。

大模型的应用架构

典型的业务架构

在业务层面，AI 应用通常分为感知层、决策层和执行层。感知层负责理解用户输入和外部环境数据；决策层利用 LLM 进行逻辑推理和规划；执行层负责调用外部工具完成具体任务。

技术架构

纯 Prompt

就像和一个人对话，你说一句，ta 回一句，你再说一句，ta 再回一句。这种方式最简单，但缺乏持久性和工具调用能力，适用于简单的问答场景。

Agent + FC (Function calling)

Agent: AI 主动提要求，根据当前状态决定下一步行动。
Function Calling: AI 要求执行某个函数，将自然语言指令转化为结构化参数调用后端 API。
场景举例: 你问过年去哪玩，ta 先反问你有几天假，然后查询天气 API 推荐目的地。

RAG (Baseline) = Embeddings + 向量数据库

Embeddings: 把文字转换为更易于相似度计算的编码。这种编码叫向量，能够捕捉语义信息。
向量数据库: 把向量存起来，方便查找，支持高维数据的快速索引。
向量搜索: 根据输入向量，找到最相似的向量，返回相关文档片段。

LLM 大模型核心技术笔记：架构、提示工程与推理框架详解