大模型技术名词与概念学习笔记：架构、Prompt 与推理

构建 AI 化需要的知识体系

Semantic Kernel

Semantic Kernel 是 Microsoft 推出的一个开源框架，旨在帮助开发者构建和部署 AI 应用，特别是那些需要理解和生成自然语言的应用。它提供了一种结构化的方式来定义和管理技能（Skills），这些技能可以是简单的函数调用，也可以是复杂的 AI 模型交互。

核心组件

Kernel: Semantic Kernel 的核心，负责技能的管理和执行。
Skills: 定义了应用可以执行的一系列操作，可以是本地函数，也可以是远程服务调用。
Prompt Templates: 用于生成和修改自然语言的模板，支持变量和函数调用。
Memory: 提供了存储和检索应用状态的能力，可以是简单的键值对，也可以是复杂的图数据库。

LangChain

LangChain 是一个开源框架，专注于构建应用，这些应用可以利用大型语言模型（LLMs）来执行各种任务，如回答问题、生成文本、执行代码等。它提供了一种灵活的方式来组合和调用不同的 LLMs，以及管理与这些模型的交互。

核心组件

Chains: 定义了模型调用的逻辑流程，可以是简单的单步调用，也可以是复杂的多步流程。
Prompts: 用于指导模型生成特定类型输出的模板。
Memory: 提供了存储和检索应用状态的能力，可以用于上下文理解和历史记录。
Agents: 可以自动执行任务的实体，基于给定的目标和约束。

总结

Semantic Kernel 和 LangChain 都是为了简化 AI 应用的开发，但它们的侧重点不同。Semantic Kernel 更注重技能的定义和管理，而 LangChain 则更侧重于大型语言模型的组合和调用。选择哪个框架取决于具体的应用场景和需求。在资源受限或需要快速迭代的场景下，Semantic Kernel 的轻量化特性可能更具优势；而在需要复杂编排和丰富生态集成的场景中，LangChain 则更为合适。

大模型的应用架构

典型的业务架构

大模型应用通常遵循分层架构设计，包括数据层、模型层、应用层和交互层。数据层负责知识库和向量存储；模型层处理推理和微调；应用层实现业务逻辑；交互层提供用户接口。

技术架构

纯 Prompt

就像和一个人对话，你说一句，ta 回一句，你再说一句，ta 再回一句。这种方式依赖模型本身的预训练知识，无需额外工具，适合简单问答。

Agent + FC (Function Calling)

Agent: AI 主动提要求。
Function Calling: AI 要求执行某个函数。 场景举例: 你问过年去哪玩，ta 先反问你有几天假，然后调用天气 API 查询目的地天气。

RAG (Retrieval-Augmented Generation)

RAG = Embeddings + 向量数据库。

Embeddings: 把文字转换为更易于相似度计算的编码。这种编码叫向量。
向量数据库: 把向量存起来，方便查找。
向量搜索: 根据输入向量，找到最相似的向量。 场景举例: 考试时，看到一道题，到书上找相关内容，再结合题目组成答案。目前我们还使用了 rerank model 对 RAG 的结果进行重排序，使得得到更精准的答案。

Fine-Tuning

努力学习考试内容，长期记住，活学活用。目前传统的 FT 对于在运维体系中，特别是抽象对象的训练达不到一个很好的效果，所以我们也在尝试基于 DeepKe 的抽象方式做运维体系中的数据、文本做 FT，看是不是能把抽象的对象直接关系能理解清楚。

大模型技术名词与概念学习笔记：架构、Prompt 与推理

构建 AI 化需要的知识体系

Semantic Kernel

核心组件

LangChain

核心组件

总结

大模型的应用架构

典型的业务架构

技术架构

纯 Prompt

Agent + FC (Function Calling)

RAG (Retrieval-Augmented Generation)

Fine-Tuning

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

Prompt 的工程：提升 LLM 理解与响应能力

Prompt 设计原则

具体实现的方式

1. 把话说详细

2. 让模型充当某个角色

3. 使用分隔符清楚地指示输入的不同部分

4. 指定完成任务所需的步骤

5. 提供例子

6. 指定所输出长度

提示框架应用

TAG 框架

SPAR 框架

TRACE 框架

SCOPE 框架

APE 框架

SAGE 框架

RTF 框架

ROSES 模型

CARE 框架

让 LLM 理解逻辑推理：从 CoT 到 ReAct

CoT (Chain-of-Thought Prompting) 思维链

Auto-CoT 自动思维链

TOT (Tree of Thought) 思维树

ReAct (Retrieval-Augmented Generation for Thinking and Acting)

运维场景应用

安全与评估考量

安全性

评估指标

结语

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具