跳到主要内容
极客日志极客日志面向AI+效率的开发者社区
首页博客GitHub 精选镜像工具UI配色美学隐私政策关于联系
搜索内容 / 工具 / 仓库 / 镜像...⌘K搜索
注册
博客列表
编程语言AI算法

AI 核心概念解析:从 LLM 到 Agent 的演进逻辑

综述由AI生成梳理了 AI 领域的核心概念,包括大语言模型(LLM)、提示词(Prompt)、上下文(Context)、记忆(Memory)、智能体(Agent)、检索增强生成(RAG)、函数调用(Function Calling)、模型上下文协议(MCP)、技能(Skill)及子智能体(Sub-Agent)。文章通过比喻和流程图解释了各概念的定义、关系及应用场景,指出 Agent 本质是固定程序与模糊逻辑的结合,并总结了未来技术向便捷化发展的趋势。

苹果系统发布于 2026/4/5更新于 2026/5/2332 浏览

AI 核心概念解析

这些术语你了解多少?本文旨在厘清 AI 领域的关键概念。所谓智能体,本质上是由多个无需独立智能的模块组合而成;许多新概念不过是旧技术的重新包装。

涉及关键词: LLM, Prompt, Context, Memory, Agent, RAG, Function Calling, MCP, Skill, Sub-Agent

第一步:语言模型的发展

一切混乱的起点是语言模型。早期的模型功能受限,主要进行简单的文字接龙。但随着参数规模不断膨胀,在某个临界点,它涌现出了真正的智能。

为了区分早期模型,我们在前面加了个'大'字:

词汇① 大语言模型(LLM)

LLM 本质上只做一件事:根据上文,预测下一个字。如果只是这么用,它的表现仍然有限。

小模型(功能受限阶段)
    |
参数不断增大
    |
大语言模型 LLM(涌现出智能)
把 LLM 想象成你的员工

把自己想象成一个老板,LLM 是你的员工,就叫他「小 L」。小 L 服务你的方式很特别:只能一问一答,问完就结束,不能追问。这个特点非常关键。

你们每次的对话,你给它起了个洋气的名字:

词汇② Prompt(提示词)

仔细观察每次对话,你发现里面的内容可以细分:有的是背景信息,有的是最终指令。于是背景信息那部分,你单独起名叫:

词汇③ Context(上下文)

第二步:让小 L 记住你

问题来了:小 L 只能一问一答,如何追问?

你想了个聪明的办法——把历史对话塞进 Context,每次提问前带上之前的所有交流记录,伪装成连续对话。

词汇④ Memory(记忆)

随着对话越来越长,Memory 会越来越大,占用大量上下文空间。于是你又让 LLM 对历史记录进行压缩总结,减少长度,提高效率。

追加到
你的第 N 次问题(Prompt)
    |
📦 拼装后发给 LLM
    |
历史对话记录(Memory / Context)
    |
小 L 回答

小结: 到目前为止,你已经发明了 4 个新词:LLM, Prompt, Context, Memory。一个原本只会词语接龙的小 L,现在已经可以进行有记忆的连续对话了。

第三步:给小 L 配上工具

你很快发现小 L 有个致命缺陷:它不会上网查资料,给的信息要么过时,要么是瞎编的。

最简单的解法是:你帮它查,查完再告诉它。但这样一来,到底谁是执行者?

于是你把'上网搜索'这个动作写成了一段程序,让程序替你跑腿,自动完成搜索然后把结果喂给小 L。

词汇⑤ Agent(智能体)

⚠️ 别被这个名字唬住。早期很多所谓'智能体',实现逻辑不过是多加了一段 Prompt 而已——换个名字就敢叫智能体,略显夸大。

RAG:让 Agent 搜索本地文档

既然 Agent 能联网搜索,那搜索本地文档、数据库是不是也可以?当然,只不过要用向量数据库做语义匹配,把语义相近的内容片段找出来,再塞进 Context 里。

这套方法叫做:

词汇⑥ RAG(检索增强生成,Retrieval-Augmented Generation)

联网搜索只是 RAG 的一个变种,本质都是「获取模型参数之外的信息」。

用户(你)
    |
Agent 程序(传话筒)
    |
LLM 小 L(只会说话的智者)
    |
联网搜索 / 本地文档 RAG / 其他工具...

第四步:约定暗语,接入工具

Function Calling:Agent 和 LLM 的约定

Agent 和 LLM 之间通过自然语言沟通,有个问题:程序读不懂 LLM 随意输出的文字。于是双方需要约定一个格式(比如 JSON),让 LLM 按指定格式回复,这样 Agent 才能直接解析。

词汇⑦ Function Calling(函数调用协议)

就像前后端开发约定接口格式一样,没有任何神秘之处。

MCP:Agent 和工具服务的约定

如果把各种工具写成独立的服务,Agent 就需要一套标准来「发现」和「调用」这些服务——比如约定 tools/list 返回工具列表、tools/call 执行具体工具。

词汇⑧ MCP(模型上下文协议,Model Context Protocol)

Function CallingMCP
连接对象Agent ↔ LLMAgent ↔ 工具服务
解决问题让 LLM 按固定格式输出标准化工具的发现与调用
类比前后端接口约定微服务调用规范

⚠️ 常见混淆: 有人问「MCP 能取代 Function Calling 吗?」这是误解——两者根本不在同一层,解决的也不是同一个问题。

自然语言
    |
Function Calling (JSON 格式约定)
    |
MCP (工具调用协议)
    |
用户 -> Agent -> LLM -> 工具服务 (搜索/文件/数据库…)

第五步:流程固化,各显神通

假设你有个稳定任务:英文 PDF → 翻译 → 保存为 Markdown。每次都让 Agent 自由发挥?不但结果不稳定,还白白浪费 Token。更好的做法是把流程固化。

四种方式,从刚性到柔性
  • LangChain: 纯编程 / 硬编码,最稳定
  • Workflow: 低代码拖拽,门槛低一点
  • Skill: 脚本 + 说明文档,半自动
  • 纯 Agent: 完全自主,最灵活但最难控
方式特点适合谁
LangChain硬编码,极其稳定,几乎无容错程序员
Workflow低代码拖拽,改起来方便一点半技术用户
Skill说明文档 + 可调用脚本,兼顾稳定与弹性普通用户
纯 Agent完全自主,随机应变,费 Token 难预测对结果要求宽松时
Skill 是什么?

Skill 的核心就一个文件:SKILL.md,里面写清楚流程说明,并指向可调用的脚本目录。Agent 被要求在执行任务前先读这份说明,再按需调用脚本。

词汇⑨ Skill(智能体技能)

本质上,Skill 就是一个「把 Prompt 换个地方存」的加载器。

⚠️ 有人问「Skill 和 MCP 有什么区别?」答:完全不是一个维度的东西。Skill 是 Prompt 加载器,MCP 是工具调用协议,两者不存在谁取代谁的问题。

第六步:套娃——Sub-Agent

当任务足够复杂,单个 Agent 的上下文会变得极其庞大。于是你把相对独立的子任务拆出去,交给专门的子 Agent 处理。

词汇⑩ Sub-Agent(子智能体)

子 Agent 产生的上下文不会污染主 Agent,本质上就是上下文隔离,如此而已。

主 Agent
    |
    ├── Sub-Agent A (子任务 1) -> 结果
    ├── Sub-Agent B (子任务 2) -> 结果
    └── Sub-Agent C (子任务 3) -> 结果

你一共发明了多少新词?

#中文英文一句话概括
①大语言模型LLM参数足够大后涌现出智能的语言模型
②提示词Prompt你和 LLM 每次对话的完整输入
③上下文ContextPrompt 中的背景信息部分
④记忆Memory塞进 Context 的历史对话记录
⑤智能体Agent代替你跑腿、调用工具的中间程序
⑥检索增强生成RAG把外部检索到的信息塞进 Context
⑦函数调用协议Function CallingAgent 和 LLM 之间的格式约定
⑧模型上下文协议MCPAgent 和工具服务之间的调用规范
⑨智能体技能SkillPrompt 加载器,兼顾灵活与可控
⑩子智能体Sub-Agent隔离上下文的独立子任务处理器

通杀所有新概念的方法论

回到最本质的问题:为什么说「Agent 是由所有不需要智能的部分构成的」?

一个流程中,所有能用固定程序解决、不需要问 LLM 的地方,就是 Agent 发挥作用的地方。模糊的分流逻辑交给 LLM,确定的执行逻辑交给程序。

所有这些技术——Search、RAG、Skill……本质上都在做同一件事:

自动往 Prompt 里塞上下文,或者通过代理减少你和 LLM 直接沟通的次数。

看透这一点,任何新概念出来,你只需要问两个问题:

  1. 它是在帮 LLM 获取更多信息?(→ 属于 RAG / Search 这条线)
  2. 它是在替代某段固定的程序逻辑?(→ 属于 Agent / Workflow 这条线)
未来会怎样?

方便性永远胜出。 Token 会越来越便宜,配置门槛会越来越低。未来一定会有开箱即用的超级 Agent,把 MCP、Skill、Workflow 统统内置好,普通人啥都不用配置就能上手。

谁让用户觉得「它就是个会干活的 AI」,而不是「一堆需要折腾的配置」,谁就赢了。

下次再看到新名词,别慌,顺着这条故事线找它的位置,瞬间秒懂。

目录

  1. AI 核心概念解析
  2. 第一步:语言模型的发展
  3. 把 LLM 想象成你的员工
  4. 第二步:让小 L 记住你
  5. 第三步:给小 L 配上工具
  6. RAG:让 Agent 搜索本地文档
  7. 第四步:约定暗语,接入工具
  8. Function Calling:Agent 和 LLM 的约定
  9. MCP:Agent 和工具服务的约定
  10. 第五步:流程固化,各显神通
  11. 四种方式,从刚性到柔性
  12. Skill 是什么?
  13. 第六步:套娃——Sub-Agent
  14. 你一共发明了多少新词?
  15. 通杀所有新概念的方法论
  16. 未来会怎样?
  • 💰 8折买阿里云服务器限时8折了解详情
  • Magick API 一键接入全球大模型注册送1000万token查看
  • 🤖 一键搭建Deepseek满血版了解详情
  • 一键打造专属AI 智能体了解详情
极客日志微信公众号二维码

微信扫一扫,关注极客日志

微信公众号「极客日志V2」,在微信中扫描左侧二维码关注。展示文案:极客日志V2 zeeklog

更多推荐文章

查看全部
  • 2026 年 1 月主流远程桌面工具横向评测与选型建议
  • Stable Diffusion 与 Z-Image-Turbo 快速搭建与效果对比方案
  • JSP、MVC、EL、JSTL 核心技术笔记
  • faster-whisper 全链路优化解析与部署实战
  • Git 基础:认识三大区域与文件修改提交流程
  • VR 大空间项目内容规划与设计:2023-2026 市场实战复盘
  • C++ 类完全指南:从基础到实践
  • Stable Diffusion 3.5 LoRA 微调指南
  • Z-Image Turbo 本地部署与使用指南
  • 基于 DeepSeek 的贪吃蛇游戏开发实战
  • MambaRefine-YOLO:一种用于无人机影像的双模态小目标检测器
  • DooTask 升级指南:解锁 AI 新功能
  • Python Msgpack:高效二进制序列化库
  • Java 对象的序列化和反序列化
  • 基于 AI 辅助的生鲜配送系统快速开发实践
  • C++ 运算符重载:自定义类型的运算扩展
  • C++ 实现电子词典系统
  • DSO.ai:基于 AI 的搜索优化型 EDA 工具介绍
  • Git 报错 error: src refspec main does not match any 解决方案
  • 小模型思维链(CoT)能力微调与优化实践

相关免费在线工具

  • 加密/解密文本

    使用加密算法(如AES、TripleDES、Rabbit或RC4)加密和解密文本明文。 在线工具,加密/解密文本在线工具,online

  • RSA密钥对生成器

    生成新的随机RSA私钥和公钥pem证书。 在线工具,RSA密钥对生成器在线工具,online

  • Mermaid 预览与可视化编辑

    基于 Mermaid.js 实时预览流程图、时序图等图表,支持源码编辑与即时渲染。 在线工具,Mermaid 预览与可视化编辑在线工具,online

  • 随机西班牙地址生成器

    随机生成西班牙地址(支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选),支持数量快捷选择、显示全部与下载。 在线工具,随机西班牙地址生成器在线工具,online

  • Gemini 图片去水印

    基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印,支持批量处理与下载。 在线工具,Gemini 图片去水印在线工具,online

  • Base64 字符串编码/解码

    将字符串编码和解码为其 Base64 格式表示形式即可。 在线工具,Base64 字符串编码/解码在线工具,online