AI 核心概念解析：AIGC、RAG、Agent 与 MCP

随着 AI 技术发展迅猛，大语言模型（LLM）、AIGC、多模态、RAG、Agent、MCP 等各种相关概念层出不穷，极易混淆。作为技术科普，本文梳理其中的关系。

我们大部分人都是从 ChatGPT 问世开始接触 AI 的。刚开始用 ChatGPT 的时候，体验的其实是一种文生文的能力。比如输入一句话，模型生成一段文字回应。这种让 AI 自动生成内容的能力，就叫做AIGC。

AIGC（Artificial Intelligence Generated Content）——生成式人工智能，是指基于生成对抗网络、大型预训练模型等人工智能的技术方法，通过已有数据的学习和识别，以适当的泛化能力生成相关内容的技术。

用大白话说就是：用 AI 自动生成'人类常干的活'。

AIGC 单模态示意图

在最初的时候，AIGC 只能处理一种类型的内容，比如 GPT-3 只懂文字，SD 只会画画，这种模式就被称之为单模态。

随着 AI 进化，支持文生图、图生文、文生视频等，被称为多模态。这些多模态模型，才是真正让 AI 从工具进化成助手的关键。

AIGC 多模态示意图

AIGC 不管单模态还是多模态，有两个天生的限制：

因此，这就引出了两个技术方向，一个叫RAG，一个叫Function Call。

RAG（Retrieval-Augmented Generation，检索增强生成）技术，结合了信息检索和生成式语言模型的能力，以提高响应的准确性和相关性。

核心思想：当 LLM 需要回答一个问题时，不是仅依赖内部训练知识，而是先从一个外部知识库中检索出相关的信息片段，然后将这些信息与原始问题一起提供给 LLM，让 LLM 基于这些最新、最相关的上下文信息来生成更准确的答案。

通俗地讲，原来模型靠死记硬背，现在它成了会'看资料答题'的开卷考试了。

更多推荐文章