AI 核心概念解析:AIGC、RAG、Agent 与 MCP
随着 AI 技术发展迅猛,大语言模型(LLM)、AIGC、多模态、RAG、Agent、MCP 等各种相关概念层出不穷,极易混淆。作为技术科普,本文梳理其中的关系。
AIGC
单模态
我们大部分人都是从 ChatGPT 问世开始接触 AI 的。刚开始用 ChatGPT 的时候,体验的其实是一种文生文的能力。比如输入一句话,模型生成一段文字回应。这种让 AI 自动生成内容的能力,就叫做AIGC。
AIGC(Artificial Intelligence Generated Content)——生成式人工智能,是指基于生成对抗网络、大型预训练模型等人工智能的技术方法,通过已有数据的学习和识别,以适当的泛化能力生成相关内容的技术。
用大白话说就是:用 AI 自动生成'人类常干的活'。

在最初的时候,AIGC 只能处理一种类型的内容,比如 GPT-3 只懂文字,SD 只会画画,这种模式就被称之为单模态。
多模态
随着 AI 进化,支持文生图、图生文、文生视频等,被称为多模态。这些多模态模型,才是真正让 AI 从工具进化成助手的关键。

AIGC 不管单模态还是多模态,有两个天生的限制:
- 不具备实时性:LLM 是离线训练的,一旦训练完成后,无法获得新的信息。
- 不会使用工具:最初的 AIGC 只可以从现在的知识库中获取内容,而不会查询最新的信息,也不能调用 API。
因此,这就引出了两个技术方向,一个叫RAG,一个叫Function Call。
RAG 技术
RAG(Retrieval-Augmented Generation,检索增强生成)技术,结合了信息检索和生成式语言模型的能力,以提高响应的准确性和相关性。
核心思想:当 LLM 需要回答一个问题时,不是仅依赖内部训练知识,而是先从一个外部知识库中检索出相关的信息片段,然后将这些信息与原始问题一起提供给 LLM,让 LLM 基于这些最新、最相关的上下文信息来生成更准确的答案。
通俗地讲,原来模型靠死记硬背,现在它成了会'看资料答题'的开卷考试了。

