一、前言
随着人工智能技术的迅猛发展,大语言模型(LLM)、AIGC、多模态、RAG、Agent、MCP 等概念层出不穷,极易混淆。作为技术科普,本文旨在厘清这些核心概念之间的关系,帮助大家建立清晰的技术认知框架。
二、AIGC
2.1 单模态
大众对 AI 的接触大多始于 ChatGPT。初期体验主要是文生文能力:输入提示词(Prompt),模型生成文字回应。无论是写代码还是撰写文章,本质都是让 AI 根据输入自动生成内容,这就是AIGC。
AIGC(Artificial Intelligence Generated Content)——生成式人工智能,是指基于生成对抗网络、大型预训练模型等技术方法,通过已有数据的学习和识别,以适当的泛化能力生成相关内容的技术。其核心思想是利用人工智能算法生成具有一定创意和质量的内容。
简单来说,就是利用 AI 自动化处理人类常规工作。早期 AIGC 通常只能处理单一类型内容,例如 GPT-3 专注文本,Stable Diffusion 专注图像,这种模式被称为单模态。

2.2 多模态
随着技术演进,AI 不再局限于文本。文生图、图生文、文生视频、图生视频等功能逐渐普及,支持多种类型消息交互的模型被称为多模态。这标志着 AI 从单纯的工具向智能助手进化。

无论单模态还是多模态,AIGC 存在两个天然限制:
- 不具备实时性:LLM 基于离线训练,无法获取训练数据截止时间后的新信息,难以回答最新事件。
- 不会使用工具:传统 AIGC 仅能访问内部知识库,无法查询外部实时信息或调用 API。
针对这两点,衍生出了RAG和Function Call两个技术方向。
2.3 RAG 技术
RAG(Retrieval-Augmented Generation,检索增强生成)结合了信息检索和生成式语言模型的能力,旨在提高响应的准确性和相关性。
核心思想:当 LLM 需要回答问题时,不单纯依赖内部记忆,而是先从外部知识库检索相关信息片段,将检索结果与原始指令一同输入模型,使其基于最新、最相关的上下文生成答案。
通俗理解:模型从'死记硬背'变成了'开卷考试',参考资料后作答更准确可靠。
三、总结
AIGC 是基础,RAG 解决了知识时效性问题。而 Agent(智能体)赋予了 AI 自主规划与执行任务的能力,MCP(Model Context Protocol)则致力于标准化模型与数据的连接方式。这四者共同构成了当前 AI 应用落地的核心技术栈。

