前言:AI 技术演进背景
2023 年被称为"AI 元年",ChatGPT 的出现让大语言模型(LLM)走进了大众视野。 但很快,我们发现单纯的大模型还不够:
- ❌ 它不知道最新的新闻
- ❌ 它不能操作你的电脑
- ❌ 它无法完成复杂的多步骤任务
于是,Agent、RAG、Skill 这些技术应运而生。今天,我们就来聊聊这四大核心技术。
一、LLM:AI 的"大脑"
1.1 什么是 LLM?
LLM (Large Language Model),也就是我们要说的'大模型',比如 DeepSeek、GPT、Gemini 等。
它是谁?
它是整个 AI 系统的 '大脑'。它读过几乎全互联网的书,上知天文下知地理,能写诗、能写代码、能陪你聊天。
它的超能力
- ✅ 理解力 Max:能听懂你在说什么。
- ✅ 生成力 Max:能快速生成高质量的文本。
- ✅ 推理力 Max:能处理复杂的逻辑问题。
1.2 常见的 LLM 有哪些?
| 模型 | 公司 | 特点 |
|---|---|---|
| GPT | OpenAI | 综合能力最强,多模态支持 |
| Claude | Anthropic | 代码能力强,上下文超长 |
| Gemini | 多模态原生,免费额度多 | |
| DeepSeek | DeepSeek | 国产之光,性价比超高,推理能力强 |
| Llama | Meta | 开源可商用,本地部署 |
| 文心一言 | 百度 | 中文优化,国内可用 |
| 通义千问 | 阿里 | 开源版本多,生态丰富 |
| Kimi | 月之暗面 | 长文本处理能力突出 |
1.3 LLM 的局限性
虽然 LLM 很强大,但它有三大硬伤:

这就引出了我们今天要讲的另外三个技术:RAG、Skill、Agent。
二、RAG(检索增强生成):外挂知识库
2.1 什么是 RAG?
它是谁?
如果 LLM 是一个参加'开卷考试'的学生,那 RAG 就是他手边的 '教科书' 或者 '图书馆'。
为什么要用它?
当你要问 LLM 关于'你们公司最新的考勤制度'时,LLM 肯定不知道。 这时候,RAG 的作用就来了:






