AI 四大核心技术详解：LLM、Agent、RAG 与 Skill | 极客日志

PythonAI算法

AI 四大核心技术详解：LLM、Agent、RAG 与 Skill

AI 核心技术涵盖 LLM、Agent、RAG 与 Skill。LLM 为系统大脑负责理解生成；RAG 利用检索增强解决幻觉与私有数据问题；Skill 封装工具赋予操作能力；Agent 整合规划与行动实现自主任务。文章结合 LangChain 代码示例阐述四者架构关系及企业客服、知识助手等实际应用场景。

FrontendX发布于 2026/3/30更新于 2026/6/420 浏览

前言：AI 技术演进背景

2023 年被称为"AI 元年"，ChatGPT 的出现让大语言模型（LLM）走进了大众视野。但很快，我们发现单纯的大模型还不够：

❌ 它不知道最新的新闻
❌ 它不能操作你的电脑
❌ 它无法完成复杂的多步骤任务

于是，Agent、RAG、Skill 这些技术应运而生。今天，我们就来聊聊这四大核心技术。

一、LLM：AI 的"大脑"

1.1 什么是 LLM？

LLM (Large Language Model)，也就是我们要说的'大模型'，比如 DeepSeek、GPT、Gemini 等。

它是谁？

它是整个 AI 系统的 '大脑'。它读过几乎全互联网的书，上知天文下知地理，能写诗、能写代码、能陪你聊天。

它的超能力

✅ 理解力 Max：能听懂你在说什么。
✅ 生成力 Max：能快速生成高质量的文本。
✅ 推理力 Max：能处理复杂的逻辑问题。

1.2 常见的 LLM 有哪些？

模型	公司	特点
GPT	OpenAI	综合能力最强，多模态支持
Claude	Anthropic	代码能力强，上下文超长
Gemini	Google	多模态原生，免费额度多
DeepSeek	DeepSeek	国产之光，性价比超高，推理能力强
Llama	Meta	开源可商用，本地部署
文心一言	百度	中文优化，国内可用
通义千问	阿里	开源版本多，生态丰富
Kimi	月之暗面	长文本处理能力突出

1.3 LLM 的局限性

虽然 LLM 很强大，但它有三大硬伤：

架构图

这就引出了我们今天要讲的另外三个技术：RAG、Skill、Agent。

二、RAG（检索增强生成）：外挂知识库

2.1 什么是 RAG？

它是谁？

如果 LLM 是一个参加'开卷考试'的学生，那 RAG 就是他手边的 '教科书' 或者 '图书馆'。

为什么要用它？

当你要问 LLM 关于'你们公司最新的考勤制度'时，LLM 肯定不知道。这时候，RAG 的作用就来了：

相关免费在线工具

加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
RSA密钥对生成器
生成新的随机RSA私钥和公钥pem证书。在线工具，RSA密钥对生成器在线工具，online
Mermaid 预览与可视化编辑
基于 Mermaid.js 实时预览流程图、时序图等图表，支持源码编辑与即时渲染。在线工具，Mermaid 预览与可视化编辑在线工具，online
随机西班牙地址生成器
随机生成西班牙地址（支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选），支持数量快捷选择、显示全部与下载。在线工具，随机西班牙地址生成器在线工具，online
Gemini 图片去水印
基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印，支持批量处理与下载。在线工具，Gemini 图片去水印在线工具，online
curl 转代码
解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。在线工具，curl 转代码在线工具，online

# 使用 LangChain 实现简单 RAG（新版 API）
from langchain_openai import OpenAIEmbeddings, ChatOpenAI
from langchain_chroma import Chroma
from langchain_text_splitters import CharacterTextSplitter
from langchain_community.document_loaders import TextLoader
from langchain.chains import RetrievalQA

# 1. 加载文档
loader = TextLoader('公司手册.txt', encoding='utf-8')
documents = loader.load()

# 2. 切分文档
text_splitter = CharacterTextSplitter(chunk_size=1000, chunk_overlap=200)
texts = text_splitter.split_documents(documents)

# 3. 创建向量库
embeddings = OpenAIEmbeddings()
vectorstore = Chroma.from_documents(texts, embeddings)

# 4. 创建检索器
retriever = vectorstore.as_retriever(search_kwargs={"k":3})

# 5. 创建问答链
qa_chain = RetrievalQA.from_chain_type(
    llm=ChatOpenAI(model="gpt-4", temperature=0),
    chain_type="stuff",
    retriever=retriever
)

# 6. 提问
query = "公司的年假政策是什么？"
answer = qa_chain.invoke({"query": query})
print(answer["result"])

类型	示例	用途
搜索工具	Google Search、Bing API	获取实时信息
计算工具	Python 解释器、Wolfram Alpha	精确计算
数据库工具	SQL 查询、MongoDB	数据操作
文件工具	读写文件、处理 Excel	文档处理
API 工具	天气 API、股票 API	获取外部数据
浏览器工具	Puppeteer、Selenium	网页操作

用户："北京今天天气怎么样？"
↓ LLM 分析：需要获取实时天气信息
↓ LLM 决定：调用天气查询 Skill
↓ 执行 Skill：调用天气 API 获取数据
↓ LLM 生成："北京今天晴，25°C..."

Thought（思考）→ Action（行动）→ Observation（观察）→ ... → Answer（回答）

用户："苹果公司今年的营收是多少？"
Thought: 我需要搜索苹果公司最新的财务报告
Action: 调用搜索工具，搜索"Apple revenue 2024"
Observation: 找到 Apple 2024 Q4 财报，营收 xxx 亿美元
Thought: 我已经找到了答案
Action: 生成最终回答
Answer: 苹果公司 2024 年营收为 xxx 亿美元...

from langchain.agents import Tool, AgentExecutor, create_react_agent
from langchain_openai import ChatOpenAI
from langchain_community.utilities import SerpAPIWrapper
from langchain.chains import LLMMathChain

# 准备工具
search = SerpAPIWrapper()
llm = ChatOpenAI(model="gpt-4", temperature=0)
llm_math_chain = LLMMathChain(llm=llm)
tools = [
    Tool(
        name="Search",
        func=search.run,
        description="用于搜索实时信息"
    ),
    Tool(
        name="Calculator",
        func=llm_math_chain.run,
        description="用于数学计算"
    )
]

# 创建 Agent
agent = create_react_agent(llm, tools)
agent_executor = AgentExecutor(agent=agent, tools=tools, verbose=True)

# 运行
agent_executor.invoke({"input":"苹果公司 CEO 是谁？他今年多大了？"})

概念	形象比喻	核心作用	关键词
LLM	大脑 🧠	理解、推理、生成	通用、思考
RAG	图书馆 📚	提供准确、私有的知识	检索、上下文
Skill	工具箱 🛠️	执行具体操作、弥补短板	API、函数
Agent	完整的人 🤖	自主规划、完成复杂任务	规划、行动

用户："我的订单什么时候到？"
Agent 分析：需要查询订单信息
↓ 调用 Skill：查询订单数据库
↓ 获取结果：预计明天送达
↓ 生成回复："您的订单预计明天送达..."

用户："公司的报销流程是什么？"
RAG 检索：从知识库找到报销手册
↓ LLM 理解：提取关键步骤
↓ 生成回复：分步骤说明报销流程

用户："帮我写一个 Python 爬虫"
Agent 规划：
1. 分析需求
2. 编写代码
3. 解释代码
↓ 调用 Skill：代码生成 + 代码解释
↓ 输出：完整代码 + 使用说明

AI 四大核心技术详解：LLM、Agent、RAG 与 Skill

前言：AI 技术演进背景

一、LLM：AI 的"大脑"

1.1 什么是 LLM？

它是谁？

它的超能力

1.2 常见的 LLM 有哪些？

1.3 LLM 的局限性

二、RAG（检索增强生成）：外挂知识库

2.1 什么是 RAG？

它是谁？

为什么要用它？

更多推荐文章

相关免费在线工具

核心价值

2.2 RAG 的工作原理

2.3 RAG 的实际应用

2.4 代码示例

三、Skill：给 LLM 配备"工具箱"

3.1 什么是 Skill？

它是谁？

为什么需要它？

3.2 常见的 Skill 类型

3.3 Skill 的工作原理

四、Agent：让 AI 成为"智能体"

4.1 什么是 Agent？

它是谁？

它能做什么？

4.2 Agent 的核心架构

4.3 ReAct：Agent 的经典范式

4.4 LangChain 实现 Agent

五、四者关系：一张图看懂

💡 干货总结

六、实际应用场景

6.1 智能客服机器人

6.2 企业知识助手

6.3 编程助手

更多推荐文章

相关免费在线工具

AI 四大核心技术详解：LLM、Agent、RAG 与 Skill

前言：AI 技术演进背景

一、LLM：AI 的"大脑"

1.1 什么是 LLM？

它是谁？

它的超能力

1.2 常见的 LLM 有哪些？

1.3 LLM 的局限性

二、RAG（检索增强生成）：外挂知识库

2.1 什么是 RAG？

它是谁？

为什么要用它？

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

核心价值

2.2 RAG 的工作原理

2.3 RAG 的实际应用

2.4 代码示例

三、Skill：给 LLM 配备"工具箱"

3.1 什么是 Skill？

它是谁？

为什么需要它？

3.2 常见的 Skill 类型

3.3 Skill 的工作原理

四、Agent：让 AI 成为"智能体"

4.1 什么是 Agent？

它是谁？

它能做什么？

4.2 Agent 的核心架构

4.3 ReAct：Agent 的经典范式

4.4 LangChain 实现 Agent

五、四者关系：一张图看懂

💡 干货总结

六、实际应用场景

6.1 智能客服机器人

6.2 企业知识助手

6.3 编程助手

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具