AI 进化四部曲:Agent、MCP、Skill 与 CLI 代表作品及里程碑
盘点 2024-2026 年 AI 领域四大技术范式:Agent、MCP、Skill 与 CLI。介绍了各范式的定义、代表产品(如 Devin、Manus、Claude Code 等)及发展里程碑。阐述了四者关系:Agent 为数字员工形态,MCP 为连接协议,Skill 为能力封装,CLI 为交互界面。旨在帮助开发者理解 AI 落地趋势,把握 Agent 元年机遇。

盘点 2024-2026 年 AI 领域四大技术范式:Agent、MCP、Skill 与 CLI。介绍了各范式的定义、代表产品(如 Devin、Manus、Claude Code 等)及发展里程碑。阐述了四者关系:Agent 为数字员工形态,MCP 为连接协议,Skill 为能力封装,CLI 为交互界面。旨在帮助开发者理解 AI 落地趋势,把握 Agent 元年机遇。

【开篇】
回顾 2025 年绝对是 AI 圈最魔幻的一年。从年初 DeepSeek-R1 的开源,到 3 月 Manus 一夜爆火邀请码炒到 5 位数,再到各大厂疯狂押注 MCP 协议——AI 的战场已经从"谁模型参数更大"转向了"谁能真正帮你干活"。
今天这篇干货,直接盘一盘 Agent、MCP、Skill、CLI 这四大技术范式各自的代表作品和里程碑大事件。看完你就知道,为什么 2025 被称为"Agent 元年",以及作为开发者该如何紧跟这波浪潮。
简单说,Agent 就是能自主规划、调用工具、执行多步骤任务的 AI 系统。它不再是你问一句答一句的聊天机器人,而是能像实习生一样"边想边干"的智能体。
| 产品/项目 | 发布时间 | 核心亮点 | 代表意义 |
|---|---|---|---|
| Devin | 2024 年 12 月 | 首个真正可用的编程 Agent,能自主写代码、调试、部署 | AI Agent 商业化的里程碑,标志着"Agent 觉醒" |
| Manus | 2025 年 3 月 | 中国团队 Monica 推出,GAIA 基准测试 86.5% 准确率,支持深度研究 + 实际操作 | 国内首个现象级通用 Agent,推动"Agent 元年"概念爆发 |
| OpenAI Operator | 2025 年 1 月 | OpenAI 首款官方 Agent,支持自动预订、购物、编码等复杂操作 | 大厂正式入场 Agent 赛道的标志性产品 |
| OpenAI Deep Research | 2025 年 2 月 | 端到端强化学习训练,5-30 分钟生成专业研究报告 | 深度研究型 Agent 的标杆 |
| Claude 3.7 Sonnet + Claude Code | 2025 年 2 月 | 编码 Agent 代表,能写代码、执行代码、检查结果并持续迭代 | 编程 Agent 的"天花板" |
| AutoGLM 沉思 | 2025 年 3 月 | 智谱 AI 推出,实现"边想边干"的 Agent 能力闭环 | 国产大模型 Agent 化的重要突破 |
| Kimi-Researcher | 2025 年 6 月 | 月之暗面首个 Agent 产品,HLE 测试超越 Claude 4 Opus | 国内长文本+Agent 结合的代表 |
| Jules | 2024 年 12 月 | 谷歌推出的编程助手,直接集成 GitHub 工作流 | 大厂异步编程 Agent 的代表 |
text
2024 年 10 月:微软在 Dynamics 365 集成 10 个自主 AI Agent,Lumen 年省 5000 万美元成本
2024 年 12 月:谷歌发布 Gemini 2.0 及 Project Astra、Project Mariner、Jules 三大 Agent 原型
2024 年 12 月:Cognition Labs 发布 Devin,引爆"Agent 觉醒"话题
2025 年 1 月:OpenAI 发布 Operator,正式定义"Agent 之年"
2025 年 2 月:OpenAI 发布 Deep Research 功能
2025 年 3 月:Monica 发布 Manus,国内 Agent 概念破圈
2025 年 3 月:智谱发布 AutoGLM 沉思
2025 年 6 月:月之暗面发布 Kimi-Researcher
2025 年 8 月:中国人工智能学会主办 AI Agent 全球专项赛,标志 Agent 产业化正式成熟
MCP(Model Context Protocol,模型上下文协议)是 Anthropic 于 2024 年 11 月开源的开放标准,旨在解决 AI Agent 访问外部数据和工具时的"数据孤岛"问题。
通俗理解:以前每个 AI 模型调用工具的方式都不一样(OpenAI 一种格式、Anthropic 一种格式、Google 又一种),开发者要为每个模型单独适配。MCP 就像 AI 世界的"HTTP 协议",统一了模型与外部工具的交互标准。
| 类型 | 代表项目 | 说明 |
|---|---|---|
| 协议规范 | MCP Protocol | Anthropic 开源的协议标准,定义了 AI 与数据系统的连接方式 |
| 官方实现 | Claude Desktop MCP | Claude 桌面版内置 MCP 本地服务器支持,保障数据隐私 |
| 开源服务器 | Google Drive MCP、GitHub MCP、Slack MCP、Postgres MCP | 开箱即用的数据源连接器 |
| 国内支持 | 阿里、腾讯、字节、百度 MCP 平台 | 国内大厂 2025 年密集跟进,聚焦 MCP Server 市场平台 |
text
2024 年 11 月:Anthropic 开源发布 MCP 协议
2025 年初:MCP 热度飙升,OpenAI、Anthropic、Mistral 在 8 天内相继推出 API 级 MCP 支持
2025 年春:国内大厂(阿里、腾讯、字节、百度)密集部署 MCP
2025 年:MCP 生态爆发,成为 AI Agent 的"事实行业标准"
为什么说 MCP 是 2025 年的关键里程碑?因为它解决了 AI 落地最大的痛点——连接。
Skill(技能)是将可重复的领域知识封装为可动态加载的指令包,让通用大模型具备专业化执行能力。它标志着 AI 应用从"对话交互"向"任务执行"的关键跃迁。
如果说 MCP 解决的是"AI 如何连接外部世界",那么 Skill 解决的就是"AI 如何获得专业能力"。
| 分类 | 代表 Skill | 功能描述 |
|---|---|---|
| 浏览器自动化 | agent-browser | 模拟真实浏览器行为,支持多引擎搜索、网页解析、文件下载 |
| 可视化生成 | diagram-generator | 将复杂文本转化为时间轴、思维导图等可视化图表 |
| 文档处理 | pptx | 深度解析 PPT,提取备注/评论/隐藏图文,转 Markdown |
| 前端设计 | Frontend Design Skill | 创建生产级前端界面,支持 React/HTML/CSS/JS 代码生成 |
| 算法艺术 | Algorithmic Art Skill | 使用 p5.js 创建生成艺术、数据可视化 |
| 学习管理 | ship-learn-next | "交付 - 学习 - 下一步"循环拆解目标,用作品驱动学习 |
| 个人助理 | personal-assistant | 持久记忆学习进度,跨会话跟踪目标 |
text
2025 年 10 月:Anthropic 发布 Agent Skills,限于开发者小范围关注
2025 年 11-12 月:技能规范开放,生态快速扩展
2026 年 1 月:Claude Skills 产品更新叠加非编程场景落地,触发病毒式传播
2026 年:GitHub 官方 Skills 库收获近 5 万星标,技能商店出现超 4800 人安装的爆款
Skill 的关键转折点在于非技术用户的涌入——大量用户开始将 Claude Skills 用于度假研究、PPT 制作、邮件清理等非编码场景,推动了技术出圈。
CLI(Command Line Interface)AI 工具是将 AI 能力直接集成到命令行的编程助手。2025 年,这类工具迎来了爆发式增长,成为开发者效率提升的"核武器"。
| 排名 | 工具名称 | 发布方 | 核心特点 | 适用场景 |
|---|---|---|---|---|
| 1 | Claude Code | Anthropic | 代码质量最高 (9.5/10),编码 Agent 标杆 | 复杂代码库开发、重构 |
| 2 | OpenAI Codex CLI | OpenAI | 生态集成最强 (9.5/10),与 OpenAI API 深度绑定 | 全栈开发、API 集成 |
| 3 | Gemini CLI | 响应速度最快 (9.5/10),开源免费 (Apache 2.0) | 脚本编写、命令辅助 | |
| 4 | Cursor CLI | Cursor | 易用性最佳 (9.2/10),与 IDE 无缝衔接 | 日常编码、快速原型 |
| 5 | CodeBuddy Code | 腾讯 | 首个支持 MCP 协议的国产 CLI 工具,混元+DeepSeek 双模型 | 本土化开发、微信小程序 |
| 6 | Qwen Code CLI | 阿里 | 开源免费,中文编程场景优化 | 中文开发环境、成本敏感场景 |
| 7 | Mistral Vibe | Mistral | 欧洲开源模型代表 | 多语言开发、隐私优先 |
text
2023 年初:OpenAI ChatGPT 代码解释器 (Code Interpreter) 首次展示编程智能体范式
2024 年:各类 IDE(VS Code、Cursor、Zed)开始集成编程智能体
2025 年 2 月:Claude Code 低调发布(与 Claude 3.7 Sonnet 一同发布),引爆编码 Agent 元年
2025 年:各大主流实验室密集推出 CLI 编码智能体(Codex CLI、Gemini CLI、Qwen Code 等)
2025 年 6 月:Google Gemini CLI 正式发布,开源策略冲击市场
2025 年 9 月:国产 CLI 工具(腾讯 CodeBuddy、阿里 Qwen Code)崛起,支持 MCP 协议
聊到这里,可能有些读者还是有点晕。咱们用一张图理清这四者的关系:
text
┌─────────────────────────────────────────────────────────┐
│ AI Agent(智能体) │
│ 能自主规划、调用工具、执行多步骤任务的系统 │
└─────────────────────────────────────────────────────────┘
↑
┌───────────────┼───────────────┐
↓ ↓ ↓
┌─────────┐ ┌─────────┐ ┌─────────┐
│ MCP │ │ Skill │ │ CLI │
│ 连接层 │ │ 能力层 │ │ 交互层 │
│(统一协议)│ │(专业封装)│ │(命令行) │
└─────────┘ └─────────┘ └─────────┘
简单理解:
回顾 2024-2026 年的 AI 发展,有几个确定性趋势已经很明显:
给开发者的建议:
2026 年,Agent 元年的大幕已经拉开。作为技术人,我们要做的不是观望,而是躬身入局。

微信公众号「极客日志」,在微信中扫描左侧二维码关注。展示文案:极客日志 zeeklog
使用加密算法(如AES、TripleDES、Rabbit或RC4)加密和解密文本明文。 在线工具,加密/解密文本在线工具,online
生成新的随机RSA私钥和公钥pem证书。 在线工具,RSA密钥对生成器在线工具,online
基于 Mermaid.js 实时预览流程图、时序图等图表,支持源码编辑与即时渲染。 在线工具,Mermaid 预览与可视化编辑在线工具,online
将字符串编码和解码为其 Base64 格式表示形式即可。 在线工具,Base64 字符串编码/解码在线工具,online
将字符串、文件或图像转换为其 Base64 表示形式。 在线工具,Base64 文件转换器在线工具,online
将 Markdown(GFM)转为 HTML 片段,浏览器内 marked 解析;与 HTML转Markdown 互为补充。 在线工具,Markdown转HTML在线工具,online