从Agent、MCP、Skill到CLI:AI进化四部曲的代表作品与里程碑全盘点

从Agent、MCP、Skill到CLI:AI进化四部曲的代表作品与里程碑全盘点

从Agent、MCP、Skill到CLI:AI进化四部曲的代表作品与里程碑全盘点

作者:猫头虎AI | 发布时间:2026年3月 | 阅读时间:约12分钟

【开篇】

兄弟们,回顾2025年绝对是AI圈最魔幻的一年。从年初DeepSeek-R1的"核弹级"开源,到3月Manus一夜爆火邀请码炒到5位数,再到各大厂疯狂押注MCP协议——AI的战场已经从"谁模型参数更大"转向了"谁能真正帮你干活"。

今天这篇干货,咱们不聊虚的,直接盘一盘Agent、MCP、Skill、CLI这四大技术范式各自的代表作品里程碑大事件。看完你就知道,为什么2025被称为"Agent元年",以及作为开发者该如何紧跟这波浪潮。

从Agent、MCP、Skill到CLI:AI进化四部曲的代表作品与里程碑全盘点

文章目录


一、Agent:从"聊天工具"到"数字员工"的质变

什么是Agent?

简单说,Agent就是能自主规划、调用工具、执行多步骤任务的AI系统。它不再是你问一句答一句的聊天机器人,而是能像实习生一样"边想边干"的智能体。

代表作品盘点

产品/项目发布时间核心亮点代表意义
Devin2024年12月首个真正可用的编程Agent,能自主写代码、调试、部署AI Agent商业化的里程碑,标志着"Agent觉醒"
Manus2025年3月中国团队Monica推出,GAIA基准测试86.5%准确率,支持深度研究+实际操作国内首个现象级通用Agent,推动"Agent元年"概念爆发
OpenAI Operator2025年1月OpenAI首款官方Agent,支持自动预订、购物、编码等复杂操作大厂正式入场Agent赛道的标志性产品
OpenAI Deep Research2025年2月端到端强化学习训练,5-30分钟生成专业研究报告深度研究型Agent的标杆
Claude 3.7 Sonnet + Claude Code2025年2月编码Agent代表,能写代码、执行代码、检查结果并持续迭代编程Agent的"天花板"
AutoGLM沉思2025年3月智谱AI推出,实现"边想边干"的Agent能力闭环国产大模型Agent化的重要突破
Kimi-Researcher2025年6月月之暗面首个Agent产品,HLE测试超越Claude 4 Opus国内长文本+Agent结合的代表
Jules2024年12月谷歌推出的编程助手,直接集成GitHub工作流大厂异步编程Agent的代表

里程碑时间线

2024年10月:微软在Dynamics 365集成10个自主AI Agent,Lumen年省5000万美元成本 ↓ 2024年12月:谷歌发布Gemini 2.0及Project Astra、Project Mariner、Jules三大Agent原型 ↓ 2024年12月:Cognition Labs发布Devin,引爆"Agent觉醒"话题 ↓ 2025年1月:OpenAI发布Operator,正式定义"Agent之年" ↓ 2025年2月:OpenAI发布Deep Research功能 ↓ 2025年3月:Monica发布Manus,国内Agent概念破圈 ↓ 2025年3月:智谱发布AutoGLM沉思 ↓ 2025年6月:月之暗面发布Kimi-Researcher ↓ 2025年8月:中国人工智能学会主办AI Agent全球专项赛,标志Agent产业化正式成熟 

二、MCP:AI与世界的"通用翻译器"

什么是MCP?

MCP(Model Context Protocol,模型上下文协议) 是Anthropic于2024年11月开源的开放标准,旨在解决AI Agent访问外部数据和工具时的"数据孤岛"问题。

通俗理解:以前每个AI模型调用工具的方式都不一样(OpenAI一种格式、Anthropic一种格式、Google又一种),开发者要为每个模型单独适配。MCP就像AI世界的"HTTP协议",统一了模型与外部工具的交互标准。

代表作品与生态

类型代表项目说明
协议规范MCP ProtocolAnthropic开源的协议标准,定义了AI与数据系统的连接方式
官方实现Claude Desktop MCPClaude桌面版内置MCP本地服务器支持,保障数据隐私
开源服务器Google Drive MCP、GitHub MCP、Slack MCP、Postgres MCP开箱即用的数据源连接器
国内支持阿里、腾讯、字节、百度MCP平台国内大厂2025年密集跟进,聚焦MCP Server市场平台

里程碑时间线

2024年11月:Anthropic开源发布MCP协议 ↓ 2025年初:MCP热度飙升,OpenAI、Anthropic、Mistral在8天内相继推出API级MCP支持 ↓ 2025年春:国内大厂(阿里、腾讯、字节、百度)密集部署MCP ↓ 2025年:MCP生态爆发,成为AI Agent的"事实行业标准" 

为什么说MCP是2025年的关键里程碑?

因为它解决了AI落地最大的痛点——连接。正如AIGCLINK发起人占冰强所说:“每个人都能通过MCP,DIY一个属于自己的Manus”。


三、Skill:AI的"专业能力封装"

什么是Skill?

Skill(技能)是将可重复的领域知识封装为可动态加载的指令包,让通用大模型具备专业化执行能力。它标志着AI应用从"对话交互"向"任务执行"的关键跃迁。

如果说MCP解决的是"AI如何连接外部世界",那么Skill解决的就是"AI如何获得专业能力"。

代表作品与分类

分类代表Skill功能描述
浏览器自动化agent-browser模拟真实浏览器行为,支持多引擎搜索、网页解析、文件下载
可视化生成diagram-generator将复杂文本转化为时间轴、思维导图等可视化图表
文档处理pptx深度解析PPT,提取备注/评论/隐藏图文,转Markdown
前端设计Frontend Design Skill创建生产级前端界面,支持React/HTML/CSS/JS代码生成
算法艺术Algorithmic Art Skill使用p5.js创建生成艺术、数据可视化
学习管理ship-learn-next"交付-学习-下一步"循环拆解目标,用作品驱动学习
个人助理personal-assistant持久记忆学习进度,跨会话跟踪目标

里程碑时间线

2025年10月:Anthropic发布Agent Skills,限于开发者小范围关注 ↓ 2025年11-12月:技能规范开放,生态快速扩展 ↓ 2026年1月:Claude Skills产品更新叠加非编程场景落地,触发病毒式传播 ↓ 2026年:GitHub官方Skills库收获近5万星标,技能商店出现超4800人安装的爆款 

Skill的关键转折点在于非技术用户的涌入——大量用户开始将Claude Skills用于度假研究、PPT制作、邮件清理等非编码场景,推动了技术出圈。


四、CLI:开发者的"AI副驾驶"

什么是CLI AI工具?

CLI(Command Line Interface)AI工具是将AI能力直接集成到命令行的编程助手。2025年,这类工具迎来了爆发式增长,成为开发者效率提升的"核武器"。

代表作品排行榜

排名工具名称发布方核心特点适用场景
1Claude CodeAnthropic代码质量最高(9.5/10),编码Agent标杆复杂代码库开发、重构
2OpenAI Codex CLIOpenAI生态集成最强(9.5/10),与OpenAI API深度绑定全栈开发、API集成
3Gemini CLIGoogle响应速度最快(9.5/10),开源免费(Apache 2.0)脚本编写、命令辅助
4Cursor CLICursor易用性最佳(9.2/10),与IDE无缝衔接日常编码、快速原型
5CodeBuddy Code腾讯首个支持MCP协议的国产CLI工具,混元+DeepSeek双模型本土化开发、微信小程序
6Qwen Code CLI阿里开源免费,中文编程场景优化中文开发环境、成本敏感场景
7Mistral VibeMistral欧洲开源模型代表多语言开发、隐私优先

里程碑时间线

2023年初:OpenAI ChatGPT代码解释器(Code Interpreter)首次展示编程智能体范式 ↓ 2024年:各类IDE(VS Code、Cursor、Zed)开始集成编程智能体 ↓ 2025年2月:Claude Code低调发布(与Claude 3.7 Sonnet一同发布),引爆编码Agent元年 ↓ 2025年:各大主流实验室密集推出CLI编码智能体(Codex CLI、Gemini CLI、Qwen Code等) ↓ 2025年6月:Google Gemini CLI正式发布,开源策略冲击市场 ↓ 2025年9月:国产CLI工具(腾讯CodeBuddy、阿里Qwen Code)崛起,支持MCP协议 

五、四者关系:AI落地的"技术栈拼图"

聊到这里,可能有些兄弟还是有点晕。咱们用一张图理清这四者的关系:

┌─────────────────────────────────────────────────────────┐ │ AI Agent(智能体) │ │ 能自主规划、调用工具、执行多步骤任务的系统 │ └─────────────────────────────────────────────────────────┘ ↑ ┌───────────────┼───────────────┐ ↓ ↓ ↓ ┌─────────┐ ┌─────────┐ ┌─────────┐ │ MCP │ │ Skill │ │ CLI │ │ 连接层 │ │ 能力层 │ │ 交互层 │ │(统一协议)│ │(专业封装)│ │(命令行) │ └─────────┘ └─────────┘ └─────────┘ 

简单理解:

  • Agent 是最终形态(能干的"数字员工")
  • MCP 是它的"神经系统"(连接外部工具的标准协议)
  • Skill 是它的"专业技能"(封装好的领域知识)
  • CLI 是开发者的"操作台"(与Agent交互的命令行界面)

六、写在最后:2026,Agent cli元年的开发者机遇

回顾2024-2026年的AI发展,有几个确定性趋势已经很明显:

  1. Agent从概念走向落地:Devin、Manus、Operator等产品的出现,证明Agent不再是PPT概念,而是真正能替代人类完成复杂任务的工具。
  2. MCP成为事实标准:虽然有人质疑MCP可能只是"昙花一现",但短期内它确实解决了AI与外部世界连接的最大痛点,生态已经形成。
  3. Skill工程化:AI应用开发正从"提示词工程"→"上下文工程"→"Skill工程"演进,封装可复用的领域知识将成为核心竞争力。
  4. CLI工具普及:编程Agent正在重塑开发工作流,未来"不会用AI写代码"可能就像"不会用IDE"一样难以生存。

给开发者的建议:

  • 如果你还没试过Claude Code或Gemini CLI,现在就去装一个,体验AI编程的效率提升
  • 关注MCP生态,学会为自己的业务场景定制MCP Server
  • 开始思考如何将你的业务知识封装为Skill,这将是AI时代的"护城河"

2026年,Agent元年的大幕已经拉开。作为技术人,我们要做的不是观望,而是躬身入局


【评论区互动】

你用过哪些AI Agent或CLI工具?体验如何?欢迎在评论区分享你的"真香"或"踩坑"经历!

如果这篇文章对你有帮助,别忘了点赞、收藏、转发三连!关注老K,持续输出硬核AI技术干货。


Read more

Copilot 之后,再无“搬砖”

Copilot 之后,再无“搬砖”

硬编码时代,我们似乎已经习惯了在编辑器里按下 Tab 键。但如果你依然只把 AI 当作一个“高级补全插件”,那么你可能正在错过这场生产力革命的下半场。从 Copilot 到 Agent(智能体),这不仅仅是名称的更迭,更是开发范式从“辅助”向“协作”的本质跃迁。 今天,我想聊聊如何在这个交叉点上,利用开源生态构建一个真正属于你自己的私有化开发助手。 1. 为什么说 Copilot 已经不够用了? 如果把 AI 辅助开发比作驾驶,传统的 Copilot(如 GitHub Copilot, Cursor)更像是“定速巡航”:它能帮你保持车速、预测下一个弯道(代码补全),但它并不清楚你要去哪,更无法在遇到封路时自动规划绕行方案。 而 Agent 则是“自动驾驶”。两者的核心差异在于:自主性与闭环能力。 * Copilot(

Flutter 三方库 llm_json_stream 的鸿蒙化适配指南 - 掌控 LLM 流式 JSON 解析、大模型解析实战、鸿蒙级精密 AIGC 专家

Flutter 三方库 llm_json_stream 的鸿蒙化适配指南 - 掌控 LLM 流式 JSON 解析、大模型解析实战、鸿蒙级精密 AIGC 专家

欢迎加入开源鸿蒙跨平台社区:https://openharmonycrossplatform.ZEEKLOG.net Flutter 三方库 llm_json_stream 的鸿蒙化适配指南 - 掌控 LLM 流式 JSON 解析、大模型解析实战、鸿蒙级精密 AIGC 专家 在鸿蒙跨平台应用执行大型语言模型(LLM)的流式交互(如实时获取大模型生成的结构化 JSON 数据、处理非完整的 JSON 片段解析或是实现一个具备极致反馈速度的 AI 驱动表单)时,如果依赖传统的 jsonDecode,极易在处理“不完整字符串(Chunk)”、“语法中断”或“非预期的文本噪声”时陷入解析异常死循环。如果你追求的是一种完全对齐流式解析规范、支持实时恢复 JSON 结构且具备极致容错性能的方案。今天我们要深度解析的 llm_json_stream—

从 0 到 1:解决 VsCode 远程连服务器后 Github Copilot 无法使用问题

从 0 到 1:解决 VS Code 远程连服务器后 GitHub Copilot 无法使用问题 当您使用 VS Code 的远程功能(如 SSH 或容器)连接到服务器时,GitHub Copilot 可能无法正常工作,这通常是由于远程环境中的网络、扩展安装或身份验证问题导致的。我将一步步引导您解决这个问题,确保过程清晰可靠。请按照顺序操作,并测试每个步骤。 步骤 1: 确认本地 Copilot 正常工作 在开始远程连接前,先确保 Copilot 在您的本地 VS Code 中工作正常。 * 打开本地 VS Code。 * 创建一个新文件(如 test.py),输入一些代码(如 def

Chat took too long to get ready.Please ensure...<VSCode\Copilot>

Chat took too long to get ready.Please ensure...<VSCode\Copilot>

在VScode里面,应用Copilot提问,无法解决问题,该怎么解决呢? 1、在vscode里面,按键  ctrl + shift + p,输入setting,即看到setting.json文件 2、在setting.json文件中添加下面两行   "github.copilot.nextEditSuggestions.enabled": true,   "chat.extensionUnification.enabled":false, 参考图片25、26行 3、保存,重启vscode 4、重启后,点击vscode左下角人头像,查看是否有让授权Copilot的,如果有点击一下授权,解决!!! 如果这样无法解决,建议检查账号是不是不能使用Copilot功能了