AI Skills:从低代码工作流到“包管理”生态的范式跃迁

AI Skills:从低代码工作流到“包管理”生态的范式跃迁

作者: zs
日期: 2026年1月30日


摘要

我们正处于一个关键的时代转折点,AI 代理的能力正在经历一场深刻的范式变革。这场变革的核心,是将 AI 的能力从封闭、孤立的工具集,转化为一套开放、可互操作的 Skills(技能) 生态系统。本文将追溯 Skills 的演进脉络:从 CozeDify 等低代码平台中工作流的原始形态,到 Anthropic 推动 Model Context Protocol (MCP) 实现标准化,最终由 Vercel 推出 skills.sh 目录,构建起类似 npm 的分布式“包管理”分发机制。这种标准化和生态化,不仅打破了平台间的互操作性壁垒,更将 AI 代理的应用边界从传统的代码辅助,拓展至复杂的民用和娱乐场景,预示着一个可重用、可组合的 AI 自动化新纪元的全面开启。


一、前标准化时代:工作流的局限性

在 AI Skills 概念被正式提出并标准化之前,市场上的低代码/无代码平台,如 Coze 和 Dify,已经通过 工作流(Workflow) 的形式,初步实现了对复杂操作的封装。这些工作流允许开发者通过图形化界面或简单的配置,将一系列 API 调用、逻辑判断或内部操作串联起来,并赋予其描述性的名称。

从结构上看,这些工作流具备了 Skills 的基本要素:名称、描述和程序性指令。然而,它们的核心缺陷在于互操作性的缺失。由于缺乏统一的协议和元数据标准,一个平台上的工作流配置无法直接或便捷地迁移到另一个平台。这种封闭性使得 AI 代理的能力成为平台私有的资产,极大地限制了知识的共享和复用,也阻碍了整个 AI 自动化领域的协同发展 [1]。

特征维度低代码工作流(Coze/Dify)标准化 AI Skills(MCP/Claude Skills)
能力封装平台内部操作序列具备统一元数据和指令的模块化能力
互操作性平台限定,知识孤岛跨平台、跨模型兼容(基于开放协议)
调用机制显式触发(命令、按钮)隐式触发(基于自然语言意图解析)
生态模式封闭式应用商店开放式包管理目录

二、标准化转折点:MCP 与程序性知识的定义

AI Skills 能够实现跨平台互通的关键,在于 Model Context Protocol (MCP) 的出现。由 Anthropic 主导推动的 MCP [2],并非仅仅是一个 API 规范,它更像是一种为 AI 代理设计的 “罗塞塔石碑”,旨在为 AI 代理与外部系统、工具和数据之间的交互提供一个统一的语言框架。

在 MCP 框架下,Skills 被明确定义为 AI 代理获取和执行 程序性知识(Procedural Knowledge) 的载体。一个标准的 Skill 文件(例如 SKILL.md)不仅包含人类可读的描述,更重要的是,它通过结构化的元数据(如 YAML)和详细的指令,清晰地告知 AI 代理:

“MCP 连接为 AI 代理提供了工具的访问权限,而 Skills 则教会 AI 代理如何有效地使用这些工具。” [3]

这种对“如何做”的程序性知识的标准化定义,使得 Skills 能够被广泛的 AI 助手所理解和采纳。目前,包括 Claude CodeTraeCodeBuddy 在内的约 40 款 AI 编辑助手,已经开始兼容或支持这种标准格式 [4],标志着 AI 代理生态的底层基础设施已初步搭建完成。


三、生态爆发:Skills.sh 与“包管理”模式的崛起

如果说 MCP 解决了 Skills 的“定义”问题,那么 Vercel 推出的 skills.sh 目录 [5] 则解决了 Skills 的“分发”问题,从而彻底引爆了 Skills 的生态。

skills.sh 成功地将软件开发领域成熟的 “包管理” 模式引入 AI 代理生态。通过一个简单的命令行工具,开发者和用户可以像安装 npmpip 库一样,将 Skills 集成到自己的 AI 代理中:

$ npx skills add<owner/repo>

这种分发模式的价值在于:

  1. 去中心化与效率:它将 Skills 的获取过程从繁琐的手动配置,简化为即插即用的命令行操作,极大地提升了效率。
  2. 版本化与复用:Skills 可以像软件模块一样进行版本控制、迭代和复用,促进了高质量能力的沉淀和共享。
  3. 社区驱动:它为 Skills 的创作者提供了一个统一的发布和发现平台,激励了社区的积极参与。

skills.sh 目录的快速增长是这种模式成功的最佳佐证,其收录的 Skills 数量已超过 34,000 个 [6],显示出市场对这种标准化、模块化能力的巨大需求。


四、应用边界的拓展:从代码到复杂场景自动化

Skills 的早期应用主要集中在 软件开发 领域,例如代码规范检查(vercel-react-best-practices)、SEO 审计(seo-audit)和系统调试(systematic-debugging)。然而,随着生态的成熟,Skills 的应用边界正在迅速向非代码、复杂场景拓展。

这种拓展的典型案例是 douyin-crush-bot [7]。这个 Skill 的核心功能是将一系列复杂的跨应用操作封装起来:它利用 浏览器自动化 (Playwright) 模拟用户行为,结合 视觉 AI 模型 对视频内容进行实时分析和评分,并根据预设的逻辑(如颜值阈值、性别偏好)执行互动操作(点赞/关注)。

该案例的价值在于:

  • 复杂能力的集成:它证明了 Skills 能够封装多步骤、多技术栈(自动化、视觉 AI、业务逻辑)的复杂流程。
  • 意图驱动的执行:用户只需通过自然语言(如“帮我刷一会儿抖音,点赞 8 分以上的妹子”)表达意图,AI 代理就能自动解析并调用 Skill,实现“意图驱动”的自动化。

这标志着 AI 代理正在从一个“知识问答者”或“代码辅助者”,进化为一个能够理解模糊意图并执行复杂现实任务的 “超级执行者”


五、结论与展望

AI Skills 的发展,是 AI 代理能力从 私有化 走向 标准化生态化 的必然结果。它通过 MCP 协议打破了平台间的壁垒,并通过 skills.sh 目录构建了高效的分发机制。

我们正站在一个历史性的转折点上。Skills 正在重塑 AI 自动化领域的底层逻辑,将 AI 的能力从传统的工具调用,提升到可组合、可复用的程序性知识层面。

展望未来,这种范式跃迁将带来深远影响:

  1. 能力共享的加速:Skills 的标准化将促使不同 AI 模型和平台实现更深层次的互操作性,形成一个真正开放、共享的 AI 能力网络。
  2. 通用智能的加速:AI 代理将能够通过 Skills 快速集成和学习新的程序性知识,加速其向通用人工智能(AGI)的演进。
  3. 全民开发者的兴起:Skills 的低门槛分发和使用方式,将吸引更多非技术背景的创作者参与到 AI 能力的构建中,形成一个类似开源社区的繁荣生态。

参考文献

[1] Anthropic. The Complete Guide to Building Skills for Claude. [Online]. Available: https://resources.anthropic.com/hubfs/The-Complete-Guide-to-Building-Skill-for-Claude.pdf?hsLang=en
[2] Anthropic. Code execution with MCP: building more efficient AI agents. [Online]. Available: https://www.anthropic.com/engineering/code-execution-with-mcp
[3] Claude Help Center. What are Skills?. [Online]. Available: https://support.claude.com/en/articles/12512176-what-are-skills
[4] Medium. Understanding AI’s New Power Duo: MCP and Claude Skills. [Online]. Available: https://medium.com/keiji-ai/understanding-ais-new-power-duo:mcp-and-claude-skills-bd0f017b185f
[5] Vercel. The Agent Skills Directory. [Online]. Available: https://skills.sh/
[6] Vercel. Skills Leaderboard. [Online]. Available: https://skills.sh/ (数据截至 2026年1月)
[7] DemoJ. douyin-crush-bot. [Online]. Available: https://github.com/DemoJ/douyin-crush-bot

Read more

论文阅读:MiniOneRec

github仓库:https://github.com/AkaliKong/MiniOneRec 技术报告论文:https://arxiv.org/abs/2510.24431 找了一个论文阅读辅助工具:https://www.alphaxiv.org/ 代码 https://github.com/AkaliKong/MiniOneRec SFT在做什么 前置:数据集 代码路径:MiniOneRec/data.py 类Tokenizer:给普通的分词器多包装了一层,可以处理连续的bos/eos的特殊字符串。 SidSFTDataset 多样化的指令 任务:输入用户最近交互过的item列表,预测用户下一个交互的item SidItemFeatDataset sid2title或者title2sid任务 FusionSeqRecDataset 带意图识别的商品推荐 代码 代码入口:MiniOneRec/sft.py 1、

By Ne0inhk

数字电路FPGA原型验证平台搭建快速理解

FPGA原型验证:从零搭建高效数字电路“设计沙盒” 你有没有遇到过这样的场景? 写完几千行Verilog代码,功能仿真跑通了,心里正得意——结果一上板,系统莫名其妙卡死、数据错乱,ILA抓出来的波形像谜语人一样毫无头绪。更糟的是,项目deadline就在下周,流片预算已经批下来了…… 这不是危言耸听,而是每个数字前端工程师都可能踩过的坑。而解决这类问题最有效的手段之一,就是 在FPGA上搭一个原型验证平台 ——它就像一个“硬件模拟器”,让你的设计提前暴露真实世界中的各种边界情况。 今天我们就来拆解这个关键环节:如何快速理解并搭建一套实用的FPGA原型验证环境。不讲空话,只聚焦真正影响开发效率的核心技术点。 为什么仿真不够用了? 在SoC设计日益复杂的今天,纯软件仿真(比如用ModelSim跑RTL)越来越显得力不从心。哪怕是一颗中等规模的处理器子系统,全速仿真一天也未必能跑完一次完整的启动流程。更别说要覆盖所有中断、异常和外设交互路径。 而FPGA的优势在于: 它是真正的并行执行硬件 。你的状态机、总线仲裁、DMA搬运,全部在同一时刻物理运行,速度轻松达到MHz级别——比

By Ne0inhk
【Part 4 XR综合技术分享】第一节|技术上的抉择:三维实时渲染与VR全景视频的共生

【Part 4 XR综合技术分享】第一节|技术上的抉择:三维实时渲染与VR全景视频的共生

《VR 360°全景视频开发》专栏 将带你深入探索从全景视频制作到Unity眼镜端应用开发的全流程技术。专栏内容涵盖安卓原生VR播放器开发、Unity VR视频渲染与手势交互、360°全景视频制作与优化,以及高分辨率视频性能优化等实战技巧。 📝 希望通过这个专栏,帮助更多朋友进入VR 360°全景视频的世界! Part 4|XR综合技术分享 最后一Part了,我将分享一些关于当前常用的XR综合技术,内容涵盖三维实时渲染与全景视频的共生、多模态交互体验的融合,以及AI如何深度赋能XR应用,推动智能化发展。同时畅想通向全感知XR智能沉浸时代的未来,探索如何通过更先进的技术不断提升用户体验。毕竟,360°全景视频仅是XR应用中的冰山一角。 第一节|技术上的抉择:三维实时渲染与VR全景视频的共生 文章目录 * 《VR 360°全景视频开发》专栏 * Part 4|XR综合技术分享 * 第一节|技术上的抉择:三维实时渲染与VR全景视频的共生 * 1、VR内容形态的分化与融合 * 1.1 三维实时渲染的发展 * 1.2

By Ne0inhk
近五年体内微/纳米机器人赋能肿瘤精准治疗综述:以 GBM 为重点

近五年体内微/纳米机器人赋能肿瘤精准治疗综述:以 GBM 为重点

摘要 实体瘤治疗长期受制于递送效率低、肿瘤组织渗透不足以及免疫抑制与耐药等问题。传统纳米药物多依赖被动累积与扩散,难以在肿瘤内部形成均匀有效的药物浓度分布。2021–2025 年,体内微/纳米机器人(包括外场驱动微型机器人、自驱动纳米马达以及生物混合机器人)围绕“运动能力”形成了三条相互收敛的技术路线: 其一,通过磁驱、声驱、光/化学自驱等方式实现运动增强递药与深层渗透,将治疗从“被动到达”推进到“主动进入”; 其二,与免疫治疗深度融合,实现原位免疫唤醒与肿瘤微环境重塑; 其三,针对胶质母细胞瘤(glioblastoma, GBM)等难治肿瘤,研究趋势转向“跨屏障递送(BBB/BBTB)+ 成像/外场闭环操控 + 时空可控释放”的系统工程。 本文围绕“运动—分布—疗效”的因果链条,总结 2021–2025 年代表性研究与关键评价指标,讨论临床转化所需的安全性、

By Ne0inhk