AI Skills：从低代码工作流到“包管理”生态的范式跃迁

Ne0inhk

22 Mar 2026 — 8 min read

AI Skills：从低代码工作流到“包管理”生态的范式跃迁

作者： zs
日期： 2026年1月30日

摘要

我们正处于一个关键的时代转折点，AI 代理的能力正在经历一场深刻的范式变革。这场变革的核心，是将 AI 的能力从封闭、孤立的工具集，转化为一套开放、可互操作的 Skills（技能） 生态系统。本文将追溯 Skills 的演进脉络：从 Coze 和 Dify 等低代码平台中工作流的原始形态，到 Anthropic 推动 Model Context Protocol (MCP) 实现标准化，最终由 Vercel 推出 skills.sh 目录，构建起类似 npm 的分布式“包管理”分发机制。这种标准化和生态化，不仅打破了平台间的互操作性壁垒，更将 AI 代理的应用边界从传统的代码辅助，拓展至复杂的民用和娱乐场景，预示着一个可重用、可组合的 AI 自动化新纪元的全面开启。

一、前标准化时代：工作流的局限性

在 AI Skills 概念被正式提出并标准化之前，市场上的低代码/无代码平台，如 Coze 和 Dify，已经通过 工作流（Workflow） 的形式，初步实现了对复杂操作的封装。这些工作流允许开发者通过图形化界面或简单的配置，将一系列 API 调用、逻辑判断或内部操作串联起来，并赋予其描述性的名称。

从结构上看，这些工作流具备了 Skills 的基本要素：名称、描述和程序性指令。然而，它们的核心缺陷在于互操作性的缺失。由于缺乏统一的协议和元数据标准，一个平台上的工作流配置无法直接或便捷地迁移到另一个平台。这种封闭性使得 AI 代理的能力成为平台私有的资产，极大地限制了知识的共享和复用，也阻碍了整个 AI 自动化领域的协同发展 [1]。

特征维度	低代码工作流（Coze/Dify）	标准化 AI Skills（MCP/Claude Skills）
能力封装	平台内部操作序列	具备统一元数据和指令的模块化能力
互操作性	平台限定，知识孤岛	跨平台、跨模型兼容（基于开放协议）
调用机制	显式触发（命令、按钮）	隐式触发（基于自然语言意图解析）
生态模式	封闭式应用商店	开放式包管理目录

二、标准化转折点：MCP 与程序性知识的定义

AI Skills 能够实现跨平台互通的关键，在于 Model Context Protocol (MCP) 的出现。由 Anthropic 主导推动的 MCP [2]，并非仅仅是一个 API 规范，它更像是一种为 AI 代理设计的 “罗塞塔石碑”，旨在为 AI 代理与外部系统、工具和数据之间的交互提供一个统一的语言框架。

在 MCP 框架下，Skills 被明确定义为 AI 代理获取和执行 程序性知识（Procedural Knowledge） 的载体。一个标准的 Skill 文件（例如 SKILL.md）不仅包含人类可读的描述，更重要的是，它通过结构化的元数据（如 YAML）和详细的指令，清晰地告知 AI 代理：

“MCP 连接为 AI 代理提供了工具的访问权限，而 Skills 则教会 AI 代理如何有效地使用这些工具。” [3]

这种对“如何做”的程序性知识的标准化定义，使得 Skills 能够被广泛的 AI 助手所理解和采纳。目前，包括 Claude Code、Trae、CodeBuddy 在内的约 40 款 AI 编辑助手，已经开始兼容或支持这种标准格式 [4]，标志着 AI 代理生态的底层基础设施已初步搭建完成。

三、生态爆发：Skills.sh 与“包管理”模式的崛起

如果说 MCP 解决了 Skills 的“定义”问题，那么 Vercel 推出的 skills.sh 目录 [5] 则解决了 Skills 的“分发”问题，从而彻底引爆了 Skills 的生态。

skills.sh 成功地将软件开发领域成熟的 “包管理” 模式引入 AI 代理生态。通过一个简单的命令行工具，开发者和用户可以像安装 npm 或 pip 库一样，将 Skills 集成到自己的 AI 代理中：

$ npx skills add<owner/repo>

这种分发模式的价值在于：

去中心化与效率：它将 Skills 的获取过程从繁琐的手动配置，简化为即插即用的命令行操作，极大地提升了效率。
版本化与复用：Skills 可以像软件模块一样进行版本控制、迭代和复用，促进了高质量能力的沉淀和共享。
社区驱动：它为 Skills 的创作者提供了一个统一的发布和发现平台，激励了社区的积极参与。

skills.sh 目录的快速增长是这种模式成功的最佳佐证，其收录的 Skills 数量已超过 34,000 个 [6]，显示出市场对这种标准化、模块化能力的巨大需求。

四、应用边界的拓展：从代码到复杂场景自动化

Skills 的早期应用主要集中在 软件开发 领域，例如代码规范检查（vercel-react-best-practices）、SEO 审计（seo-audit）和系统调试（systematic-debugging）。然而，随着生态的成熟，Skills 的应用边界正在迅速向非代码、复杂场景拓展。

这种拓展的典型案例是 douyin-crush-bot [7]。这个 Skill 的核心功能是将一系列复杂的跨应用操作封装起来：它利用 浏览器自动化 (Playwright) 模拟用户行为，结合 视觉 AI 模型 对视频内容进行实时分析和评分，并根据预设的逻辑（如颜值阈值、性别偏好）执行互动操作（点赞/关注）。

该案例的价值在于：

复杂能力的集成：它证明了 Skills 能够封装多步骤、多技术栈（自动化、视觉 AI、业务逻辑）的复杂流程。
意图驱动的执行：用户只需通过自然语言（如“帮我刷一会儿抖音，点赞 8 分以上的妹子”）表达意图，AI 代理就能自动解析并调用 Skill，实现“意图驱动”的自动化。

这标志着 AI 代理正在从一个“知识问答者”或“代码辅助者”，进化为一个能够理解模糊意图并执行复杂现实任务的 “超级执行者”。

五、结论与展望

AI Skills 的发展，是 AI 代理能力从 私有化 走向 标准化 和 生态化 的必然结果。它通过 MCP 协议打破了平台间的壁垒，并通过 skills.sh 目录构建了高效的分发机制。

我们正站在一个历史性的转折点上。Skills 正在重塑 AI 自动化领域的底层逻辑，将 AI 的能力从传统的工具调用，提升到可组合、可复用的程序性知识层面。

展望未来，这种范式跃迁将带来深远影响：

能力共享的加速：Skills 的标准化将促使不同 AI 模型和平台实现更深层次的互操作性，形成一个真正开放、共享的 AI 能力网络。
通用智能的加速：AI 代理将能够通过 Skills 快速集成和学习新的程序性知识，加速其向通用人工智能（AGI）的演进。
全民开发者的兴起：Skills 的低门槛分发和使用方式，将吸引更多非技术背景的创作者参与到 AI 能力的构建中，形成一个类似开源社区的繁荣生态。

参考文献

[1] Anthropic. The Complete Guide to Building Skills for Claude. [Online]. Available: https://resources.anthropic.com/hubfs/The-Complete-Guide-to-Building-Skill-for-Claude.pdf?hsLang=en
[2] Anthropic. Code execution with MCP: building more efficient AI agents. [Online]. Available: https://www.anthropic.com/engineering/code-execution-with-mcp
[3] Claude Help Center. What are Skills?. [Online]. Available: https://support.claude.com/en/articles/12512176-what-are-skills
[4] Medium. Understanding AI’s New Power Duo: MCP and Claude Skills. [Online]. Available: https://medium.com/keiji-ai/understanding-ais-new-power-duo:mcp-and-claude-skills-bd0f017b185f
[5] Vercel. The Agent Skills Directory. [Online]. Available: https://skills.sh/
[6] Vercel. Skills Leaderboard. [Online]. Available: https://skills.sh/ (数据截至 2026年1月)
[7] DemoJ. douyin-crush-bot. [Online]. Available: https://github.com/DemoJ/douyin-crush-bot

论文阅读：MiniOneRec

github仓库：https://github.com/AkaliKong/MiniOneRec 技术报告论文：https://arxiv.org/abs/2510.24431 找了一个论文阅读辅助工具：https://www.alphaxiv.org/ 代码 https://github.com/AkaliKong/MiniOneRec SFT在做什么前置：数据集代码路径：MiniOneRec/data.py 类Tokenizer：给普通的分词器多包装了一层，可以处理连续的bos/eos的特殊字符串。 SidSFTDataset 多样化的指令任务：输入用户最近交互过的item列表，预测用户下一个交互的item SidItemFeatDataset sid2title或者title2sid任务 FusionSeqRecDataset 带意图识别的商品推荐代码代码入口：MiniOneRec/sft.py 1、

数字电路FPGA原型验证平台搭建快速理解

FPGA原型验证：从零搭建高效数字电路“设计沙盒” 你有没有遇到过这样的场景？写完几千行Verilog代码，功能仿真跑通了，心里正得意——结果一上板，系统莫名其妙卡死、数据错乱，ILA抓出来的波形像谜语人一样毫无头绪。更糟的是，项目deadline就在下周，流片预算已经批下来了…… 这不是危言耸听，而是每个数字前端工程师都可能踩过的坑。而解决这类问题最有效的手段之一，就是在FPGA上搭一个原型验证平台 ——它就像一个“硬件模拟器”，让你的设计提前暴露真实世界中的各种边界情况。今天我们就来拆解这个关键环节：如何快速理解并搭建一套实用的FPGA原型验证环境。不讲空话，只聚焦真正影响开发效率的核心技术点。为什么仿真不够用了？在SoC设计日益复杂的今天，纯软件仿真（比如用ModelSim跑RTL）越来越显得力不从心。哪怕是一颗中等规模的处理器子系统，全速仿真一天也未必能跑完一次完整的启动流程。更别说要覆盖所有中断、异常和外设交互路径。而FPGA的优势在于：它是真正的并行执行硬件。你的状态机、总线仲裁、DMA搬运，全部在同一时刻物理运行，速度轻松达到MHz级别——比

【Part 4 XR综合技术分享】第一节｜技术上的抉择：三维实时渲染与VR全景视频的共生

《VR 360°全景视频开发》专栏将带你深入探索从全景视频制作到Unity眼镜端应用开发的全流程技术。专栏内容涵盖安卓原生VR播放器开发、Unity VR视频渲染与手势交互、360°全景视频制作与优化，以及高分辨率视频性能优化等实战技巧。 📝 希望通过这个专栏，帮助更多朋友进入VR 360°全景视频的世界！ Part 4｜XR综合技术分享最后一Part了，我将分享一些关于当前常用的XR综合技术，内容涵盖三维实时渲染与全景视频的共生、多模态交互体验的融合，以及AI如何深度赋能XR应用，推动智能化发展。同时畅想通向全感知XR智能沉浸时代的未来，探索如何通过更先进的技术不断提升用户体验。毕竟，360°全景视频仅是XR应用中的冰山一角。第一节｜技术上的抉择：三维实时渲染与VR全景视频的共生文章目录 * 《VR 360°全景视频开发》专栏 * Part 4｜XR综合技术分享 * 第一节｜技术上的抉择：三维实时渲染与VR全景视频的共生 * 1、VR内容形态的分化与融合 * 1.1 三维实时渲染的发展 * 1.2

近五年体内微/纳米机器人赋能肿瘤精准治疗综述：以 GBM 为重点

摘要实体瘤治疗长期受制于递送效率低、肿瘤组织渗透不足以及免疫抑制与耐药等问题。传统纳米药物多依赖被动累积与扩散，难以在肿瘤内部形成均匀有效的药物浓度分布。2021–2025 年，体内微/纳米机器人（包括外场驱动微型机器人、自驱动纳米马达以及生物混合机器人）围绕“运动能力”形成了三条相互收敛的技术路线：其一，通过磁驱、声驱、光/化学自驱等方式实现运动增强递药与深层渗透，将治疗从“被动到达”推进到“主动进入”；其二，与免疫治疗深度融合，实现原位免疫唤醒与肿瘤微环境重塑；其三，针对胶质母细胞瘤（glioblastoma, GBM）等难治肿瘤，研究趋势转向“跨屏障递送（BBB/BBTB）+ 成像/外场闭环操控 + 时空可控释放”的系统工程。本文围绕“运动—分布—疗效”的因果链条，总结 2021–2025 年代表性研究与关键评价指标，讨论临床转化所需的安全性、