AI 技能（Skills）：一种面向任务自动化的模块化执行范式

Ne0inhk

21 Mar 2026 — 4 min read

AI 技能（Skills）：一种面向任务自动化的模块化执行范式

摘要：Skills 并非新概念，而是对提示工程（Prompt Engineering）与工具调用（Tool Use）的系统性封装。它通过元数据、行动指南与可执行资源的三元结构，将大模型能力从“文本生成”延伸至“闭环操作”。

一、本质定义

Skills 是一种轻量级、可复用的任务执行单元，用于赋予大模型确定性行为能力。
其核心目标是解决传统提示词的三大局限：
- 不可复用：每次需重复编写相似指令；
- 无状态：无法跨会话保持上下文策略；
- 无执行：仅输出文本，无法触发真实动作（如绘图、文件处理、API 调用）。

类比理解：Skills ≈ 函数（Function）
输入：自然语言指令；
输出：结构化结果 + 副作用（如生成图像、修改文件、发送请求）。

二、组成结构

每个 Skill 由三个标准化组件构成：

组件	作用	示例内容	技术价值
元数据（Metadata）	描述技能用途、输入约束、兼容模型等轻量信息	`name: canvas-design`, `input_schema: {subject: string, style: enum}`	支持运行时发现与路由，不消耗推理 Token
行动指南（Action Guide）	结构化提示模板，定义模型如何解析指令、调用资源、组织输出	包含角色设定、步骤约束、错误处理逻辑	保障行为一致性，替代冗长手工 Prompt
资源文件（Resources）	可执行代码（Python/Shell）、配置文件或外部 API 接口定义	`generate_poster.py`、`requirements.txt`、`api_config.yaml`	实现真实世界交互，突破纯文本边界

三、典型应用场景

场景：自动化视觉内容生成

传统方式：向模型提问：“生成一张茶壶海报，风格为极简主义”，模型返回描述性文本，用户需另寻绘图工具实现。
Skills 方式：模型识别指令意图后，自动加载 canvas-design 技能，执行其内置 Python 脚本（基于 Pillow 或 Stable Diffusion API），直接输出 PNG 文件并附带 Markdown 说明文档。

✅ 关键差异：从“描述结果”转向“交付结果”

四、实践部署（以 Claude 为例）

步骤 1：目录结构

myskills/ └── .claude/ └── skills/ # 必须严格命名，区分大小写 ├── canvas-design/ │ ├── skill.md # 元数据 + 行动指南 │ ├── generate_poster.py │ └── requirements.txt └── file-batch-rename/ ├── skill.md └── rename.py

步骤 2：加载与验证

输出示例：

Loaded skills: - canvas-design (v1.2) — Generate marketing posters from text prompts - file-batch-rename (v0.8) — Rename files in bulk with pattern rules

启动 Claude CLI 工具后，执行：

$ claude list-skills

步骤 3：调用示例

$ claude "为新品茶壶生成电商主图，尺寸1200x630，背景纯白" → [自动匹配 canvas-design] → 执行 generate_poster.py → 输出 poster_20260212.png

五、核心优势

维度	传统 Prompt	Skills 模式
复用性	每次重写，难以沉淀	一次开发，项目级/全局复用
可维护性	修改需遍历所有对话历史	仅更新 `skill.md` 与脚本即可
可扩展性	依赖模型原生能力，上限固定	通过新增资源文件持续增强功能边界
可测试性	黑盒响应，难做单元测试	可对 `generate_poster.py` 单独运行 pytest

六、注意事项

❌ 非万能方案：Skills 无法替代领域知识建模或复杂决策逻辑；
❌ 安全边界必须前置：所有资源文件需经沙箱隔离与权限审查（如禁用 os.system、限制网络访问）；
✅ 最佳实践：优先使用声明式元数据（YAML/JSON Schema）替代自由文本描述，便于静态分析与 IDE 支持。

七、延伸参考

官方规范：Claude Skills Documentation
技术演进：Skills 是 Tool Calling 的工程落地形态，与 LangChain Tools、LlamaIndex Functions 等属同源思想。

“什么是中间件“——从炸鸡店到云原生的深度对话

软件工程导论专栏 | 面试官问"什么是中间件"——从炸鸡店到云原生的深度对话前言：一场意想不到的面试想象这样一个场景：你正坐在考研复试的面试教室里，对面坐着三位表情严肃的教授。空气有些凝重，你刚刚回答完关于软件生命周期的问题，心里正琢磨着下一个问题会是什么。突然，中间那位戴眼镜的教授开口了： "同学，你能说说看，什么是中间件吗？" 这个问题看似简单，实则暗藏玄机。如果你只是背诵教材上的定义，可能会让面试官觉得你只是个"背书机器"；但如果你回答得太随意，又可能暴露出你对核心概念理解不深。那么，作为一个本科生，该如何既生动形象又专业深入地回答这个问题呢？让我们用一场模拟面试的方式，带你走进中间件的世界。第一部分：面试开场——从"直觉"说起模拟面试场景面试官："同学，请说说什么是中间件？" 考生小明：（深吸一口气）

CPU 架构：x86、x64、ARM 到底是什么？为什么程序不能通用？

我们日常使用的电脑、手机、服务器，都有一个共同的“核心”——CPU。但不同设备往往运行不同的程序，比如 Windows 版软件不能直接在手机上运行；Linux 的 ARM 可执行文件不能跑在 x86 服务器上。原因就在于 CPU 架构不同。那么，x86、x64、ARM 分别是什么？为什么一个程序不能在它们之间通用？今天我们深度讲解一下。一、x86、x64、ARM 是什么？简单理解：它们是不同的 CPU 指令集架构（ISA）。就像不同语言，中文、日文、英文语法不同，CPU 也有自己的“语法规则”。 1）x86（32 位） • 由 Intel

基于 Spring Boot 的项目中使用微信服务号实现订阅通知的发送

文章目录 * 1. 准备工作 * 2. 添加 Maven 依赖 * 3. 配置文件 * 4. 创建配置类 * 5. 发送订阅通知 * 6. 控制器 * 6.1. 接收消息 & 获取 OpenID 的 Controller * 6.2. 发送订阅通知（使用已保存的 OpenID） * 7. 注意事项上一篇文章介绍的是使用模板消息进行消息的推送，本文使用微信服务号订阅通知来推送消息；因为随着微信的发展，转向使用“订阅通知”是大势所趋。使用微信服务号的订阅通知功能，可以向用户发送定制化的消息。本文给出 Spring Boot 的完整示例，演示如何在微信服务号中实现订阅通知的发送。 1. 准备工作 * 公众号类型：确保你使用的是已认证的服务号。 * 模板申请：你需要先在微信公众平台上为你的服务号申请相应的订阅通知模板，并获取到模板ID。

「深度实战」ERNIE-4.5模型系列全解析：从架构创新到多场景性能测评

文章目录 * 前言 * ERNIE 4.5系列一图看懂 * 核心特点 * 三大分支技术特性与场景定位 * 模型对比总览 * Base 版与进阶版 * 模型版本对比总览 * 详细对比分析 * A47B分支（超大规模多模态） * A3B分支（轻量多模态与高效文本） * 0.3B分支（极致轻量化文本） * 细分逻辑的核心价值 * 1. 降低使用门槛 * 2. 平衡效率与成本 * 3. 适配多样化部署 * 部署及测试 * 测评方法与标准 * 测评维度 * 测评任务类型 * 文本类任务(17种) * 视觉类任务(3种) * 评分标准 * 模型部署测试 * FastDeploy 硬件环境依赖要求 * NVIDIA GPU 环境依赖要求 * Kunlunxin XPU 环境依赖要求 * Iluvatar GPU 环境依赖要求 * Enflame GCU 环境依赖要求