什么是 AI Agent 中的 Skills?它有什么用?

什么是 AI Agent 中的 Skills?它有什么用?

👨‍⚕️主页: gis分享者
👨‍⚕️感谢各位大佬 点赞👍 收藏⭐ 留言📝 加关注✅!
👨‍⚕️收录于专栏:AI大模型原理和应用面试题

文章目录


一、🍀Skills

1.1 ☘️概念

Skills 就是给 AI Agent 写的操作手册,本质上是一份结构化的指令文件。当 Agent 碰到某类任务,就去读对应的 Skill,按里面的步骤一步步执行,不用你每次从头教它。

比如你想让 AI 帮你创建 Cursor 的自定义规则文件,规则文件放哪个目录、格式长啥样、有哪些字段,这些东西写一个 create-rule 的 Skill 就搞定了。Agent 碰到相关任务自动加载,不需要你每次重复沟通。

1.2 ☘️作用

1)把某个领域的专业知识、操作步骤、注意事项打包成一个文件,Agent 读了就能干活,不需要每次重复教

2)同一个任务不管执行多少次,Agent 都按 Skill 定义的流程走,输出质量可预期

3)通过编写不同的 Skills,让一个通用 Agent 具备各种垂直领域的专业能力,不需要重新训练模型

一个典型的 Skill 文件通常是 Markdown

Read more

Mac Mini M4 跑 AI 模型全攻略:从 Ollama 到 Stable Diffusion 的保姆级配置指南

Mac Mini M4 本地AI模型实战:从零构建你的个人智能工作站 最近身边不少朋友都在讨论,能不能用一台小巧的Mac Mini M4,搭建一个属于自己的AI开发环境。毕竟,不是每个人都有预算去租用云端的高性能GPU,也不是所有项目都适合把数据传到云端处理。我折腾了大概两周,从Ollama到Stable Diffusion,把整个流程走了一遍,发现M4芯片的潜力远超预期。这篇文章,就是把我踩过的坑、验证过的有效配置,以及一些提升效率的小技巧,毫无保留地分享给你。无论你是想本地运行大语言模型进行对话和创作,还是想离线生成高质量的AI图像,这篇指南都能帮你把Mac Mini M4变成一个得力的AI伙伴。 1. 环境准备与基础配置 在开始安装任何AI工具之前,确保你的系统环境是干净且高效的,这能避免后续无数莫名其妙的依赖冲突。Mac Mini M4出厂预装的是较新的macOS版本,但这还不够。 首先,打开“系统设置” -> “通用” -> “软件更新”,确保你的macOS已经更新到可用的最新版本。苹果对Metal图形API和神经网络引擎的优化通常会随着系统更新而提升,这对于后续运

部署DeepSeek-OCR-WEBUI,轻松实现低显存高吞吐文档处理

部署DeepSeek-OCR-WEBUI,轻松实现低显存高吞吐文档处理 1. 为什么你需要一个真正好用的OCR Web界面? 你是否遇到过这些场景: * 手里有一堆扫描版PDF合同、发票、教材,想快速转成可编辑文本,但传统OCR工具要么识别不准,要么操作复杂,要么要装一堆依赖; * 公司内部需要批量处理日均上千页文档,但现有方案要么卡在显存不足,要么推理太慢,部署成本高得离谱; * 想试试最近很火的DeepSeek-OCR大模型,但看到官方提供的Transformers/vLLM脚本就头大——环境怎么配?参数怎么调?图片传哪儿?结果怎么保存? 别担心。DeepSeek-OCR-WEBUI 就是为解决这些问题而生的:它不是简单套个Gradio外壳,而是深度适配DeepSeek-OCR模型特性的轻量级Web UI,单卡4090D即可启动,8GB显存也能跑Small模式,支持拖拽上传、多图批量、Markdown结构化输出、结果一键下载。 更重要的是——它把论文里那些听起来很酷的“光学上下文压缩”“Gundam动态分辨率”“MoE解码约束”,变成了网页上几个下拉框和滑块。你不

【计算机网络】websockeet是怎么支持全双工的

【计算机网络】websockeet是怎么支持全双工的

文章目录 * 一、先理清基础:HTTP为什么不支持全双工? * 二、WebSocket升级的核心流程:从HTTP到全双工的“切换” * 1. 第一步:HTTP握手(协议升级请求) * 2. 第二步:服务端确认升级 * 3. 第三步:协议切换完成,TCP连接“复用”为WebSocket连接 * 三、WebSocket实现全双工的核心设计 * 1. 底层依赖:TCP的全双工特性(基础) * 2. 帧化设计:打破“请求-响应”的边界 * 3. 无“请求-响应”绑定:主动推送能力 * 4. 持久连接:避免重复握手 * 四、关键对比:HTTP vs WebSocket(全双工维度) * 五、总结 要理解WebSocket通过HTTP升级后实现 全双工通信的核心逻辑,

Hunyuan-MT-7B入门指南:OpenWebUI插件开发——添加术语词典校验功能

Hunyuan-MT-7B入门指南:OpenWebUI插件开发——添加术语词典校验功能 1. 为什么需要术语校验?从翻译痛点说起 你有没有遇到过这样的情况:给客户翻译一份技术文档,明明用的是专业模型,结果“边缘计算”被翻成“edge calculation”,“微服务架构”变成“micro service structure”?或者在处理藏语、维语等少数民族语言时,专有名词前后不一致,同一术语在同一篇文档里出现三种译法? 这恰恰是高质量机器翻译落地中最常被忽视的一环——术语一致性保障。Hunyuan-MT-7B虽然在WMT2025拿下30/31项第一,Flores-200中→多语达87.6%,但它的强项在于通用语义建模和长文本连贯性,而非强制约束特定词汇的固定译法。而真实业务场景中,企业术语库、行业标准词表、客户指定译名,往往比模型本身的“默认最优解”更重要。 本文不讲怎么部署模型、不重复介绍参数性能,而是带你亲手为OpenWebUI添加一个轻量但实用的术语词典校验插件。它能在用户提交翻译请求后、模型正式生成前,自动扫描原文中的关键术语,匹配预设词典,并将校验结果以高亮+提示