十分钟搞懂 AI 时代核心概念:OpenClaw、Agent、Skill、Token、LLM 到底是什么?

十分钟搞懂 AI 时代核心概念:OpenClaw、Agent、Skill、Token、LLM 到底是什么?

你有没有遇到过这种情况——别人聊天时提到"Agent"、"Token"、"Skill"这些词,你感觉自己在听天书?

别慌,今天我用最通俗的方式,带你一次性搞懂这些概念,以及它们之间的关系。


先从最基础的开始:大语言模型(LLM)

大语言模型,英文缩写是 LLM,你可以把它理解为 AI 领域的"超级大脑”。

你可以想象一个读遍了全世界所有图书馆的学者,什么都懂一点。你问它问题,它能理解你的意思并给出回答。GPT-4、Claude、 Gemini、文心一言、通义千问,这些都是大语言模型。

在 OpenClaw 里,当前使用的模型是 MiniMax-M2.5,这就是它的"大脑”,负责思考和回答问题。


Token:语言的"像素”

Token 这个词有两种含义,你得区分清楚:

第一种:词元。这是语言模型处理文本的最小单位。比如"你好"这两个字,在 LLM 眼里可能是 2 个 Token。为啥?因为模型不直接"看”字,而是把文字切成一个个小碎片来处理。

第二种:令牌。这是访问系统的"身份证”,比如你调用某个 API 时需要用的 API Token。

为什么 Token 很重要?因为它是 LLM 的"粮食”。模型一次只能处理固定数量的 Token,这叫"上下文窗口”。而且对开发者来说,Token = 费用——你用的越多,收费越多。

简单理解:把 Token 想象成语言的"像素”。一张图片由无数像素组成,一段文字由无数 Token 组成。LLM 每次"看”文章,只能看固定数量的"像素”。

Agent:能千活的 AI

Agent,中文叫"智能体”。这是 AI 时代最重要的概念之一。

普通的 AI 只能回答问题,比如你问 ChatGPT"今天天气怎么样”,它会告诉你。而 Agent 不仅能回答,还能自主决策和执行

举个例子:

  • 普通 AI:你问"帮我订一张去北京的机票”,它会告诉你怎么订。
  • Agent:你说"帮我订一张去北京的机票”,它真的会去查航班、比较价格、完成下单。

这就是区别——Agent 有"手脚”,不只是动脑。

Agent 的核心能力包括四个方面:

  1. 感知——接收信息(用户消息、文件、环境状态)
  2. 思考——分析问题、制定计划
  3. 行动——执行操作(发送消息、读写文件、调用工具)
  4. 学习——从经验中改进

在 OpenClaw 里,当前运行环境就是 agent=main,OpenClaw 本身就是一个 Agent 运行环境。


Skill:Agent 的工具箱

Skill,中文叫"技能”。如果说 Agent 是"通用人才”,那 Skill 就是"专业证书”。有了某个 Skill,Agent 就能做特定的事情。

举几个 OpenClaw 中的 Skill 例子:

  • feishu-doc:读写飞书文档
  • feishu-wiki:管理飞书知识库
  • browser:浏览器自动化
  • weather:查询天气
  • skill-creator:创建新技能

这就像什么?传统开发是你要写代码、编译、运行,很麻烦。而有了 Skill,就像安装了一个 App,Agent 自动就会用这个功能。


OpenClaw:AI 手机的"操作系统”

OpenClaw 是一个 AI Agent 运行环境,你可以把它理解成 AI 手机的"操作系统”。

  • OpenClaw = 安卓系统
  • Agent = 手机上的 App
  • Skill = App 的功能插件

OpenClaw 让 Agent 能够:

  • 接收和发送消息(飞书、Discord、Telegram 等)
  • 调用各种工具(浏览器、文件、API)
  • 使用 Skills 扩展能力
  • 持久化记忆

Claude Code:编程专用 Agent

Claude Code 是 Anthropic 公司推出的 AI 编程助手,专门帮助开发者:

  • 编写和调试代码
  • 执行终端命令
  • 操作文件
  • 自动化开发流程

它和普通对话版 Claude 的区别在于:普通版是通用 AI 助手,而 Claude Code 是专门为编程场景优化的 Agent。


它们是怎么配合干活的?

说了这么多概念,它们实际是怎么配合工作的?让我举个例子:

场景:用户问"今天天气怎么样?”

  1. 用户发送消息"今天天气怎么样?”
  2. OpenClaw 接收消息,交给 Agent 处理
  3. Agent 理解用户意图:需要查询天气
  4. Agent 调用 Skill: weather(天气技能)
  5. weather Skill 调用外部天气 API
  6. 返回天气信息给 Agent
  7. Agent 调用 LLM 整理回答
  8. OpenClaw 把回答发送给用户

这就是完整的工作流程!


一张图看懂层次关系

如果你还是觉得抽象,我给你一个简单的类比:

概念类比角色
LLM人类的大脑负责思考和理解
Token语言的像素信息的基本单位
Agent公司的员工决策和执行者
Skill员工的证书专业能力
OpenClaw公司的办公系统运行平台
Claude Code专业编辑器专用工具

小结

今天我们聊了六个核心概念:

  1. LLM 是基础——负责理解和生成语言,是所有 AI 的"大脑”
  2. Token 是燃料——LLM 处理信息的单位,也用于计费
  3. Agent 是执行者——让 AI 不仅能想,还能做
  4. Skill 是插件——给 Agent 赋予各种专业能力
  5. OpenClaw 是平台——让 Agent 能够运行并与外界交互
  6. Claude Code 是具体产品——专门用于编程的 Agent

一句话概括

OpenClaw 是一个"AI Agent 操作系统”,它让 Agent(内置 LLM 作为大脑)通过 Skills(技能)来执行任务,并与外部世界交互。

现在,你可以出去和别人聊这些概念了!


本文适合:对 AI 感兴趣但不知道从哪开始的小白

Read more

前端文件上传处理:别再让用户等待了!

前端文件上传处理:别再让用户等待了! 毒舌时刻 文件上传?听起来就像是前端工程师为了显得自己很专业而特意搞的一套复杂流程。你以为随便加个input[type=file]就能实现文件上传?别做梦了!到时候你会发现,大文件上传会导致页面崩溃,用户体验极差。 你以为FormData就能解决所有问题?别天真了!FormData在处理大文件时会导致内存溢出,而且无法显示上传进度。还有那些所谓的文件上传库,看起来高大上,用起来却各种问题。 为什么你需要这个 1. 用户体验:良好的文件上传处理可以提高用户体验,减少用户等待时间。 2. 性能优化:合理的文件上传策略可以减少服务器负担,提高上传速度。 3. 错误处理:完善的错误处理可以避免上传失败时的用户困惑。 4. 安全保障:安全的文件上传处理可以防止恶意文件上传,保障系统安全。 5. 功能丰富:支持多文件上传、拖拽上传、进度显示等功能,满足不同场景的需求。 反面教材 // 1. 简单文件上传 <input type="file&

Java Web 开发环境搭建:IDEA+Tomcat 安装与部署超详细教程

Java Web 开发环境搭建:IDEA+Tomcat 安装与部署超详细教程

在 Java Web 开发中,IDEA 作为主流的集成开发工具,搭配 Tomcat 轻量级 Web 服务器是入门首选。本文将基于 Java Web 基础开发要求,从 JDK 环境配置、Tomcat 安装配置、IDEA 安装、Web 项目创建,到 Tomcat 在 IDEA 中的部署运行,进行一步一图式详细讲解,零基础也能轻松上手。 一、前置准备:JDK 环境配置 Java Web 开发的核心基础是 JDK,Tomcat 和 IDEA 的运行都依赖 JDK 环境,需先完成 JDK 的安装与环境变量配置。 1. 下载与安装

AI 入门—— 一起来学Function Call、MCP、Agent

文章大纲 * 引言 * 一、Function Call * 1、核心价值 * 2、Function Call 时序图 * 3、Function call如何嵌入到模型中? * 二、什么是MCP? * 三、MCP Server * 1、MCP 架构 * 2、MCP的通信机制 * 3、MCP Server的核心功能 * 3.1、动态工具发现 * 3.2、权限控制与安全执行 * 3.3、资源暴露与工具调用 * 3.4、实时通信与上下文管理 * 4、MCP Server的应用 * 5、[MCP 的开发(略)](https://modelcontextprotocol.io/quickstart/

Flutter 三方库 flutter_dropzone 的鸿蒙化适配指南 - 掌握万物皆可拖拽的资源流转技术、助力鸿蒙大屏与 Web 应用构建极致直观的文件导入与交互体系

Flutter 三方库 flutter_dropzone 的鸿蒙化适配指南 - 掌握万物皆可拖拽的资源流转技术、助力鸿蒙大屏与 Web 应用构建极致直观的文件导入与交互体系

欢迎加入开源鸿蒙跨平台社区:https://openharmonycrossplatform.ZEEKLOG.net Flutter 三方库 flutter_dropzone 的鸿蒙化适配指南 - 掌握万物皆可拖拽的资源流转技术、助力鸿蒙大屏与 Web 应用构建极致直观的文件导入与交互体系 前言 在 OpenHarmony 鸿蒙应用全场景覆盖、特别是适配鸿蒙桌面模式(Desktop Mode)、折叠屏大屏交互及鸿蒙 Web 版推送的工程实战中,“文件拖拽(Drag and Drop)”已成为提升生产力效率的标配功能。用户希望能够像在 PC 上一样,直接将图片或文档拖入应用窗口即可完成上传。如何实现这种跨越边界的直观交互?flutter_dropzone 作为一个专注于“拖放区域感知与文件流提取”的库,旨在为鸿蒙开发者提供一套标准的拖放治理方案。本文将详述其在鸿蒙端的实战技法。 一、原原理分析 / 概念介绍 1.1 基础原理 flutter_dropzone