ClawWork:香港大学开源 AI 智能体经济模拟平台技术解析
当大模型面临真实的成本约束时,其决策逻辑将发生根本性变化。ClawWork 通过引入经济机制,测试 AI 智能体在资源受限环境下的生存与盈利能力。
项目背景
2026 年 2 月,香港大学数据科学实验室(HKUDS)在 GitHub 上开源了 ClawWork 项目。如果说 OpenClaw 赋予了 AI 操作系统的控制权,那么 ClawWork 则是将 AI 置于真实的经济环境中进行验证。
该项目设定了一个极具挑战性的目标:7 小时内赚取$10K。这不仅是噱头,更是对 AI 商业化能力的真实检验。
核心规则:
- 启动资金:每个 AI 智能体初始资金为$10,无试错资本。
- 成本核算:大模型 Token、Tavily 网页搜索($0.0008/次)、Jina 抓取($0.05/1M Tokens)均需付费。
- 任务类型:涵盖制造、金融、医疗等 44 个经济领域的 220 个真实专业任务(基于 GDPVal 数据集)。
- 淘汰机制:账户资金耗尽,智能体直接被淘汰。
社区评价指出:"不能赚钱的 AI 都是玩具。"ClawWork 迫使 AI 学会在"完美质量"与"执行成本"之间寻找平衡。
核心机制:从对话工具到经济参与者
传统 AI 本质是租赁软件,而 ClawWork 将 AI 升级为经济参与者(Economic Participant)。
| 维度 | 传统评测 (MMLU/HumanEval) | ClawWork 变革 | 核心价值 |
|---|---|---|---|
| 评测指标 | 静态准确率 | 经济回报率 (ROI) | 商业化验证 |
| 任务类型 | 学术题库 | 真实职场任务 | 接轨现实 |
| 容错机制 | 无限重试 | 残酷淘汰 | 成本意识 |
架构揭秘:Nanobot 驱动的经济内循环
ClawWork 底层采用 Nanobot 架构,摒弃冗余的用户交互代码,内核精简为"打工机器与记账本"。
[ 真实经济大盘 (GDPVal Task Pool)] │ ▼ 1. 派发任务 & 初始资金 ($10) ┌───────────────────────────────┐ │ Nanobot Core │ ← 核心调度与财务控制平面 │ [ 全局计费与状态监控模块 ] │ └──────────────┬────────────────┘ │ ┌────────┼────────┐ 2. 调度与计费执行 ▼ ▼ ▼ LLM 大脑 Web 搜索器 代码执行器 (按 Token 计费)(每次$0.0008)(算力燃烧) │ ▼ 3. 提交标准产物 (Artifact) ┌───────────────────────────────┐ │ 上帝裁判机 (Judge LLM) │ ← 验收、打分与结算 └───────────────────────────────┘ │ . - 分评估 & 结算打款 ($ ~ $) ▼


