《Science》观点解读:AI 无法创造真正的智能体(AI Agent)
人工智能大模型的突破引发了广泛关注,乐观者认为通用人工智能(AGI)即将诞生,担忧者则警惕超级智能体的风险。然而,最新一期《Science》期刊发表的文章'Large AI models are cultural and social technologies'提供了另一种思考角度,提醒我们重新审视这些技术的本质。
芝加哥大学圣达菲研究所和约翰霍普金斯大学等多所顶尖机构的研究人员指出,关于大模型和 AGI 的宏大叙事,不仅让人误解了模型的本质及其与过去技术变革的关系,更重要的是转移了对真实问题和机遇的关注,忽视了历史经验。
一、大模型的'超能力'从何而来?
1. 如何理解大模型的核心运作逻辑
要理解这个论断,需先拆解大模型的运作机制。以 GPT-4、通义千问为代表的超大规模语言模型,核心是统计学与信息压缩技术的集大成者。它们的工作原理类似一个超级精密的'文化蒸馏器':
- 数据吞噬阶段:模型'吞食'互联网上万亿级的文本数据,从《荷马史诗》到维基百科,形成数字文明的'文化母体'。
- 模式提取阶段:通过自注意力机制(Transformer 架构),模型在海量数据中捕捉词语间的概率关系,如同考古学家通过陶片拼凑古代文明图景。
- 概率生成阶段:当用户输入问题时,模型实际上在进行一场复杂的'文化考古',根据统计规律重组已有的知识碎片,生成看似智能的回答。
这种机制导致两个关键特征:知识完全依赖人类输入(无法自主创造新知识),输出本质是概率游戏(所谓'幻觉'正是统计偏差的体现)。这与人类通过感官探索世界、建立认知模型的智能本质存在根本差异。
2. 大模型的文化技术本质
如果我们把视线拉长,会发现大模型并非横空出世的'技术异类',而是人类文化技术演进链条中的新环节:
- 文字与印刷术(公元前 3000 年 -15 世纪):首次实现知识跨时空传递,但受限于物理载体。
- 大众传媒(19-20 世纪):报纸、电视构建信息传播网络,但仍是单向传播。
- 互联网(20 世纪末):实现全球信息互联,但信息呈现碎片化。
- 大模型(21 世纪 20 年代):首次实现对全人类知识的动态压缩与重组,成为'文化处理中枢'。
这种演进揭示了一个规律:每次技术革命都在增强人类处理信息的'带宽'。大模型的独特价值在于,它像一个'文化棱镜',能将杂乱无章的人类知识折射出新的认知光谱。例如,当用户询问'如何向孩子解释量子力学',模型会自动调用物理学、教育学、儿童心理学等跨领域知识,重组出适合不同年龄段的解释方案——这本质上是人类集体智慧的'增强回放'。
二、为何说'超级智能体'是个伪命题?
当前关于 AGI 的狂热想象,往往混淆了工具智能与主体智能的本质区别:
| 维度 | 大模型(工具智能) | 人类/假设中的 AGI(主体智能) |
|---|---|---|
| 知识来源 | 完全依赖训练数据 | 可自主探索环境获取新知识 |
| 认知方式 | 统计关联(相关性) | 因果推理(因果性) |
| 目标设定 | 由人类指令驱动 | 自主生成目标 |
| 适应能力 | 需重新训练适应新场景 | 动态调整应对未知挑战 |
| 能源消耗 | 依赖外部算力供给 | 自主能量获取 |
这种根本差异决定了大模型更像是文明的'外脑',而非独立智能体。就像蒸汽机放大了人类体力但不会自主行动,大模型扩展了人类认知边界,但其'智能'始终是人类智能的投影。


