大语言模型下的多智能体协作机制:全面综述
随着大语言模型(LLMs)的最新进展,代理式人工智能(Agentic AI)在现实应用中取得了显著进展,朝着基于多个大语言模型的智能体迈进,实现感知、学习、推理和协同行动。这些基于大语言模型的多智能体系统(MASs)使得一组智能体能够协作解决复杂任务,并以大规模方式实现集体行动,从孤立的模型转向以协作为核心的方法。
本文提供了关于多智能体系统协作方面的广泛综述,并提出了一个可扩展的框架来指导未来的研究。我们的框架根据关键维度对协作机制进行表征:参与者(涉及的智能体)、类型(例如,合作、竞争或合作竞争)、结构(例如,点对点、集中式或分布式)、策略(例如,基于角色或基于模型)以及协调协议。通过对现有方法的回顾,我们的研究成果为揭示和推动基于大语言模型的多智能体系统向更加智能和协作的解决方案发展,特别是在复杂的现实应用中,提供了基础。
此外,本文还探讨了多智能体系统在不同领域的各种应用,包括 5G/6G 网络、工业 5.0、问答系统、以及社会文化环境,展示了它们的广泛应用和更深远的影响。最后,我们总结了关键经验教训,分析了多智能体系统面临的开放挑战,并指出了朝着人工集体智能发展的潜在研究方向。
1 引言
1.1 动机
大语言模型(LLMs)的最新进展已彻底改变了人工智能(AI),使其能够执行复杂的任务,如创造性写作、推理和决策,堪比人类水平。尽管这些模型在单独使用时展现了显著的能力,但它们仍然存在一些内在的局限性,如幻觉问题、自回归特性(例如,无法进行深思熟虑的推理)和扩展法则。为了应对这些挑战,代理式人工智能(Agentic AI)利用 LLM 作为大脑或协调者,将它们与外部工具和任务(如规划)结合,使基于 LLM 的智能体能够采取行动、解决复杂问题,并与外部环境进行交互。
此外,研究者们越来越多地探索横向扩展——利用多个基于 LLM 的智能体协作实现集体智能。这种方法与多智能体系统(MASs)和协作 AI 的研究方向一致,后者专注于使一组智能体能够协调、共享知识并共同解决问题。这些领域的融合催生了基于 LLM 的多智能体系统,利用多个 LLM 的集体智能来应对复杂的多步挑战。MAS 的灵感不仅来自技术进展,还源于人类集体智能(例如,心智社会,心智理论)。人类社会擅长通过团队合作和专业化实现共享目标,从日常任务到科学发现都可以体现这一点。同样,MAS 旨在模拟这些原则,使 AI 智能体能够通过结合各自的优势和视角有效协作。
基于 LLM 的 MAS 可以通过不同的协作渠道进行协作,这些渠道具有不同的特征。MAS 在各个领域取得了显著成功,通过让智能体之间进行协作和协调,增强了单个 LLM 的能力。这些系统将任务分配给智能体,允许智能体共享知识、执行子任务,并将其努力与共享目标对齐。MAS 的潜在优势是变革性的。它们擅长知识记忆,使得分布式智能体能够保持并共享多样的知识库,而不会使单一系统过载。它们通过将任务分配给不同的智能体来增强长期规划,支持在延续的交互中持续解决问题。此外,MAS 通过汇聚来自多个模型的专业知识和提示/角色,能够实现更有效的泛化,比单一模型更有效地解决各种问题。最后,MAS 通过专业智能体同时管理子任务,提高了交互效率,加速了解决复杂的多步任务。MAS 力求实现集体智能,其中多个智能体的综合能力超过了它们单个贡献的总和。
有效的 MASs 的一个主要关注点是协作机制,它们促使从传统的孤立模型向强调互动的方法过渡,使得智能体能够连接、协商、做决策、规划并共同执行任务,从而推动集体环境中 AI 能力的发展。深入理解 MAS 中的协作机制是解锁其全部潜力的关键。
1.2 现状与贡献
由于基于 LLM 的多智能体协作系统的重要性和迫切需求,已有一些综述文章讨论了这一主题。然而,这些工作往往未能充分探讨基于 LLM 的 MAS 的协作方面和机制,而这些方面对实现智能体朝着共享目标高效协作至关重要。例如,部分工作主要关注单智能体系统,仅在表面层次上提及多智能体协作。
部分工作通过提出一个框架为 LLM 智能体奠定了基础,框架由三部分组成:大脑、感知和行动。该工作强调了使用 LLM 作为智能体的大脑,利用输入模态整合、提示、检索和工具使用等技术。然而,他们对多智能体协作的讨论仅限于智能体行为和个性,未深入探讨使智能体协同工作的机制。其他综述了基于 LLM 的 MAS 成功应用的领域和场景,概述了这些系统的通信结构(分层、去中心化、集中式和共享消息池),但没有涉及协作的其他特征,如类型、策略或协调架构。
其他一些工作,关注协作策略,将其分类为合并、集成和合作。尽管他们的综述讨论了这些策略如何应用于 LLM,并将合作扩展到传统的融合技术之外,但忽略了竞争与合作竞争等其他重要的协作机制,以及超越流行的协作类型的维度。与此不同,部分工作提出了一个增强 LLM 能力的通用框架,展示了 Auto-GPT 等工具如何与该框架对接。然而,协作机制仍然停留在概念层面,缺乏详细的实现和表征。
从上述总结和说明中可以看出,在充分探索基于 LLM 的 MAS 的协作方面和机制上存在明显的不足,这对于使智能体朝着共享目标有效协作至关重要。本工作旨在提供基于 LLM 的多智能体协作系统中智能体间协作基础的全面视角。以协作为主要焦点,我们的研究将基于 LLM 的智能体间协作表征为:参与者(涉及的智能体)、类型(如合作、竞争或合作竞争)、结构(如点对点、集中式或分布式)、策略(如基于角色、基于规则或基于模型)和协调层。我们强调促进有效协作的机制和诀窍,识别 MAS 设计中的关键特征和趋势。通过综述现有方法并识别开放挑战,我们将这些发现综合成一个连贯的框架。该框架为未来研究提供基础,推动 LLM 在 MAS 中的集成,为更具适应性、智能性和合作性的 AI 系统铺平道路,使其能够应对复杂的现实应用。
我们的主要贡献如下:
- 基于 LLM 的 MAS 中的协作方面和机制:我们关注基于 LLM 的多智能体协作的操作机制,强调实现有效协作所需的诀窍,包括协作类型、策略、通信结构和协调架构。


