打造高效的 LLM 多智能体系统:AgentPrune 通信剪枝优化
针对大语言模型驱动的多智能体系统(LLM-MA)中通信开销过大的问题,提出了一种名为 AgentPrune 的通信优化框架。该框架将多智能体系统定义为时空图,识别并剪枝冗余的通信边,旨在降低 Token 消耗的同时保持性能。实验表明,AgentPrune 能无缝集成到现有系统中,显著减少 Token 使用量,并在对抗攻击下表现出更好的鲁棒性。文章还探讨了剪枝策略的泛化性与未来优化方向,包括自适应调整剪枝轮次及结合缓存共享技术。











