医疗场景下多智能体协同路径规划技术演进与建模
随着智慧医院与医疗物流自动化进程的加速,基于多智能体系统的服务机器人正逐步承担起药品配送、样本转运、器械回收及环境消杀等关键任务。传统多智能体路径规划(Multi-Agent Path Finding,MAPF)方法的核心目标在于实现智能体'无碰撞地抵达各自目标',其典型算法如冲突基搜索(Conflict-Based Search,CBS)及其改进版本 ECBS、EECBS 等,优化目标多集中于路径总成本(Sum of Costs)或完工时间(Makespan)。然而,此类范式难以直接适配医疗场景中复杂的时空耦合、任务依赖以及共享资源(如电梯、门禁)调度等核心约束。
近年来,协同式多智能体路径规划(Cooperative MAPF,Co-MAPF)作为一种新兴范式被提出,旨在形式化并解决'协同任务执行'与'动态避碰'的联合优化问题。例如,Greshler 等人提出的 Co-CBS 算法框架,成功将协同规划模块嵌入经典 CBS 架构,为多机器人协同作业提供了新思路。本综述面向医院室内复杂环境,系统性地梳理了从经典 MAPF 到 Co-MAPF 的理论演进与技术谱系。文章重点剖析了 CBS、ECBS/EECBS 以及连续时间 MAPF(CCBS)等核心算法在医疗物流、手术器械流转及多楼层导航场景中的适配性挑战与改造潜力。
结合真实的医院机器人车队实地研究与多楼层图路径规划实践,本文提出了一套面向医疗场景的 Co-MAPF 协同需求建模方法论。该方法涵盖了对电梯/门禁等共享资源的时空槽预约机制、无菌区时间窗约束、任务依赖图与会合点优化等关键问题的形式化描述。在工程实践层面,本文以 Python 开源生态为基础,设计并阐述了一个可扩展的 Co-CBS 实现框架,并构建了一套涵盖任务完成率、交叉污染风险、资源冲突率、路径效率与协同流畅度的多维医疗场景评测指标体系。最后,针对医院环境中普遍存在的人流不确定性、电梯调度优化及人机共融安全等工程部署难题,本文探讨了分层解耦的系统架构、在线重规划策略以及与机器人操作系统(ROS)的集成路径。
第一章 从 MAPF 到 Co-MAPF:协同范式的理论演进与需求必然
1.1 经典 MAPF 技术框架及其在医疗场景的局限性
多智能体路径规划(MAPF)作为移动机器人学和人工智能交叉领域的一个基础性问题,其研究旨在为共享工作空间中的多个智能体规划无碰撞且满足特定优化目标的路径。经典的 MAPF 问题通常在一个静态图环境 $G=(V, E)$ 中定义,其中 $V$ 代表节点(位置),$E$ 代表边(连接)。给定一组智能体 $A = {a_1, a_2, …, a_n}$,每个智能体 $a_i$ 拥有一个起始节点 $s_i \in V$ 和一个目标节点 $g_i \in V$。问题求解即在离散时间步 $t = 0, 1, 2, …$ 上,为每个智能体寻找一条路径 $\pi_i$,并满足以下核心约束:首先,路径必须连通起始点与目标点;其次,任意两个智能体在相同时刻不能占据同一节点(顶点冲突)或交换位置(边冲突)。常见的优化目标包括最小化所有智能体路径长度之和(Sum of Costs,SOC)或最小化最后一个智能体到达目标的时间(Makespan)。
由于 MAPF 问题被证明是 NP-Hard 的,学术界发展出了一系列高效的(次)最优求解算法。其中,冲突基搜索(CBS)及其变体构成了当前最具影响力的算法家族之一。CBS 采用两层搜索结构:底层为每个智能体执行受约束的时空 A*搜索,高层则维护一棵约束树(CT),通过不断解析底层路径产生的冲突(如顶点、边冲突)并施加新的约束来分支搜索,直至找到无冲突的可行解。为进一步平衡最优性与计算效率,有界次优算法如 ECBS(Enhanced CBS)和 EECBS(Explicit Estimation CBS)被提出。它们通过引入聚焦搜索(Focal Search)和显式代价估计,在预设的次优界(如 1.2 倍最优)内显著加速求解过程。对于动态或连续时间环境,研究者将安全区间路径规划(SIPP)与 CBS 结合,形成了连续时间 CBS(CCBS),使得算法能够处理动态障碍物和更精细的时间解析度。
尽管上述经典 MAPF 算法在仓库自动化、视频游戏等场景中取得了巨大成功,但当其直接应用于医院这一特殊、高标准的动态环境时,便暴露出若干根本性的适配缺陷:
- 目标函数单一性与医疗绩效指标脱节:经典 MAPF 以 SOC 或 Makespan 为核心优化目标,这本质上是'距离'或'时间'的度量。然而,医院物流的绩效核心是医疗服务质量与安全。例如,紧急药品的配送,'及时性'并非简单的路径最短,而是在严格的时间窗内送达;手术器械的流转,首要目标是'零污染',路径长度退居次要。经典 MAPF 的目标函数难以直接映射和优化这些更高阶的、业务驱动的绩效指标(如送达及时率、污染违规次数)。
- 缺乏对协同任务与流程的显式建模能力:医疗作业具有强烈的流程性与协同性。例如,术后器械回收流程可能涉及:手术室机器人将污染器械箱运至污物通道出口,再由专用污物转运机器人接驳至消毒供应中心。这要求两台机器人在特定时间、特定地点(会合点)完成'交接'。经典 MAPF 将每个机器人视为独立寻址至固定目标的个体,这种'点对点'模型无法自然表达'交接'这一蕴含时空耦合与智能体间依赖关系的协同行为。虽可通过巧妙设置中间目标点来近似模拟,但会导致问题建模复杂、约束表达能力弱,且易造成规划组合爆炸。
- 对关键共享资源的调度能力薄弱:医院是多楼层建筑,电梯是垂直交通的核心瓶颈资源,其调度直接影响全院物流效率。研究已表明,将电梯简单建模为图中的普通节点会引发严重的排队和冲突。经典 MAPF 算法缺乏对电梯容量、往返时间、预约机制等调度属性的内置支持,难以实现路径规划与资源调度的一体化优化。类似的问题也存在于单通道门禁、消毒舱等需要独占使用的资源上。
- 对环境安全分区与感染控制考虑不足:医院内部存在严格划分的洁净区、污染区和缓冲区。传统 MAPF 通常通过设置'禁行区'来阻止机器人进入某些区域,但这种'0-1'二元模型过于粗糙。它无法表达'允许进入,但需先消毒'或'从 A 区到 B 区必须经过 C 缓冲通道'等复杂的、带有条件和时间属性的流动规则。这不利于系统性防控因机器人移动导致的交叉感染风险。


