你是否曾希望家里的机器人助手不仅能递水,还能在你做完饭后顺手把盘子放到碗架的正确位置?这看似简单的顺手一放,对机器人而言却是一场巨大的智能挑战。
近日,慕尼黑工业大学与苏黎世联邦理工联合推出的GOPLA系统,在这一难题上取得了显著进展。这项前沿研究在Hello Robot Stretch 3移动操作机器人上完成验证,该具备空间常识的智能系统,在复杂摆放任务上的成功率比现有优秀方法高出约30%。

Fig. 1: GOPLA系统能够根据人类偏好和3D空间约束,实现泛化性的物体放置.
破解摆放难题:从语义理解到物理约束
机器人智能(具身智能)的重要目标之一是让机器能像人一样在物理世界中自主、合理地行动。而物体放置是检验其智能水平的关键环节。其核心挑战在于:如何让机器同时理解人类模糊的语义指令(放得顺手点)和精确的物理几何约束(不能碰到其他东西)?
GOPLA的三层大脑:各司其职的智能协同
GOPLA的解决方案关键在于其分层决策系统,它让每个部分专注于自己擅长的任务:
- 高层AI翻译官:利用大型多模态模型理解开放式指令,并将其翻译成多个精确的结构化计划。
- 中层空间参谋:将结构化计划转化为3D空间中的可行性地图,为具体行动提供几何常识指导。
- 底层动作执行官:基于扩散模型生成最终动作,并引入实时校准机制确保物理合理性。

Fig. 2: GOPLA的分层模型概览。其工作流程从理解指令开始,最终生成满足语义和物理约束的放置位姿.
低成本数据引擎:突破AI训练瓶颈
该研究的突出亮点之一是构建了低成本自动化数据生成流水线。它能将少量真人示范扩展为海量、多样且带有精确几何标注的合成训练数据。这显著缓解了机器人学习对昂贵、稀缺的真实演示数据的依赖,为解决数据稀缺问题提供了可行方案。
性能表现:显著优于基线模型
实验结果表明,GOPLA在放置准确性、物理合理性和综合成功率上均表现突出,相较于其他优秀方法具有明显优势。

Fig. 4: GOPLA与基线方法的预测效果对比——不仅能捕捉指令施加的偏好,还能尊重空间约束
Hello Robot Stretch 3:可靠的算法验证平台
任何先进算法都需在真实物理世界中验证。本研究选择在Hello Robot Stretch 3开源操作机器人上进行最终测试与部署,体现了该Hello Robot具身智能平台在科研中的重要价值:其开放的软件架构使复杂的感知 - 决策 - 控制流程能够快速集成与迭代。Stretch 3移动操作机器人专为家庭等日常环境设计,在其上的成功验证,切实证明了该技术从实验室走向应用的潜力。
核心价值与启示
GOPLA的大模型 + 领域专家混合架构,为解决更复杂的具身智能问题提供了有效路径。而Hello Robot移动操作机器人作为可靠的物理载体,成为连接前沿算法与真实世界的重要桥梁,有力推动着具身智能的创新进程。



