
PointWorld: 扩展野外机器人操作的三维世界模型论文笔记
综述由AI生成POINTWORLD,一个大规模预训练的三维世界模型,旨在解决机器人在野外复杂环境中的操作预测问题。该模型将状态(场景点云)与动作(机器人点流)统一表示在三维空间中,通过预测全场景三维点流来模拟物理交互。研究团队构建了包含约 200 万条轨迹的大规模数据集,涵盖了真实与仿真环境中的多种机器人操作任务。实验表明,POINTWORLD 采用 PTv3 主干网络,结合运动加权与不确定性正则化训练,实现了 0.1 秒的实时推理。在零样本设置下,…











