XRoboToolkit —— 基于 PICO 4 Ultra 的机器人遥操作方案(一)
系列文章目录
目录
前言
视觉-语言-动作模型(Vision-Language-Action models)的快速发展催生了对大规模、高质量机器人演示数据集的迫切需求。尽管遥操作是数据采集的主要方法,但现有方法存在可扩展性有限、设置流程复杂以及数据质量不佳等问题。本文提出XRoboToolkit,这是一个基于OpenXR标准的跨平台扩展现实(XR)机器人遥操作框架。该系统具备低延迟立体视觉反馈、基于优化的逆运动学算法,并支持多种跟踪模态,包括头部、控制器、手部及辅助运动追踪器。XRoboToolkit的模块化架构可实现跨机器人平台与模拟环境的无缝集成,涵盖精密机械臂、移动机器人及灵巧手等场景。我们通过精密操作任务演示了该框架的有效性,并通过训练展现出 robust 自主性能的 VLA 模型来验证数据质量。
@article{zhao2025xrobotoolkit,
title={XRoboToolkit: A Cross-Platform Framework for Robot Teleoperation},
author={Zhigen Zhao and Liuchuan Yu and Ke Jing and Ning Yang},
journal={arXiv preprint arXiv