
什么是 LIBERO?
LIBERO 是一个基于 robosuite 框架构建的综合性基准测试平台,专为研究多任务和终身机器人学习中的知识迁移而设计。它聚焦于机器人操作任务,要求智能体掌握两类核心知识:
- 陈述性知识:关于物体属性及空间关系的理解
- 程序性知识:关于运动控制与行为序列的执行
核心设计逻辑
任务生成与基准构建
LIBERO 提供了一套程序化生成管道,理论上可生成无限数量的操作任务。系统目前包含 130 个任务,划分为四个主要套件,每个套件都引入了受控的分布偏移以测试迁移能力:
- LIBERO-Spatial/Object/Goal:分别专注于特定类型知识的迁移验证
- LIBERO-100:包含 100 个需要迁移纠缠知识的复杂操作任务
学习框架与策略架构
由于任务通常使用稀疏奖励函数(仅任务完成时获得 +1 奖励),系统主要采用模仿学习方法,利用高质量的人类遥操作演示数据进行训练。
视觉运动策略网络实现了三种主流架构:
bc_rnn_policy:基于 RNN 的行为克隆策略bc_transformer_policy:基于 Transformer 的行为克隆策略bc_vilt_policy:基于视觉 - 语言 Transformer 的行为克隆策略
同时支持五种经典的终身学习算法:
base:顺序微调(基线)er:经验回放(Experience Replay)ewc:弹性权重巩固(Elastic Weight Consolidation)packnet:渐进式网络架构方法multitask:多任务学习(基线)
任务套件详解
LIBERO 共包含 130 个任务,分为四个主要套件。其中 LIBERO-100 进一步拆分为用于预训练的 LIBERO-90 和用于测试下游持续学习性能的 LIBERO-10。
1. LIBERO-Spatial(空间关系迁移)
这 10 个任务的核心目标一致:将黑碗放到盘子上,但初始位置各异,旨在测试空间泛化能力:
- 拾取盘子和小碗之间的黑碗并放到盘子上
- 拾取小碗旁边的黑碗并放到盘子上
- 拾取桌子中央的黑碗并放到盘子上
- 拾取饼干盒上的黑碗并放到盘子上
- 拾取木柜顶部抽屉中的黑碗并放到盘子上
- 拾取小碗上的黑碗并放到盘子上
- 拾取饼干盒旁边的黑碗并放到盘子上
- 拾取炉子上的黑碗并放到盘子上
- 拾取盘子旁边的黑碗并放到盘子上
- 拾取木柜上的黑碗并放到盘子上
2. LIBERO-Object(物体知识迁移)
这 10 个任务涉及将不同物体放入篮子,考察对物体类别的识别与操作:
- 拾取字母汤罐头并放入篮子
- 拾取奶油奶酪并放入篮子
- 拾取沙拉酱并放入篮子
- 拾取烧烤酱并放入篮子
- 拾取番茄酱并放入篮子
- 拾取番茄酱罐并放入篮子


