LeRobot 框架架构、支持策略、仿真平台与数据格式详解 | 极客日志

PythonAI算法

LeRobot 框架架构、支持策略、仿真平台与数据格式详解

综述由AI生成深入剖析 LeRobot 机器人学习框架。内容涵盖框架整体架构、核心组件（策略系统、数据集管理、环境接口、机器人控制）、支持的多种策略（如 ACT、Diffusion、TDMPC 等）、兼容的仿真环境与物理硬件（如 SO100、XArm）。此外，详细说明了遥操作与数据记录模式的使用方法及 LeRobotDataset 统一数据格式的结构。旨在帮助开发者快速理解并上手 LeRobot 进行机器人应用开发。

星云发布于 2026/4/6更新于 2026/5/2231 浏览

LeRobot 框架架构、支持策略、仿真平台与数据格式详解

引言

LeRobot 框架架构

1.1 框架概述

LeRobot 是一个专注于实际机器人应用的机器人学习框架，它提供了一系列预训练模型、数据集和工具，特别关注模仿学习和强化学习方法。框架的目标是降低机器人技术的入门门槛，使研究人员和开发者能够更容易地开发和部署机器人应用。

1.2 系统架构

LeRobot 的系统架构由几个相互连接的子系统组成，这些子系统协同工作，支持机器人学习。核心基础设施支持机器人学习算法的策略系统、训练数据的数据集管理、模拟的环境接口以及物理硬件交互的机器人控制。示例目录展示了这些系统如何一起使用。

lerobot 系统架构

1.3 代码架构

LeRobot 的代码结构清晰，便于开发者理解和扩展：

.
├── examples            # 示例和教程，从这里开始学习 LeRobot
│   └── advanced        # 包含更高级的示例
├── lerobot
│   ├── configs         # 包含可以在命令行中覆盖的所有选项的配置类
│   ├── common          # 包含核心功能类和工具
│   │   ├── datasets    # 各种人类演示数据集：aloha, pusht, xarm
│   │   ├── envs        # 各种模拟环境：aloha, pusht, xarm
│   │   ├── policies    # 各种策略实现：act, diffusion, tdmpc 等
│   │   ├── robot_devices # 硬件接口：dynamixel 电机，opencv 相机，koch 机器人
│   │   └── utils       # 各种工具函数
│   └── scripts         # 包含通过命令行执行的函数
│       ├── eval.py     # 加载策略并在环境中评估
│       ├── train.py    # 通过模仿学习和/或强化学习训练策略
│       ├── control_robot.py # 远程操作真实机器人，记录数据，运行策略
│       ├── push*dataset*to_hub.py # 将数据集转换为 LeRobot 数据集格式并上传到 Hugging Face hub
│       └── visualize_dataset.py # 加载数据集并渲染其演示
├── outputs             # 包含脚本执行结果：日志、视频、模型检查点
└── tests

相关免费在线工具

加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
RSA密钥对生成器
生成新的随机RSA私钥和公钥pem证书。在线工具，RSA密钥对生成器在线工具，online
Mermaid 预览与可视化编辑
基于 Mermaid.js 实时预览流程图、时序图等图表，支持源码编辑与即时渲染。在线工具，Mermaid 预览与可视化编辑在线工具，online
随机西班牙地址生成器
随机生成西班牙地址（支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选），支持数量快捷选择、显示全部与下载。在线工具，随机西班牙地址生成器在线工具，online
Gemini 图片去水印
基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印，支持批量处理与下载。在线工具，Gemini 图片去水印在线工具，online
curl 转代码
解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。在线工具，curl 转代码在线工具，online

策略类型	描述	使用场景	优点	缺点
ACT (Action Chunking Transformer)	基于 Transformer 的动作分块策略，专为双手操作设计	需要精确协调的双手操作任务，如组装、操作复杂物体	能够学习长期依赖关系，处理复杂序列任务，对时间步长不敏感	训练成本高，需要大量数据，推理速度可能较慢
Diffusion (Denoising Diffusion)	基于扩散模型的视觉运动控制策略	需要精确控制的视觉引导任务，如精确抓取和放置	生成高质量、多样化的动作，对不确定性有良好建模	推理速度较慢，训练过程复杂
TDMPC (Temporal Difference MPC)	时间差分模型预测控制	需要预测性控制的任务，如动态环境中的导航和操作	结合了模型预测控制的规划能力和强化学习的自适应性	对模型精度要求高，计算成本较大
VQBeT (Vector Quantized Behavior)	向量量化行为 Transformer	需要从多样化演示中学习的任务，如多模态行为学习	能够从多样化数据中提取离散行为原语，泛化能力强	离散表示可能限制某些连续控制任务的精度
PI0 (Vision-Language-Action)	视觉 - 语言 - 动作策略	需要语言指导的任务，如遵循自然语言指令的机器人操作	能够理解和执行自然语言指令，多模态融合能力强	对语言理解的准确性依赖高，需要配对的语言 - 动作数据
PI0FAST (Fast Action Tokenization)	快速动作标记化策略	需要实时响应的语言引导任务	比 PI0 更快的推理速度，保持语言理解能力	可能在复杂指令上精度略低于 PI0

环境	描述	特点
Aloha	双手机器人操作任务	专注于双手协调操作，如倒咖啡、开瓶盖等
PushT	物体推动操作任务	专注于推动物体到目标位置的任务
XArm	XArm 机器人操作任务	基于现实世界 XArm 机器人的模拟环境

pip install -e ".aloha, pusht"

参数	类型	描述
fps	int 或 None	限制最大帧率。默认无限制。
teleop_time_s	float 或 None	遥操作持续时间。默认无限。
display_data	bool	是否显示相机馈送和数据可视化。

python lerobot/scripts/control_robot.py \
    --robot.type=so100 \
    --control.type=teleoperate

python lerobot/scripts/control_robot.py \
    --robot.type=so100 \
    --control.type=teleoperate \
    --control.fps=30

参数	类型	描述
repo_id	str	数据集标识符（例如，'username/dataset_name'）
single_task	str	记录期间执行的任务描述
fps	int 或 None	记录的帧率
warmup_time_s	int 或 float	开始数据收集前的预热秒数
episode_time_s	int 或 float	每个片段的数据记录秒数
reset_time_s	int 或 float	每个片段后重置环境的秒数
num_episodes	int	要记录的片段数量
video	bool	是否将帧编码为数据集中的视频
push_to_hub	bool	是否将数据集上传到 Hugging Face Hub
policy	PreTrainedConfig 或 None	用于评估记录的可选策略配置
resume	bool	是否在现有数据集上继续记录
num_image_writer_processes	int	处理帧保存为 PNG 的子进程数
num_image_writer_threads_per_camera	int	每个相机写入 PNG 图像的线程数

python lerobot/scripts/control_robot.py \
    --robot.type=so100 \
    --control.type=record \
    --control.fps=30\
    --control.single_task="抓取乐高积木并将其放入箱中。"\
    --control.repo_id=username/test_dataset \
    --control.num_episodes=1\
    --control.push_to_hub=True

python lerobot/scripts/control_robot.py \
    --robot.type=so100 \
    --control.type=record \
    --control.fps=30\
    --control.repo_id=username/training_dataset \
    --control.num_episodes=50\
    --control.warmup_time_s=2\
    --control.episode_time_s=30\
    --control.reset_time_s=10

python lerobot/scripts/control_sim_robot.py record \
    --robot-path lerobot/configs/robot/your_robot_config.yaml \
    --sim-config lerobot/configs/env/your_sim_config.yaml \
    --fps 30\
    --repo-id $USER/robot_sim_test \
    --num-episodes 50\
    --episode-time-s 30

data
├── chunk-000
│   ├── episode_000000.parquet
│   ├── episode_000001.parquet
│   └── ...
├── chunk-001
│   ├── episode_001000.parquet
└── ...
meta
├── episodes.jsonl
├── info.json
├── stats.json
└── tasks.jsonl
videos
├── chunk-000
│   ├── observation.images.camera1  # 'camera1' 是示例名称
│   │   ├── episode_000000.mp4
│   ├── observation.images.camera2
├── chunk-001
└── ...

LeRobot 框架架构、支持策略、仿真平台与数据格式详解

LeRobot 框架架构、支持策略、仿真平台与数据格式详解

引言

LeRobot 框架架构

1.1 框架概述

1.2 系统架构

1.3 代码架构

更多推荐文章

相关免费在线工具

1.4 主要组件

1.4.1 策略系统

1.4.2 数据集管理

1.4.3 环境接口

1.4.4 机器人控制

LeRobot 支持的策略

LeRobot 支持的仿真平台和硬件

3.1 支持的仿真环境

3.2 硬件支持

3.3 SO100 机器人案例分析

3.3.1 SO100 硬件架构

3.3.2 SO100 控制流程

使用 LeRobot 进行遥操作和数据采集

4.1 遥操作模式

4.1.1 遥操作流程

4.1.2 遥操作配置

4.1.3 遥操作命令示例

4.2 数据记录模式

4.2.1 记录流程

4.2.2 使用策略记录

4.2.3 记录配置

4.2.4 记录命令示例

4.3 模拟环境中的数据采集

LeRobot 数据格式

5.1 LeRobotDataset 格式概述

5.2 数据集结构

5.3 数据集组件

结论

更多推荐文章

相关免费在线工具

LeRobot 框架架构、支持策略、仿真平台与数据格式详解

LeRobot 框架架构、支持策略、仿真平台与数据格式详解

引言

LeRobot 框架架构

1.1 框架概述

1.2 系统架构

1.3 代码架构

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

1.4 主要组件

1.4.1 策略系统

1.4.2 数据集管理

1.4.3 环境接口

1.4.4 机器人控制

LeRobot 支持的策略

LeRobot 支持的仿真平台和硬件

3.1 支持的仿真环境

3.2 硬件支持

3.3 SO100 机器人案例分析

3.3.1 SO100 硬件架构

3.3.2 SO100 控制流程

使用 LeRobot 进行遥操作和数据采集

4.1 遥操作模式

4.1.1 遥操作流程

4.1.2 遥操作配置

4.1.3 遥操作命令示例

4.2 数据记录模式

4.2.1 记录流程

4.2.2 使用策略记录

4.2.3 记录配置

4.2.4 记录命令示例

4.3 模拟环境中的数据采集

LeRobot 数据格式

5.1 LeRobotDataset 格式概述

5.2 数据集结构

5.3 数据集组件

结论

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具