LeRobot 框架深度解析：架构、策略、硬件与数据采集实战 | 极客日志

PythonAI算法

LeRobot 框架深度解析：架构、策略、硬件与数据采集实战

LeRobot 是一个面向实际机器人应用的开源框架，涵盖模仿学习与强化学习。深入解析其系统架构、核心组件（策略、数据集、环境、控制），对比 ACT、Diffusion 等主流策略优劣，介绍 Aloha、XArm 等仿真环境与硬件支持，并详述遥操作、数据采集流程及 Parquet 数据格式规范，助力开发者快速上手机器人学习项目。

灭霸发布于 2026/4/7更新于 2026/7/2437 浏览

LeRobot 框架深度解析

LeRobot 是一个专注于实际机器人应用的开源学习框架，提供了一系列预训练模型、数据集和工具。它特别关注模仿学习和强化学习方法，旨在降低机器人技术的入门门槛，让研究人员和开发者能更轻松地开发和部署机器人应用。

系统架构概览

LeRobot 的系统架构由几个相互连接的子系统组成，核心基础设施支持算法策略、数据管理、模拟环境接口以及物理硬件交互。这种模块化设计使得各组件既能独立工作，又能协同支撑复杂的机器人学习任务。

系统架构图

代码结构

代码结构清晰，便于开发者理解和扩展。主要目录如下：

.
├── examples             # 示例和教程，从这里开始学习
│   └── advanced         # 包含更高级的示例
├── lerobot
│   ├── configs          # 命令行配置选项类
│   ├── common           # 核心功能类和工具
│   │   ├── datasets     # 人类演示数据集（aloha, pusht, xarm）
│   │   ├── envs         # 模拟环境（aloha, pusht, xarm）
│   │   ├── policies     # 策略实现（act, diffusion, tdmpc 等）
│   │   ├── robot_devices# 硬件接口（dynamixel, opencv, koch）
│   │   └── utils        # 工具函数
│   └── scripts          # 命令行执行脚本
│       ├── eval.py      # 评估策略
│       ├── train.py     # 训练策略
│       ├── control_robot.py # 控制真实机器人，记录数据
│       ├── push_dataset_to_hub.py # 上传数据集到 Hugging Face Hub
│       └── visualize_dataset.py # 可视化数据集
├── outputs              # 脚本执行结果（日志、视频、检查点）
└── tests                # 持续集成测试

这种组织方式让开发者能快速定位所需组件，理解它们之间的依赖关系。

核心组件详解

策略系统

LeRobot 通过统一的工厂接口 make_policy() 实现多种最先进的策略架构。所有策略都实现了 PreTrainedPolicy 接口，包含动作选择和模型训练的方法。训练和评估脚本通过这个工厂与策略交互，无需关心底层实现细节。

数据集管理

数据集系统处理多模态数据的加载、处理和可视化。LeRobotDataset 是核心组件，支持从 Hugging Face Hub 或本地存储访问。系统自动处理片段、视频转换和图像预处理，并可通过 Rerun 或 HTML/Flask 接口进行可视化。

数据集管理

相关免费在线工具

加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
RSA密钥对生成器
生成新的随机RSA私钥和公钥pem证书。在线工具，RSA密钥对生成器在线工具，online
Mermaid 预览与可视化编辑
基于 Mermaid.js 实时预览流程图、时序图等图表，支持源码编辑与即时渲染。在线工具，Mermaid 预览与可视化编辑在线工具，online
随机西班牙地址生成器
随机生成西班牙地址（支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选），支持数量快捷选择、显示全部与下载。在线工具，随机西班牙地址生成器在线工具，online
Gemini 图片去水印
基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印，支持批量处理与下载。在线工具，Gemini 图片去水印在线工具，online
curl 转代码
解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。在线工具，curl 转代码在线工具，online

策略类型	描述	使用场景	优点	缺点
ACT (Action Chunking Transformer)	基于 Transformer 的动作分块策略，专为双手操作设计	需要精确协调的双手操作任务，如组装、复杂物体操作	能学习长期依赖，处理复杂序列，对时间步长不敏感	训练成本高，需大量数据，推理速度可能较慢
Diffusion (Denoising Diffusion)	基于扩散模型的视觉运动控制策略	需要精确控制的视觉引导任务，如抓取和放置	生成高质量、多样化动作，对不确定性建模良好	推理速度较慢，训练过程复杂
TDMPC (Temporal Difference MPC)	时间差分模型预测控制	动态环境中的导航和操作	结合规划能力和强化学习自适应性	对模型精度要求高，计算成本较大
VQBeT (Vector Quantized Behavior)	向量量化行为 Transformer	从多样化演示中学习，多模态行为	提取离散行为原语，泛化能力强	离散表示可能限制连续控制精度
PI0 (Vision-Language-Action)	视觉 - 语言 - 动作策略	遵循自然语言指令的任务	理解并执行指令，多模态融合强	依赖语言理解准确性，需配对数据
PI0FAST (Fast Action Tokenization)	快速动作标记化策略	实时响应的语言引导任务	推理速度快于 PI0，保持语言理解	复杂指令上精度略低于 PI0

pip install -e ".[aloha, pusht]"

环境	描述	特点
Aloha	双手机器人操作任务	专注双手协调，如倒咖啡、开瓶盖
PushT	物体推动操作任务	推动物体到目标位置
XArm	XArm 机器人操作任务	基于现实世界 XArm 机器人的模拟

python lerobot/scripts/control_robot.py \
    --robot.type=so100 \
    --control.type=teleoperate

python lerobot/scripts/control_robot.py \
    --robot.type=so100 \
    --control.type=teleoperate \
    --control.fps=30

python lerobot/scripts/control_robot.py \
    --robot.type=so100 \
    --control.type=record \
    --control.fps=30 \
    --control.single_task="抓取乐高积木并将其放入箱中。" \
    --control.repo_id=username/test_dataset \
    --control.num_episodes=1 \
    --control.push_to_hub=True

python lerobot/scripts/control_robot.py \
    --robot.type=so100 \
    --control.type=record \
    --control.fps=30 \
    --control.repo_id=username/training_dataset \
    --control.num_episodes=50 \
    --control.warmup_time_s=2 \
    --control.episode_time_s=30 \
    --control.reset_time_s=10

python lerobot/scripts/control_sim_robot.py record \
    --robot-path lerobot/configs/robot/your_robot_config.yaml \
    --sim-config lerobot/configs/env/your_sim_config.yaml \
    --fps 30 \
    --repo-id $USER/robot_sim_test \
    --num-episodes 50 \
    --episode-time-s 30

data/
├── chunk-000
│   ├── episode_000000.parquet
│   ├── episode_000001.parquet
│   └── ...
├── chunk-001
│   └── ...
meta/
├── episodes.jsonl
├── info.json
├── stats.json
└── tasks.jsonl
videos/
├── chunk-000
│   ├── observation.images.camera1
│   │   └── episode_000000.mp4
│   └── ...

LeRobot 框架深度解析：架构、策略、硬件与数据采集实战

LeRobot 框架深度解析

系统架构概览

代码结构

核心组件详解

策略系统

数据集管理

更多推荐文章

相关免费在线工具

环境接口

机器人控制

LeRobot 支持的策略

仿真平台和硬件支持

仿真环境

硬件支持

SO100 机器人案例分析

遥操作与数据采集

遥操作模式

数据记录模式

模拟环境数据采集

数据格式规范

LeRobotDataset 概述

文件结构

核心组件

总结

更多推荐文章

相关免费在线工具

LeRobot 框架深度解析：架构、策略、硬件与数据采集实战

LeRobot 框架深度解析

系统架构概览

代码结构

核心组件详解

策略系统

数据集管理

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

环境接口

机器人控制

LeRobot 支持的策略

仿真平台和硬件支持

仿真环境

硬件支持

SO100 机器人案例分析

遥操作与数据采集

遥操作模式

数据记录模式

模拟环境数据采集

数据格式规范

LeRobotDataset 概述

文件结构

核心组件

总结

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具