跳到主要内容
开源机器人 AI 框架 LeRobot 入门与实践 | 极客日志
Python AI 算法
开源机器人 AI 框架 LeRobot 入门与实践 LeRobot 是基于 PyTorch 的开源机器人学习框架,支持模仿学习与强化学习。文章介绍其架构、数据集管理及策略模型(如 ACT、Pi0)。涵盖 SO101 机械臂硬件校准、遥操作数据采集流程,以及基于 LeIsaac 仿真环境的任务搭建与训练。内容包括环境配置、模型推理及 EnvHub 集成方案,提供从代码安装到实际部署的完整实践指南,适用于具身智能 VLA 入门研究。
人间过客 发布于 2026/4/10 更新于 2026/5/23 15 浏览开源机器人 AI 框架 LeRobot 入门与实践
0 LeRobot 框架介绍
官方教程:LeRobot
LeRobot 是一个由 Hugging Face 团队主导开发的、基于 PyTorch 的开源机器人学习框架。集成了数据集管理、策略训练、仿真环境交互、以及物理机器人控制等多个关键模块的综合性平台。聚焦「真实世界机器人」的 AI 能力落地。主打模仿学习和强化学习。
支持端到端的机器人学习 :从数据收集、处理、模型训练、仿真评估到真实机器人部署,LeRobot 提供了全链路的支持。
与 Hugging Face 生态系统的深度集成 :可以方便地从 Hugging Face Hub 加载预训练模型和标准数据集,加速研究进程。
强大的数据集管理系统 :LeRobotDataset 类支持复杂的多模态数据(如视频、图像、状态、动作序列),并提供高效的数据加载和预处理机制。
灵活的环境接口 :支持多种流行的机器人仿真环境(如 Aloha, PushT, XArm),并易于扩展到新的环境。
模块化与可扩展设计 :统一的机器人接口、数据集格式,快速扩展新硬件 / 数据集。
完善的文档与社区支持 :提供详细的文档和教程,并依托 Hugging Face 社区,为用户提供交流和支持的平台。
支持的环境: LeRobot 通过 Gymnasium 接口支持多个模拟环境:
环境 描述 特点 Aloha 双手机器人操作任务 专注于双手协调操作,如倒咖啡、开瓶盖等 PushT 物体推动操作任务 专注于推动物体到目标位置的任务 XArm XArm 机器人操作任务 基于现实世界 XArm 机器人的模拟环境
支持的硬件: SO101、LeKiwi、Koch、HopeJR、OMX、EarthRover、Reachy2、游戏手柄、键盘、手机、OpenARM、Unitree G1。
支持的策略:
类别 模型 模仿学习 ACT、policy_diffusion、VQ-BeT 强化学习 HIL-SERL、TDMPC 和 QC-FQL(即将推出) VLA 模型 Pi0,Pi0.5,GR00T N1.5,SmolVLA,XVLA
1 SO-ARM100/101 介绍 与 在 LeRobot 中使用
低成本开源机械臂,SO-ARM100/101 作为 LeRobot 生态的核心硬件,通过'领导臂手动操作 + 从动臂执行任务'的模式,可快速实现数据采集、模型训练与自主抓取等功能。
每条臂有 6 个自由度 (DOF): 由于每个关节都是独立驱动的,因此每只手臂都可以执行高级动作和复杂操作。可以在官方文档和 GitHub 存储库中找到详细的组装说明、3D 打印文件、完整的组件列表和校准教程。
下面的教程需要实物,没有实物可以过一眼了解一下框架和流程,流程经过简化了,想要尝试仿真可以跳过。
1.1 安装 conda create -n lerobot python=3.10.18 ffmpeg=7.1.1 -c conda-forge
git clone https://github.com/huggingface/lerobot.git
cd lerobot
pip install -e .
SO100/SO101/Moss 安装 Feetech SDK,LeRobot 采用模块化设计,许多特定功能(如对特定仿真环境或硬件的支持)的依赖是可选的,可以根据需要安装。这有助于保持核心库的轻量化。
pip install -e ".[feetech]"
1.2 校准 lerobot-calibrate --robot.type=so101_follower --robot.port=COM24 --robot.id=my_awesome_follower_arm
lerobot-calibrate --teleop.type=so101_leader --teleop.port=COM22 --teleop.id=my_awesome_leader_arm
需要将机器人所有关节都移动到机械臂关节中间位置,然后一个个活动到他们最大的范围。
1.3 带相机的遥操作 lerobot-find-cameras opencv
lerobot-record --robot.type=so101_follower --robot.port=COM24 --robot.id=my_awesome_follower_arm --robot.cameras="{ fixed: {type: opencv,index_or_path: 0, width: 640, height: 480, fps: 30, rotation: 180}, handeye: {type: opencv,index_or_path: 1, width: 640, height: 480, fps: 30}}" --teleop.type=so101_leader --teleop.port=COM22 --teleop.id=my_awesome_leader_arm --display_data=true --dataset.repo_id=my/demo --dataset.num_episodes=20 --dataset.single_task="Move the pink object to the yellow area." --dataset.push_to_hub=False --dataset.num_episodes=5
--dataset.root= 可以设定指令路径,如果没有设定就是根据 dataset.repo_id 存放在 用户名.cache\huggingface\lerobot\dataset.repo_id。
按右箭头(→):提前停止当前剧集或重置时间并进入下一集。
按左箭头(←):取消当前节目并重新录制。
按下 Esc(ESC):立即停止会话,编码视频并上传数据集。
输入自己的数据集 id 比如 Syanyizhe/Move2。
1.4 训练 lerobot-train --dataset.repo_id=Syanyizhe/Move2 --policy.type=act --job_name=act_so101_test --policy.device=cuda --wandb.enable=false --output_dir=outputs/train/act --policy.push_to_hub=False --steps 5000
也可以在服务器上训练,得到的模型可以上传到 huggingface。
lerobot-train \ --policy=策略 \ --dataset.repo_id=数据集 id
类别 模型 模仿学习 ACT、policy_diffusion、VQ-BeT 强化学习 HIL-SERL、TDMPC 和 QC-FQL(即将推出) VLA 模型 Pi0.5,GR00T N1.5,SmolVLA,XVLA
1.5 推理
评估推理 就和前面遥操作记录数据一样 使用 lerobot-record,但是增加了模型参数,这样就用于不是记录每个回合模型的运行的效果,把结果保存数据集 Syanyizhe/eval_act,然后可以用于下一步的处理,也可以用于在线分析,细看。
lerobot-record --robot.type=so101_follower --robot.port=COM24 --robot.id=my_awesome_follower_arm --robot.cameras="{ wrist: {type: opencv,index_or_path: 1, width: 640, height: 480, fps: 30, rotation: 180}, top: {type: opencv,index_or_path: 2, width: 640, height: 480, fps: 30}, right: {type: opencv,index_or_path: 3, width: 640, height: 480, fps: 30}}" --dataset.single_task="Move the blue cube to the orange rectangle" --dataset.repo_id=Syanyizhe/eval_act --dataset.episode_time_s=50 --dataset.num_episodes=10 --policy.path=outputs/train/act/checkpoints/002000/pretrained_model --display_data=true --dataset.push_to_hub=False
异步推理 你在本地垃圾电脑连着机械臂,但是可以用服务器的算力。
pip install -e ".[async]"
然后,启动一个策略服务器(在一个终端或另一台机器上),指定客户端连接的主机地址和端口。
python -m lerobot.async_inference.policy
这会启动一个策略服务器监听(端口 8080)。此时,策略服务器是空的,因为所有关于运行哪个策略和参数的信息都在与客户端的第一次握手时指定。启动一个客户:127.0.0.1:8080 localhost。
python -m lerobot.async_inference.robot_client --robot.type=so101_follower --robot.port=COM24 --robot.id=my_awesome_follower_arm --robot.cameras="{ fixed: {type: opencv,index_or_path: 0, width: 640, height: 480, fps: 30, rotation: 180}, handeye: {type: opencv,index_or_path: 1, width: 640, height: 480, fps: 30}}" --server_address=<server_address>:8080 --policy_type=act --pretrained_name_or_path=outputs/train/act_so101_test/checkpoints/last/pretrained_model --policy_device=cpu --actions_per_chunk=50 --chunk_size_threshold=0.1 --aggregate_fn_name=weighted_average --task="Move the pink object to the yellow area." --debug_visualize_queue_size=True
2 前置准备与配置环境 如果你之前部署过相关的深度学习环境,可以快速跳过前置准备,进入配置环境。
查看显卡型号、驱动版本、CUDA 驱动支持上限(关键!),如果版本太低就更新一下显卡驱动。
显示已安装的 CUDA Toolkit,如果没有那就去安装。
甚至可以从已安装的应用中搜,版本太低了可以安装新版 CUDA Toolkit。
一般来说,nvidia-smi 显示版本 ≥ nvcc -V 版本 ≥ PyTorch 绑定版本,实际有时候 nvcc -V 版本 < PyTorch 绑定版本 也可以运行。
版本类型 命令 / 代码 本质含义 驱动支持的 CUDA 版本 nvidia-smi驱动能兼容的最高 CUDA 版本 已安装的 CUDA Toolkit 版本 nvcc -V实际可用的 CUDA 编译器 / 库版本 PyTorch 绑定的 CUDA 版本 import torch print(torch.version.cuda) PyTorch 编译时依赖的 CUDA 版本
conda create -n leisaac_envhub python=3.11 conda activate leisaac_envhub
安装 torch 低于自己的 cuda 版本即可:
pip install -U torch==2.7.0 torchvision==0.22.0 --index-url https://download.pytorch.org/whl/cu128
安装 LeIsaac(含 IsaacLab 依赖)(如果你只用实物可以跳过):
pip install "leisaac[isaaclab] @ git+https://github.com/LightwheelAI/leisaac.git#subdirectory=source/leisaac" --extra-index-url https://pypi.nvidia.com
pip install lerobot pip install numpy==1.26.0
3 LeIsaac 操控 SO101 LeIsaac 是一个与机器人学习和仿真相关的框架,主要用于远程操作和数据收集。它结合了 Isaac Sim 和 SO101 机械臂 ,允许用户在仿真环境中进行任务的远程操作和训练。LeIsaac 通过 NVIDIA Isaac Lab 进行数据收集,并支持多种机器人学习任务,如摘橙子和搬立方体等。
任务类型 环境 ID(部分) 任务描述 关联机器人 拣橙子 LeIsaac-SO101-PickOrange-v0(含 Direct 版) 拾取 3 个橙子放入盘子,机械臂复位 单臂 SO101 Follower 举方块 LeIsaac-SO101-LiftCube-v0(含 Direct 版) 举起红色方块 单臂 SO101 Follower 清理桌面 LeIsaac-SO101-CleanToyTable-v0(含双臂版) 拾取 2 个字母「e」形状物体放入盒子,机械臂复位 单臂 / 双臂 SO101 Follower 叠布 LeIsaac-SO101-FoldCloth-BiArm-v0(含 Direct 版) 折叠布料,机械臂复位(仅 Direct 版支持成功检测) 双臂 SO101 Follower
3.1 下载代码和模型 这里先不用 lerobot 中集成的 leisaac,先使用原生的 leisaac,后面会讲原因。
git clone https://github.com/LightwheelAI/leisaac.git
下载 so101_follower.usd 和厨房与橙子场景。
解压放到 assets 中的 robots 和 scenes 文件夹下。
<assets >
├── robots/
│ └── so101_follower.usd
└── scenes/
└── kitchen_with_orange/
├── scene.usd
├── assets
└── objects/
├── Orange001
├── Orange002
├── Orange003
└── Plate
场景名称 描述 下载链接 厨房与橙子 带有橙子的厨房场景示例 下载 光轮玩具房 现代房间,里面有许多玩具 下载 带立方体的表格 一个立方体的简单表格 下载 光轮卧室 用布料的写实卧室场景 下载 光轮阁楼 大型两层阁楼 下载
3.2 键盘遥操作(仅体验) python scripts/environments/teleoperation/teleop_se3_agent.py --task=LeIsaac-SO101-PickOrange-v0 --teleop_device=keyboard --num_envs=1 --device=cuda --enable_cameras
输入键 描述 W / S正反方向,与平移图中的红色箭头对齐 A / D左右方向,与平移图中的绿色箭头对齐 Q / E上下,与平移图中的蓝色箭头对齐 J / L左右旋转(偏航),与旋转图中的蓝色箭头对齐 K / I向上/向下旋转(音高),与旋转图中的绿色箭头对齐 U / O夹子开合
进入 IsaacLab 窗口后,按下键盘上的 b 键以开始远程操作。随后,您可以通过指定的远程操作设备(teleop_device)在仿真环境中控制机器人。完成操作后,若需重置环境,只需按下 r 键或 n 键。其中,r 键表示重置环境并将任务标记为失败,而 n 键表示重置环境并将任务标记为成功。
如要要收集数据,详细的参数需要阅读 teleop_se3_agent.py 代码。
--record:启用数据记录;将远程作数据保存到 HDF5 文件中。
--dataset_file:保存已记录数据集的路径,例如。./datasets/record_data.hdf5
--resume:启用从现有数据集文件记录简历数据。
python scripts/environments/teleoperation/replay.py \ --task=LeIsaac-SO101-PickOrange-v0 \ --num_envs=1\ --device=cpu \ --enable_cameras \ --dataset_file=./datasets/dataset.hdf5 \ --episode_index=0
其实用键盘还是很不方便的,收集的数据也不连贯,这里仅仅体验一下就可,最佳还是用物理主臂。收集的远程作数据以 HDF5 格将 HDF5 数据转换为 LeRobot 数据集格式 python scripts/convert/isaaclab2lerobot.py,可以用 LeRobot 框架训练。
3.3 训练
3.4 推理 cd .. git clone https://github.com/NVIDIA/Isaac-GR00T cd Isaac-GR00T conda create -n gr00t python=3.10 conda activate gr00t pip install --upgrade setuptools pip install -e .[base] pip install --no-build-isolation flash-attn==2.7.1.post4
conda activate gr00t 的环境 cd <Isaac-GR00T 的路径> python scripts/inference_service.py --server --model_path ./so101-orange-checkpoints/checkpoint-10000 --embodiment_tag new_embodiment --data_config so100_dualcam --port 5555
conda activate leisaac 的环境 cd <leisaac 的路径> python scripts/evaluation/policy_inference.py \ --task=LeIsaac-SO101-PickOrange-v0 \ --policy_type=gr00tn1.5 \ --policy_host=localhost \ --policy_port=5555\ --policy_timeout_ms=5000\ --policy_action_horizon=16\ --policy_language_instruction="Pick up the orange and place it on the plate" \ --device=cuda \ --enable_cameras
LeIsaac 主要用于远程操作和数据收集,对于训练推理集成程度是不够的。
4 使用 LeIsaac × LeRobot EnvHub 近期 LeIsaac 集成于 LeRobot 的 EnvHub ,LeIsaac × LeRobot EnvHub 是一套机器人仿真训练闭环工具,支持从「任务搭建→遥操作数据收集→模型训练→成果共享」的全流程,核心优势:
遥操作优先:支持 SO101 Leader/Follower 设备,快速收集演示数据;
无缝适配 LeRobot:内置数据转换功能,收集的演示数据可直接用于 LeRobot 训练;
持续升级:支持云仿真、Sim2Real(仿真到现实)工具链等。
EnvHub 功能允许你用一行代码直接从 Hugging Face Hub 加载模拟环境。
from lerobot.envs.factory import make_env
4.1 验证环境 创建 envhub_random_action.py,加载「拣橙子」环境,机械臂执行随机动作:
import torch from lerobot.envs.factory import make_env
他会从 huggingface_hub 下载,推荐配置镜像源。
conda activate leisaac_envhub
set HF_ENDPOINT=https://hf-mirror.com
验证是否设置成功(CMD 用 %变量名% 读取):
python envhub_random_action.py
需要等他下载完场景,按提示输入 y,等待加载就可以看到乱摆动的机械臂了。
4.2 遥操作(物理设备控制仿真机械臂) 注意!!!! 需连接 SO101 Leader 主臂 ,keybord 遥操作 lerobot 官方没有适配需要自己设置。所以说如果没有实物还是用原生的 leisaac。有实物的话,我建议直接用 lerobot,自己布置实物场景。
lerobot-calibrate \ --teleop.type=so101_leader \ --teleop.port=/dev/ttyACM0
第二步:运行遥操作脚本(envhub_teleop_example.py)
import logging import time import gymnasium as gym from dataclasses import asdict, dataclass from pprint import pformat from lerobot.teleoperators import ( Teleoperator, TeleoperatorConfig, make_teleoperator_from_config, so_leader,)from lerobot.utils.robot_utils import precise_sleep from lerobot.utils.utils import init_logging from lerobot.envs.factory import make_env classTeleoperateConfig: teleop: TeleoperatorConfig env_name:str ="so101_lift_cube" fps:int =60 classEnvWrap: env: gym.Env defmake_env_from_leisaac(env_name:str ="so101_lift_cube" ): envs_dict = make_env(f'LightwheelAI/leisaac_env:envs/{env_name} .py' , n_envs=1 , trust_remote_code=True ) suite_name =next (iter (envs_dict)) sync_vector_env = envs_dict[suite_name][0 ] env = sync_vector_env.envs[0 ].unwrapped return env defteleop_loop(teleop: Teleoperator, env: gym.Env, fps:int ):from leisaac.devices.action_process import preprocess_device_action from leisaac.assets.robots.lerobot import SO101_FOLLOWER_MOTOR_LIMITS from leisaac.utils.env_utils import dynamic_reset_gripper_effort_limit_sim env_wrap = EnvWrap(env=env) obs, info = env.reset()while True : loop_start = time.perf_counter()if env.cfg.dynamic_reset_gripper_effort_limit: dynamic_reset_gripper_effort_limit_sim(env,'so101leader' ) raw_action = teleop.get_action() processed_action = preprocess_device_action(dict ( so101_leader=True , joint_state={ k.removesuffix(".pos" ): v for k, v in raw_action.items()}, motor_limits=SO101_FOLLOWER_MOTOR_LIMITS), env_wrap ) obs, reward, terminated, truncated, info = env.step(processed_action)if terminated or truncated: obs, info = env.reset() dt_s = time.perf_counter()- loop_start precise_sleep(max (1 / fps - dt_s,0.0 )) loop_s = time.perf_counter()- loop_start print (f"\ntime: {loop_s *1e3 :.2 f} ms ({1 / loop_s:.0 f} Hz)" )defteleoperate(cfg: TeleoperateConfig): init_logging() logging.info(pformat(asdict(cfg))) teleop = make_teleoperator_from_config(cfg.teleop) env = make_env_from_leisaac(cfg.env_name) teleop.connect()ifhasattr(env,'initialize' ): env.initialize()try : teleop_loop(teleop=teleop, env=env, fps=cfg.fps)except KeyboardInterrupt:passfinally: teleop.disconnect() env.close()defmain(): teleoperate(TeleoperateConfig( teleop=so_leader.SO101LeaderConfig( port="/dev/ttyACM0" ,id ='leader' , use_degrees=False ,), env_name="so101_pick_orange" , fps=60 ,))if __name__ =="__main__" : main()
脚本核心逻辑:通过物理控制器获取动作,预处理后驱动仿真机械臂,支持 60 FPS 实时交互,可操作「拣橙子」等任务,中断时自动断开设备连接并关闭环境。
通过修改 make_env 的参数切换不同任务,示例:
相关免费在线工具 加密/解密文本 使用加密算法(如AES、TripleDES、Rabbit或RC4)加密和解密文本明文。 在线工具,加密/解密文本在线工具,online
RSA密钥对生成器 生成新的随机RSA私钥和公钥pem证书。 在线工具,RSA密钥对生成器在线工具,online
Mermaid 预览与可视化编辑 基于 Mermaid.js 实时预览流程图、时序图等图表,支持源码编辑与即时渲染。 在线工具,Mermaid 预览与可视化编辑在线工具,online
随机西班牙地址生成器 随机生成西班牙地址(支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选),支持数量快捷选择、显示全部与下载。 在线工具,随机西班牙地址生成器在线工具,online
Gemini 图片去水印 基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印,支持批量处理与下载。 在线工具,Gemini 图片去水印在线工具,online
curl 转代码 解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。 在线工具,curl 转代码在线工具,online