宇树 Qmini 双足机器人训练实战与避坑指南
本文基于在云服务器环境下的完整训练与测试实践,涵盖训练配置、可视化调试、策略导出及 URDF 校验等环节。重点解析 Headless(无显示)环境下 Isaac Gym 渲染黑屏的成因与解决方案。
核心建议:云端训练,本地验证
起初尝试将训练、渲染和视频录制全流程部署在云服务器上,但实际效果并不理想。即使使用 Xvfb 等虚拟显示器启动 Isaac Gym,视频保存往往全黑;VNC 远程桌面也无法正常显示渲染窗口。
根本原因在于 GPU 驱动版本过新,超出了 Isaac Gym 渲染器的兼容范围。因此更推荐采用以下流程:
- 云服务器:专注模型训练与权重保存。
- 本地 Ubuntu:加载策略进行测试、演示与视频录制。
项目源码参考:RoboTamer4Qmini
训练阶段配置
使用 train.py 脚本进行训练,以下是常用参数说明:
python train.py --config BIRL --name <name>
| 参数 | 说明 |
|---|---|
--name | 实验名称,结果存放于 experiments/<name>/ |
--config | 配置文件选择,默认为 BIRL |
--resume | 恢复中断的训练 |
--render | 开启画面显示(需本地或带显卡环境) |
--fix_cam | 视角固定在机器人上方 |
--horovod | 启用多 GPU 分布式训练 |
--rl_device | 训练设备设置,默认 cuda0,可改为 cpu |
--num_envs | 并行环境数量 |
--seed | 随机种子,便于复现 |
--max_iterations | 最大训练迭代次数 |
恢复训练示例
python train.py --name stand --resume --path experiments/stand/checkpoints/policy_40000.pt


