宇树 Qmini 双足机器人训练实战与避坑指南 | 极客日志

PythonAI算法

宇树 Qmini 双足机器人训练实战与避坑指南

基于云服务器环境的宇树 Qmini 双足机器人训练实践总结。针对 Isaac Gym 在 Headless 模式下渲染黑屏的问题，分析 GPU 驱动兼容性限制，提出云端训练加本地验证的最佳实践方案。内容覆盖训练脚本参数详解、TensorBoard 调试、策略导出 ONNX 格式以及 URDF 模型校验步骤，为后续开发者提供关键避坑参考。

灵魂摆渡发布于 2026/3/25更新于 2026/6/1636 浏览

宇树 Qmini 双足机器人训练实战与避坑指南

本文基于在云服务器环境下的完整训练与测试实践，涵盖训练配置、可视化调试、策略导出及 URDF 校验等环节。重点解析 Headless（无显示）环境下 Isaac Gym 渲染黑屏的成因与解决方案。

核心建议：云端训练，本地验证

起初尝试将训练、渲染和视频录制全流程部署在云服务器上，但实际效果并不理想。即使使用 Xvfb 等虚拟显示器启动 Isaac Gym，视频保存往往全黑；VNC 远程桌面也无法正常显示渲染窗口。

根本原因在于 GPU 驱动版本过新，超出了 Isaac Gym 渲染器的兼容范围。因此更推荐采用以下流程：

云服务器：专注模型训练与权重保存。
本地 Ubuntu：加载策略进行测试、演示与视频录制。

项目源码参考：RoboTamer4Qmini

训练阶段配置

使用 train.py 脚本进行训练，以下是常用参数说明：

python train.py --config BIRL --name <name>

参数	说明
`--name`	实验名称，结果存放于 `experiments/<name>/`
`--config`	配置文件选择，默认为 BIRL
`--resume`	恢复中断的训练
`--render`	开启画面显示（需本地或带显卡环境）
`--fix_cam`	视角固定在机器人上方
`--horovod`	启用多 GPU 分布式训练
`--rl_device`	训练设备设置，默认 cuda0，可改为 cpu
`--num_envs`	并行环境数量
`--seed`	随机种子，便于复现
`--max_iterations`	最大训练迭代次数

恢复训练示例

python train.py --name stand --resume --path experiments/stand/checkpoints/policy_40000.pt

调试与监控

TensorBoard 端口占用处理

相关免费在线工具

加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
RSA密钥对生成器
生成新的随机RSA私钥和公钥pem证书。在线工具，RSA密钥对生成器在线工具，online
Mermaid 预览与可视化编辑
基于 Mermaid.js 实时预览流程图、时序图等图表，支持源码编辑与即时渲染。在线工具，Mermaid 预览与可视化编辑在线工具，online
随机西班牙地址生成器
随机生成西班牙地址（支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选），支持数量快捷选择、显示全部与下载。在线工具，随机西班牙地址生成器在线工具，online
Gemini 图片去水印
基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印，支持批量处理与下载。在线工具，Gemini 图片去水印在线工具，online
curl 转代码
解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。在线工具，curl 转代码在线工具，online

安装 lsof

apt-get update && apt-get install lsof -y

查看端口占用
```
lsof -i :6006
```
杀掉进程
```
kill -9 <PID>
```

重新启动 TensorBoard

tensorboard --logdir experiments/<name>/log --port 6006

python play.py --render --name <name>

python export_pt2onnx.py --name <name>

python tune_urdf.py

python tune_pid.py --mode <mode>

Xvfb :1 -screen 0 1024x768x24 &
export DISPLAY=:1

宇树 Qmini 双足机器人训练实战与避坑指南

宇树 Qmini 双足机器人训练实战与避坑指南

核心建议：云端训练，本地验证

训练阶段配置

恢复训练示例

调试与监控

TensorBoard 端口占用处理

更多推荐文章

相关免费在线工具

运行训练好的策略

模型导出与调试

导出 ONNX 模型

URDF 模型调试

PID 自动调参

常见问题排查

Headless 环境无法渲染

视频录制黑屏

更多推荐文章

相关免费在线工具

宇树 Qmini 双足机器人训练实战与避坑指南

宇树 Qmini 双足机器人训练实战与避坑指南

核心建议：云端训练，本地验证

训练阶段配置

恢复训练示例

调试与监控

TensorBoard 端口占用处理

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

运行训练好的策略

模型导出与调试

导出 ONNX 模型

URDF 模型调试

PID 自动调参

常见问题排查

Headless 环境无法渲染

视频录制黑屏

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具