宇树 Qmini 双足机器人训练经验总结 | 极客日志

Python

宇树 Qmini 双足机器人训练经验总结

> RoboTamer4Qmini 本篇内容基于我在 **AutoDL 云服务器** 上对 Qmini 做完整训练与测试的实践总结，涵盖训练、可视化、策略测试、模型导出、URDF 调试等环节，并重点说明 **headless（无显示）环境下的各种坑与解决方案**。前提说明：为什么不建议在云端直接跑渲染？最初的目标是训练、渲染、视频录制全部在 AutoDL 上完成，不经过本地运行。然而现实是：…

云朵棉花糖发布于 2026/4/6更新于 2026/7/773K 浏览

RoboTamer4Qmini

本篇内容基于我在 AutoDL 云服务器 上对 Qmini 做完整训练与测试的实践总结，涵盖训练、可视化、策略测试、模型导出、URDF 调试等环节，并重点说明 headless（无显示）环境下的各种坑与解决方案。

前提说明：为什么不建议在云端直接跑渲染？

最初的目标是训练、渲染、视频录制全部在 AutoDL 上完成，不经过本地运行。然而现实是：

即使用 Xvfb 等虚拟显示器启动 Isaac Gym，也会发生视频保存全黑的情况。
VNC 远程桌面也无法正常显示 Isaac Gym 的渲染窗口。
根本原因来自 驱动版本过高与 Isaac Gym 对驱动的强依赖。

因此更推荐：在云服务器训练模型 → 本地 Ubuntu 加载策略进行测试与演示。

训练阶段

python train.py --config BIRL --name <name>

--name: 存放路径 experiments/<name>/
--config: 选择配置文件，默认：BIRL
--resume: 恢复训练
- 示例：python train.py --name stand --resume --path experiments/stand/checkpoints/policy_40000.pt
--render: 开启画面显示（isaac gym 窗口）
--fix_cam: 视角固定在机器人上方
--horovod: 多 gpu 训练
--rl_device: 训练设备设置，默认 cuda0，可以改为 cpu 等
--num_envs: 环境数量
--seed: 随机种子，利于复现
--max_iterations: 最大训练迭代次数

查看结果

云端可能出现 6006 端口占用 的情况，需要手动释放。

安装 lsof

apt-get update
apt-get install lsof -y

查看端口占用

lsof -i :6006

杀掉进程

kill -9 <PID>

重新启动 TensorBoard

tensorboard --logdir experiments/<name>/log --port 6006

运行训练好的策略 play.py

python play.py --render --name <name>

加载训练好的策略，开始跑模拟器。

: 显示画面

相关免费在线工具

curl 转代码
解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。在线工具，curl 转代码在线工具，online
Base64 字符串编码/解码
将字符串编码和解码为其 Base64 格式表示形式即可。在线工具，Base64 字符串编码/解码在线工具，online
Base64 文件转换器
将字符串、文件或图像转换为其 Base64 表示形式。在线工具，Base64 文件转换器在线工具，online
Markdown转HTML
将 Markdown（GFM）转为 HTML 片段，浏览器内 marked 解析；与 HTML转Markdown 互为补充。在线工具，Markdown转HTML在线工具，online
HTML转Markdown
将 HTML 片段转为 GitHub Flavored Markdown，支持标题、列表、链接、代码块与表格等；浏览器内处理，可链接预填。在线工具，HTML转Markdown在线工具，online
JSON 压缩
通过删除不必要的空白来缩小和压缩JSON。在线工具，JSON 压缩在线工具，online

--render

python export_pt2onnx.py --name <name>

python tune_urdf.py

python tune_pid.py --mode <mode>

Xvfb :1 -screen 0 1024x768x24 &
export DISPLAY=:1

宇树 Qmini 双足机器人训练经验总结

前提说明：为什么不建议在云端直接跑渲染？

训练阶段

查看结果

运行训练好的策略 play.py

更多推荐文章

相关免费在线工具

导出 ONNX 模型

加载（调试）URDF 模型

自动调参 PID（tune_pid.py）

错误处理

Headless 环境无法渲染

使用 AutoDL 远程连接，play.py 视频录制仍为黑屏

更多推荐文章

相关免费在线工具

宇树 Qmini 双足机器人训练经验总结

前提说明：为什么不建议在云端直接跑渲染？

训练阶段

查看结果

运行训练好的策略 play.py

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

导出 ONNX 模型

加载（调试）URDF 模型

自动调参 PID（tune_pid.py）

错误处理

Headless 环境无法渲染

使用 AutoDL 远程连接，play.py 视频录制仍为黑屏

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具