跳到主要内容
极客日志极客日志面向AI+效率的开发者社区
首页博客GitHub 精选镜像工具UI配色美学隐私政策关于联系
搜索内容 / 工具 / 仓库 / 镜像...⌘K搜索
注册
博客列表
PythonAI算法

宇树 Qmini 双足机器人训练经验总结

云端训练结合本地验证是解决 Isaac Gym 渲染黑屏问题的关键方案。内容涵盖从模型训练、TensorBoard 监控、策略导出到 URDF 调试的全流程命令与参数详解,重点解析无头模式下的驱动兼容坑点及端口占用处理,提供可直接复用的命令行操作指南。

FrontendX发布于 2026/3/30更新于 2026/6/917 浏览
宇树 Qmini 双足机器人训练经验总结

宇树 Qmini 双足机器人训练经验总结

这篇内容基于我在云端服务器上对 Qmini 进行完整训练与测试的实践总结,涵盖训练、可视化、策略测试、模型导出、URDF 调试等环节,并重点说明 headless(无显示)环境下的各种坑与解决方案。希望能帮到后来者少走弯路。

为什么不建议在云端直接跑渲染?

最初的目标是训练、渲染、视频录制全部在云端完成。但现实情况是,即使用 Xvfb 等虚拟显示器启动 Isaac Gym,也会发生视频保存全黑的情况。VNC 远程桌面也无法正常显示 Isaac Gym 的渲染窗口。根本原因来自驱动版本过高与 Isaac Gym 对驱动的强依赖。

因此更推荐:在云端训练模型 → 本地 Ubuntu 加载策略进行测试与演示。

目前发现的稳妥流程是:云端训练 → 本地 Play 与可视化。云端的 headless 环境与高版本驱动目前无法可靠支持 Isaac Gym 的图形渲染与视频录制,本地则能完美解决所有渲染相关问题。

训练阶段

使用以下命令启动训练:

python train.py --config BIRL --name <name>

常用参数说明:

  • --name:存放路径为 experiments/<name>/
  • --config:选择配置文件,默认 BIRL
  • --resume:恢复训练,例如 python train.py --name stand --resume --path experiments/stand/checkpoints/policy_40000.pt
  • --render:开启画面显示(isaac gym 窗口)
  • --fix_cam:视角固定在机器人上方
  • --horovod:多 gpu 训练
  • --rl_device:训练设备设置,默认 cuda0,可改为 cpu 等
  • --num_envs:环境数量
  • --seed:随机种子,利于复现
  • --max_iterations:最大训练迭代次数

查看结果

云端可能出现 6006 端口占用的情况,需要手动释放。

1. 安装 lsof

apt-get update
apt-get install lsof -y

2. 查看端口占用

lsof -i :6006

3. 杀掉进程

kill -9 <PID>

4. 重新启动 TensorBoard

tensorboard --logdir experiments/<name>/log --port 6006

运行训练好的策略 play.py

加载训练好的策略,开始跑模拟器:

python play.py --render --name <name>

参数说明:

  • --render:显示画面
  • --fix_cam:相机固定跟随机器人
  • --cmp_real:与真实机器人采集的数据对比绘图
  • --plt_sim:显示仿真数据的曲线图(如关节角、速度等)
  • --num_envs:改变并行环境数量
  • --video:开启视频录制,保存到 videos/ 文件夹,必须配合 --render
  • --time:玩多少秒
  • --iter:指定用哪一轮的模型,默认加载目录下最后一个 policy
  • --epochs:重复评估多少次,用来统计平均性能
  • --debug:保存仿真数据到 Excel
  • 导出 ONNX 模型

    将 .pt 权重导出为 .onnx,便于部署到嵌入式设备、Jetson、Unity 等。

    python export_pt2onnx.py --name <name>
    

    加载(调试)urdf 模型

    测试你的机器人 URDF 是否正常加载,检查质量参数、碰撞体、关节限位,也可微调模型参数。

    python tune_urdf.py
    

    自动调参 PID

    python tune_pid.py --mode <mode>
    

    注意参数名应为 --model 或根据实际脚本调整。

    常见错误与解决方案

    Headless 环境无法渲染

    云服务器默认无显示设备。临时方案是使用虚拟显示:Xvfb(需先 pip 下载)。

    Xvfb :1-screen 0 1024x768x24 # 启动 X Server
    export DISPLAY=:1 # 设置环境变量
    

    注意:但这只能让程序'以为'自己有显示,无法保证正常渲染!

    远程连接下视频录制仍为黑屏

    原因分析:云端 GPU 驱动版本过高(如 570 系列),超过了 Isaac Gym 的兼容范围。Isaac Gym 对渲染器依赖的驱动版本非常敏感,驱动过新会导致渲染器初始化失败,视频录制为纯黑。

    解决方案:云端只做训练,本地 Ubuntu 运行 play.py。这是目前比较稳妥、推荐的流程。

    以上是我在实际操作中踩过的坑和总结出的最佳实践,希望对正在尝试的同学有所帮助。如有遗漏或不当之处,欢迎指正。

    目录

    1. 宇树 Qmini 双足机器人训练经验总结
    2. 为什么不建议在云端直接跑渲染?
    3. 训练阶段
    4. 查看结果
    5. 1. 安装 lsof
    6. 2. 查看端口占用
    7. 3. 杀掉进程
    8. 4. 重新启动 TensorBoard
    9. 运行训练好的策略 play.py
    10. 导出 ONNX 模型
    11. 加载(调试)urdf 模型
    12. 自动调参 PID
    13. 常见错误与解决方案
    14. Headless 环境无法渲染
    15. 远程连接下视频录制仍为黑屏
    • 💰 8折买阿里云服务器限时8折了解详情
    • Magick API 一键接入全球大模型注册送1000万token查看
    • 🤖 一键搭建Deepseek满血版了解详情
    • 一键打造专属AI 智能体了解详情
    极客日志微信公众号二维码

    微信扫一扫,关注极客日志

    微信公众号「极客日志V2」,在微信中扫描左侧二维码关注。展示文案:极客日志V2 zeeklog

    更多推荐文章

    查看全部
    • 机器学习与深度学习核心概念详解
    • 基于 steamdt_crawler.py 项目学习 Python 爬虫实战
    • 基于 Higress 将现有 REST API 转换为 MCP Server 工具
    • 机器人避障系统核心技术解析:从传感器到算法实现
    • 自然语言处理高级应用与前沿技术实战
    • Higress 网关将 REST API 转换为 MCP Server 工具配置指南
    • 基于 Higress 将 REST API 转换为 MCP Server 工具
    • AI 增强搜索引擎 llm-answer-engine 项目解析与部署指南
    • Tomcat 下载、安装及环境配置指南
    • Higress MCP Server 插件:REST API 转换为 AI 工具配置
    • Python 中文分词实战:jieba 库核心用法解析
    • Python 全栈开发学习路线:从基础语法到项目部署
    • 基于 Python 的保险行业数据可视化分析系统
    • 亚洲艺术电影节携澳门文化亮相深圳
    • JavaScript 文档对象(Document)核心属性实战解析
    • Python 学习入门路径与主流应用方向详解
    • GitHub 国内镜像站推荐及 Git Clone 加速配置
    • Java 剪辑接单报价比价系统技术架构与源码解析
    • 大模型领域热门岗位解析:算法、研发与管理方向
    • 借助 DeepSeek 与云算力快速搭建个人网页

    相关免费在线工具

    • 加密/解密文本

      使用加密算法(如AES、TripleDES、Rabbit或RC4)加密和解密文本明文。 在线工具,加密/解密文本在线工具,online

    • RSA密钥对生成器

      生成新的随机RSA私钥和公钥pem证书。 在线工具,RSA密钥对生成器在线工具,online

    • Mermaid 预览与可视化编辑

      基于 Mermaid.js 实时预览流程图、时序图等图表,支持源码编辑与即时渲染。 在线工具,Mermaid 预览与可视化编辑在线工具,online

    • 随机西班牙地址生成器

      随机生成西班牙地址(支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选),支持数量快捷选择、显示全部与下载。 在线工具,随机西班牙地址生成器在线工具,online

    • Gemini 图片去水印

      基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印,支持批量处理与下载。 在线工具,Gemini 图片去水印在线工具,online

    • curl 转代码

      解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。 在线工具,curl 转代码在线工具,online