宇树 Qmini 双足机器人训练个人经验总结

宇树 Qmini 双足机器人训练个人经验总结
github:https://github.com/vsislab/RoboTamer4Qmini

本篇内容基于我在 AutoDL 云服务器 上对 Qmini 做完整训练与测试的实践总结,涵盖训练、可视化、策略测试、模型导出、URDF 调试等环节,并重点说明 headless(无显示)环境下的各种坑与解决方案。希望能帮到后来者少走弯路。

前提说明:为什么不建议在云端直接跑渲染?

我最开始的目标是:训练、渲染、视频录制全部在 AutoDL 上完成,不经过本地运行。

然而现实是:

  • 即使用 Xvfb 等虚拟显示器启动 Isaac Gym,也会发生视频保存全黑的情况。
  • VNC 远程桌面也无法正常显示 Isaac Gym 的渲染窗口。
  • 根本原因来自 驱动版本过高与 Isaac Gym 对驱动的强依赖
因此更推荐:在云服务器训练模型 → 本地 Ubuntu 加载策略进行测试与演示。
可以在云服务器中进行训练然后在本地进行测试,这是我目前发现的比较好的方式,本地使用的是ubuntu系统,最后算是可以正常演示。

当前的问题都是基于我完全使用autodl上进行的尝试,希望可以对大家有所帮助,少踩坑。
训练阶段

python train.py --config BIRL --name <name>

–name

​ 存放路径experiments/<name>/

–config

​ 选择配置文件,默认:BIRL

–resume

​ 恢复训练

​ eg:python train.py --name stand --resume --path experiments/stand/checkpoints/policy_40000.pt

–render

​ 开启画面显示(isaac gym窗口)

–fix_cam

​ 视角固定在机器人上方

–horovod

​ 多gpu训练

–r l_device

​ 训练设备设置

​ 默认cudo0,可以改为cpu等

–num_envs

​ 环境数量

–seed

​ 随机种子,利于复现

–max_iterations

​ 最大训练迭代次数
查看结果

云端可能出现 6006 端口占用 的情况,需要手动释放。

1. 安装 lsof

apt-get update

apt-get install lsof -y

2. 查看端口占用

lsof -i :6006

3. 杀掉进程

kill -9 <PID>

4. 重新启动 TensorBoard

tensorboard --logdir experiments/<name>/log --port 6006

运行训练好的策略 play.py

python play.py --render --name <name> 加载训练好的策略,开始跑模拟器

–render 显示画面

–fix_cam 相机固定跟随机器人

–cmp_real 与真实机器人采集的数据对比绘图

–plt_sim 显示仿真数据的曲线图(如关节角、速度等)

–num_envs 改变并行环境数量

–video 开启视频录制,保存到 videos/ 文件夹,必须配合 --render

–time 玩多少秒

–iter 指定用哪一轮的模型,默认加载目录下最后一个 policy

–epochs 重复评估多少次,用来统计平均性能

–debug 保存仿真数据到 Excel
导出ONNX模型

python export_pt2onnx.py --name <name>

.pt 权重导出为 .onnx,便于部署到嵌入式设备、Jetson、Unity 等。

加载(调试)urdf模型

python tune_urdf.py

测试你的机器人 URDF 是否正常加载,检查质量参数、碰撞体、关节限位,也可微调模型参数

自动调参PID(tun_pid.py)

python tune_pid.py --mode <mode>

–model

错误

Headless 环境无法渲染
云服务器默认无显示设备。

临时方案:使用虚拟显示:Xvfb(首先进行pip下载)

Xvfb :1-screen 0 1024x768x24 &#启动 X Server export DISPLAY=:1#设置环境变量
注意:但这只能让程序“以为”自己有显示,无法保证正常渲染!
使用autodl远程连接,play.py 视频录制仍为黑屏
image-20251121211032490
原因分析:原因:云端 GPU 驱动版本过高(如 570 系列),超过了 Isaac Gym 的兼容范围。

Isaac Gym 对渲染器依赖的驱动版本非常敏感,驱动过新 → 渲染器初始化失败 → 视频录制为纯黑。

目前找到比较好的方案是:云端只做训练,本地 Ubuntu 运行 play.py。

最后的最后再次说明,目前我认为比较稳妥、推荐的流程是:云端训练(AutoDL)→ 本地 Ubuntu Play 与可视化。云端的 headless 环境与高版本驱动目前无法可靠支持 Isaac Gym 的图形渲染与视频录制,本地则能完美解决所有渲染相关问题。

如有不对,希望各位大佬可以积极指出,谢谢各位。

Read more

基于2-RSS-1U的双足机器人并联踝关节分析与实现

基于2-RSS-1U的双足机器人并联踝关节分析与实现

"当你的机器人开始像人类一样思考如何走路时,你会发现,原来最复杂的不是大脑,而是脚踝。"这句话在机器人学界越来越成为共识。论文ASAP中的研究也证实,在sim2real中,偏差最大的正是踝关节控制。 参考文献:On the Comprehensive Kinematics Analysis of a Humanoid Parallel Ankle Mechanism 结构变体:Structural design and motion analysis of parallel ankle joints for humanoid robots 脚踝革命:深入解析人形机器人高性能并联踝关节 传统的单轴踝关节设计,就像给机器人穿了一双"高跟鞋"——虽然能走,但走得很僵硬,很危险。我们需要的是像人类脚踝一样的灵活性:既能前后摆动(pitch),又能左右倾斜(roll)

《从零搭建自主无人机》—2——硬件设备搭建及EGOPlanner实现

《从零搭建自主无人机》—2——硬件设备搭建及EGOPlanner实现

一、主要参考: ZJU-FAST-Lab/ego-plannerhttps://github.com/ZJU-FAST-Lab/ego-planner【完结】从0制作自主空中机器人 | 开源 | 浙江大学Fast-Lab_哔哩哔哩_bilibilihttps://www.bilibili.com/video/BV1WZ4y167me/?spm_id_from=333.1387.favlist.content.click&vd_source=cc27dfcb640aa62a70874f5ec72a2143 二、硬件组成: 这里所用硬件设备: 1、OrangePi 5 MAX/ Inter NUC 2、Holybro Pixhawk 6C 3、Intel RealSense D435i Depth Camera

【毕业论文没思路?paperxm智能写作一键解决!】

【毕业论文没思路?paperxm智能写作一键解决!】

毕业论文写作困境的常见原因 缺乏明确的研究方向或选题,导致难以展开论文框架。文献综述不足,无法有效支撑论点,造成写作停滞。时间管理不当,临近截止日期时压力倍增。对学术写作规范不熟悉,格式和逻辑容易出错。 paperxm的链接我就给大家放着了哈:www.paperxm.com Paperxm智能写作工具的核心功能 基于自然语言处理技术,自动生成论文大纲和初稿,提供选题建议。内置文献检索模块,快速匹配相关学术资源,辅助文献综述。支持多语言写作,满足不同学科领域的表达需求。实时语法检查和格式修正,确保论文符合学术规范。 如何使用Paperxm 它从开题报告、文献综述、论文写作还有仿写、到最后的答辩PPT都能帮我直接解决! 优势一:节省时间 使用paperxm写论文,可以让我告别繁琐的资料搜集和整理工作。paperxm能迅速从海量资料中筛选出有用的信息,为我的论文提供有力支持。这样一来,你就有更多的时间去思考、创新,提高论文质量。 优势二:提高写作质量 paperxm具有强大的语言处理能力,可以帮助我优化句子结构、纠正语法错误,甚至提供写作建议。这意味着,我的论文在pape

【玩转腾讯混元大模型】腾讯混元大模型AIGC系列产品深度体验

【玩转腾讯混元大模型】腾讯混元大模型AIGC系列产品深度体验

【玩转腾讯混元大模型】腾讯混元大模型AIGC系列产品深度体验 腾讯推出的系列AI产品:混元大模型、大模型图像创作引擎、大模型视频创作引擎、腾讯元宝,共同构成了一个强大的AI生态系统;凭借腾讯自研的大规模预训练技术和先进的自然语言处理、计算机视觉技术,为用户提供了从文本处理、图像创作到视频生成等多方面的智能化解决方案,极大地提升了工作效率和生活便利性,并在教育、医疗、金融、法律等多个领域展现出广泛的应用前景 腾讯混元大模型 混元生文 基于自然语言对话的方式,可结合输入的文本输出相关文本内容,可在文本生成、创作、问答等场景服务各类行业内容创作:具备文学创作、文本摘要等内容创作能力 体验流程 1、体验地址 混元生文体验地址 2、点击立即体验 3、体验腾讯混元大模型 大模型知识引擎 4、营销文案生成体验(文章排版非常美观,如果添加Enjoy表情就更好了) 5、创建自己的混元大模型 6、配置基础配置-应用名称:名称贴切智能体的角色,尽量简介让用户一目了然角色指令:确保指令具有引导性、简洁性、明确性和可定制性。指令应能够引导智能体准确理解任务目标和用户