宇树 Qmini 双足机器人训练个人经验总结

Ne0inhk

22 Mar 2026 — 4 min read

github：https://github.com/vsislab/RoboTamer4Qmini

本篇内容基于我在 AutoDL 云服务器 上对 Qmini 做完整训练与测试的实践总结，涵盖训练、可视化、策略测试、模型导出、URDF 调试等环节，并重点说明 headless（无显示）环境下的各种坑与解决方案。希望能帮到后来者少走弯路。

前提说明：为什么不建议在云端直接跑渲染？

我最开始的目标是：训练、渲染、视频录制全部在 AutoDL 上完成，不经过本地运行。

然而现实是：

即使用 Xvfb 等虚拟显示器启动 Isaac Gym，也会发生视频保存全黑的情况。
VNC 远程桌面也无法正常显示 Isaac Gym 的渲染窗口。
根本原因来自 驱动版本过高与 Isaac Gym 对驱动的强依赖。

因此更推荐：在云服务器训练模型 → 本地 Ubuntu 加载策略进行测试与演示。

可以在云服务器中进行训练然后在本地进行测试，这是我目前发现的比较好的方式，本地使用的是ubuntu系统，最后算是可以正常演示。

当前的问题都是基于我完全使用autodl上进行的尝试，希望可以对大家有所帮助，少踩坑。

训练阶段

python train.py --config BIRL --name <name>

–name

存放路径experiments/<name>/

–config

选择配置文件，默认：BIRL

–resume

恢复训练

eg：python train.py --name stand --resume --path experiments/stand/checkpoints/policy_40000.pt

–render

开启画面显示（isaac gym窗口）

–fix_cam

视角固定在机器人上方

–horovod

多gpu训练

–r l_device

训练设备设置

默认cudo0，可以改为cpu等

–num_envs

环境数量

–seed

随机种子，利于复现

–max_iterations

最大训练迭代次数

查看结果

云端可能出现 6006 端口占用 的情况，需要手动释放。

1. 安装 lsof

apt-get update

apt-get install lsof -y

2. 查看端口占用

lsof -i :6006

3. 杀掉进程

kill -9 <PID>

4. 重新启动 TensorBoard

tensorboard --logdir experiments/<name>/log --port 6006

运行训练好的策略 play.py

python play.py --render --name <name> 加载训练好的策略，开始跑模拟器

–render 显示画面

–fix_cam 相机固定跟随机器人

–cmp_real 与真实机器人采集的数据对比绘图

–plt_sim 显示仿真数据的曲线图（如关节角、速度等）

–num_envs 改变并行环境数量

–video 开启视频录制，保存到 videos/ 文件夹，必须配合 --render

–time 玩多少秒

–iter 指定用哪一轮的模型，默认加载目录下最后一个 policy

–epochs 重复评估多少次，用来统计平均性能

–debug 保存仿真数据到 Excel

导出ONNX模型

python export_pt2onnx.py --name <name>

把 .pt 权重导出为 .onnx，便于部署到嵌入式设备、Jetson、Unity 等。

加载（调试）urdf模型

python tune_urdf.py

测试你的机器人 URDF 是否正常加载，检查质量参数、碰撞体、关节限位，也可微调模型参数

自动调参PID（tun_pid.py）

python tune_pid.py --mode <mode>

–model

错误

Headless 环境无法渲染

云服务器默认无显示设备。

临时方案：使用虚拟显示：Xvfb（首先进行pip下载）

Xvfb :1-screen 0 1024x768x24 &#启动 X Server export DISPLAY=:1#设置环境变量

注意：但这只能让程序“以为”自己有显示，无法保证正常渲染！

使用autodl远程连接，play.py 视频录制仍为黑屏

原因分析：原因：云端 GPU 驱动版本过高（如 570 系列），超过了 Isaac Gym 的兼容范围。

Isaac Gym 对渲染器依赖的驱动版本非常敏感，驱动过新 → 渲染器初始化失败 → 视频录制为纯黑。

目前找到比较好的方案是：云端只做训练，本地 Ubuntu 运行 play.py。

最后的最后再次说明，目前我认为比较稳妥、推荐的流程是：云端训练（AutoDL）→ 本地 Ubuntu Play 与可视化。云端的 headless 环境与高版本驱动目前无法可靠支持 Isaac Gym 的图形渲染与视频录制，本地则能完美解决所有渲染相关问题。

如有不对，希望各位大佬可以积极指出，谢谢各位。

Enterprise Architect 16 下载、安装与无限30天操作

文章目录 * Enterprise Architect 16 简介 * （一）支持多种建模语言和标准 * （二）强大的版本控制、协作和文档管理功能 * （三）增强的技术和用户体验 * （四）高级功能和扩展性 * 一，下载软件 * （一）官网 * （二）阿里云盘 * （三）百度网盘 * （四）迅雷 * 二，安装软件 * 三，无限30天设置 * （一）删除`fkey.dat`文件 * （二）删除注册表Kane文件夹 * （三）查看效果 Enterprise Architect 16 简介 Enterprise Architect 16是一款功能强大的企业级建模工具，它为企业和机构在系统设计、业务流程建模、数据建模以及软件开发等方面提供了全面的支持。以下是对Enterprise Architect 16的详细介绍：

最新版 Kimi K2.5 进阶实战全攻略：从开源部署到 Agent 集群搭建（视频理解 + 多模态开发 + 高并发调优）

1 技术背景与核心架构原理 1.1 技术定位与版本说明 Kimi K2.5 是月之暗面于2026年初发布的开源多模态大语言模型，聚焦长上下文理解、原生多模态交互、Agent 原生支持三大核心能力，针对工业级落地场景完成了全链路优化。本次实战覆盖的开源版本包括： * kimi-k2.5-chat-70b：基础对话版，支持2000K token 上下文窗口，原生适配工具调用 * kimi-k2.5-multimodal-70b：多模态完整版，新增图像、长视频时序理解能力，支持最长10小时连续视频输入 * kimi-k2.5-agent-70b：Agent 优化版，强化多轮工具链执行、分布式状态同步能力，适配集群化部署 * 量化衍生版本：AWQ 4bit/8bit、FP8 量化版，适配低显存硬件环境，精度损失控制在1%以内 1.2 核心架构与技术亮点 1.2.1

论文阅读：Language models are few-shot learners

Brown T, Mann B, Ryder N, et al. Language models are few-shot learners[J]. Advances in neural information processing systems, 2020, 33: 1877-1901. 引言自然语言处理（NLP）领域已经从学习“特定任务的表示”和设计“特定任务的架构”，转向了使用“任务无关的预训练”和“任务无关的架构” 。目前主流的方法通常分为两步：首先是任务无关的预训练，然后是针对特定任务的微调，即在特定的大型数据集上更新模型权重以适应所需任务。然而最近的研究表明，微调这一步可能并非必须。作者提出语言模型可以被理解为“元学习者”。这意味着模型在预训练期间通过“慢速”的梯度下降学习了广泛的技能，而在推理时可以通过“快速”的上下文学习来适应新任务，而无需更新权重。在所有任务中，

2024年ESWA SCI1区TOP，带有机器人站点的无人机辅助车辆路径规划问题，深度解析+性能实测

目录 * 1.摘要 * 2.带有机器人站点的无人机辅助车辆路径规划问题 * 3.求解方法 * 4.结果展示 * 5.参考文献 * 6.代码获取 * 7.算法辅导·应用定制·读者交流 1.摘要本文提出了带有机器人站点的无人机辅助车辆路径规划问题（VRPD-RS），并将其建模为混合整数线性规划（MILP）问题，分析了卡车、无人机和机器人对配送车队的影响。针对该问题，本文提出了广义变邻域搜索算法（GVNS），并与模拟退火算法（SA）进行了对比。结果表明，GVNS在小规模实例中与求解器最优解接近，在大规模实例中提升了21.5%的最小完成时间和8.0%的运营成本，且在计算效率上优于SA。 2.带有机器人站点的无人机辅助车辆路径规划问题本文提出了带有机器人站点的无人机辅助车辆路径规划问题（VRPD-RS），该问题扩展了传统的TSP-D-RS模型，考虑了多个卡车与无人机的协同工作，并引入机器人站点辅助配送。目标是最小化最小完成时间或运营成本。论文采用混合整数线性规划模型（MILP）