跳到主要内容
极客日志极客日志面向AI+效率的开发者社区
首页博客GitHub 精选镜像工具UI配色美学隐私政策关于联系
搜索内容 / 工具 / 仓库 / 镜像...⌘K搜索
注册
博客列表
PythonAI算法

BeyondMimic 人形机器人舞蹈训练与 rl_sar 部署实践

综述由AI生成介绍从人类 RGB 视频到人形机器人跳舞的全流程。首先利用 GVHMR 从视频提取人体运动轨迹,通过 GMR 将动作重定向至 Unitree G1 机器人关节空间。接着使用 BeyondMimic 框架在 Isaac Lab 中基于 PPO 算法进行强化学习训练,并导出 ONNX 模型。最后通过 rl_sar 框架在 MuJoCo 仿真验证并部署至真机。文章详细解析了观测空间设计、奖励函数、自适应采样及域随机化等核心算法,并记录了 sim2sim 与 sim2real 部署中的关键问题与解决方案。

邪神洛基发布于 2026/4/6更新于 2026/5/2226 浏览
BeyondMimic 人形机器人舞蹈训练与 rl_sar 部署实践

0. 前言

让人形机器人学会跳舞,听起来像是科幻电影中的场景,但在强化学习和运动模仿技术的推动下,这件事正在变得越来越现实。本文将完整介绍一条从'人类 RGB 视频'到'真实机器人跳舞'的技术链路:首先通过视觉算法从视频中提取人体运动轨迹,然后将人体模型重定向到机器人关节空间,接着在仿真环境中进行强化学习训练,最后在 MuJoCo 中验证并部署到真实的 Unitree G1 人形机器人上。

整条流程涉及四个核心开源项目:GVHMR(视频到人体模型)、GMR(人体到机器人重定向)、BeyondMimic(强化学习训练框架)、以及 rl_sar(仿真验证与真机部署框架)。本文不仅会逐一拆解每个环节的原理和操作步骤,还会深入分析 BeyondMimic 的算法设计,并详细记录将训练产物迁移到 rl_sar 项目中进行 sim2sim 和 sim2real 部署时遇到的关键问题与解决方案。

下图展示了 BeyondMimic 的整体框架,从运动跟踪到通过引导扩散实现多功能人形控制:

BeyondMimic 整体框架


1. 端到端流程总览:从 RGB 视频到机器人跳舞

在正式进入每个模块的细节之前,有必要先建立对整条流程的全局认知。整个系统可以被拆分为五个串联的阶段,每个阶段的输入和输出都有明确的数据格式约定,任何一个环节的数据不匹配都会导致下游失败。

在这里插入图片描述

第一阶段是视频到人体模型的转换。GVHMR 接收一段普通的 RGB 视频作为输入,通过深度学习算法估计视频中人物的 SMPLX 人体模型参数,输出一个包含完整人体运动轨迹的 .pt 文件。这个文件记录了每一帧中人体的全局位置、朝向以及各关节的旋转角度。

第二阶段是人体模型到机器人模型的重定向。由于人体和机器人在骨骼结构、关节自由度、肢体比例上存在显著差异,不能直接将 SMPLX 的关节角度套用到机器人上。GMR 通过优化算法解决这个'体现差距'(embodiment gap)问题,将人体运动映射到 G1 机器人的关节空间,输出 .pkl 文件,再转换为 BeyondMimic 所需的 .csv 格式。

第三阶段是强化学习训练。BeyondMimic 基于 Isaac Lab 仿真平台,使用 PPO 算法训练机器人在物理仿真中跟踪参考动作。训练完成后导出 .onnx 模型文件和对应的 .npz 参考动作文件。

第四阶段是仿真验证。在 MuJoCo 物理引擎中加载训练好的策略和参考动作,验证机器人能否在独立的仿真环境中正确复现目标动作。这一步是真机部署前的必要安全检查。

第五阶段是真机部署。将验证通过的策略部署到 Unitree G1 实体机器人上,通过 rl_sar 框架的 C++ 实时控制循环驱动机器人执行动作。


2. GVHMR:从 RGB 视频提取人体运动轨迹

2.1 GVHMR 的作用与原理

GVHMR(Global-View Human Motion Recovery)是浙江大学开源的一个从单目 RGB 视频中恢复全局人体运动的算法。传统的人体姿态估计方法通常只能得到相对于相机坐标系的局部姿态,而 GVHMR 的核心贡献在于能够恢复人体在世界坐标系下的全局运动轨迹,包括全局平移和旋转。这对于后续的机器人运动重定向至关重要,因为机器人需要知道'人在空间中走了多远、转了多少',而不仅仅是'手臂抬了多高'。

GVHMR 的输出是一个 PyTorch 的 .pt 文件,其中包含了 SMPLX 人体模型的完整参数序列:全局位移(global translation)、全局朝向(global orientation)、身体姿态参数(body pose)以及手部姿态参数。这些参数足以在任意时刻重建出完整的人体三维网格。

2.2 环境配置

GVHMR 的安装按照其 官方文档 操作即可。需要注意的是,该项目依赖较多的预训练模型和第三方库,建议在独立的 conda 环境中安装。

2.3 数据转换操作

环境配置完成后,执行以下命令即可将视频转换为 SMPLX 运动轨迹:

python tools/demo/demo.py --video=docs/example_video/tennis.mp4 -s

其中 --video 参数指定输入视频的路径,-s 参数表示保存结果。程序运行完成后会输出一个 .pt 文件,务必记录该文件的完整路径,因为下一步 GMR 需要用到它。

GVHMR 输出结果

上图展示了 GVHMR 处理视频后的输出信息,可以看到程序会打印出 .pt 文件的保存路径。在实际操作中,建议将视频文件放在项目目录下的统一位置,并为每个视频建立独立的输出目录,方便后续管理多个动作数据。

需要特别注意的是,输入视频的质量直接影响运动提取的精度。理想的输入视频应当满足以下条件:画面中只有一个人、人物全身可见、背景相对简洁、光照均匀。如果视频中存在严重遮挡或多人交叉,GVHMR 的输出质量会明显下降,进而影响整条流程的最终效果。


3. GMR:将人体运动重定向到 G1 机器人

3.1 为什么需要运动重定向

人体有超过 200 块骨骼和数百个自由度,而 Unitree G1 机器人只有 23 或 29 个可控关节。两者在骨骼拓扑结构、关节运动范围、肢体长度比例上都存在本质差异。例如,人类的肩关节是一个球窝关节,可以在三个轴上自由旋转,而机器人的肩关节通常由三个串联的旋转关节来近似实现。直接将 SMPLX 的关节角度赋值给机器人关节,不仅物理上不可行,还可能导致自碰撞或关节超限。

GMR(General Motion Retargeting)通过优化方法解决这个问题。它的核心思路是:选取人体和机器人之间对应的关键身体部位(如手、脚、头、躯干),通过最小化这些对应部位在笛卡尔空间中的位置差异,求解出机器人的关节角度序列。这个过程会自动处理骨骼长度差异和关节约束,确保输出的机器人动作在运动学上是可行的。

3.2 数据转换:pt 到 pkl

由于上一步使用的是 GVHMR 框架,这里选择 GMR 中的

目录

  1. 0. 前言
  2. 1. 端到端流程总览:从 RGB 视频到机器人跳舞
  3. 2. GVHMR:从 RGB 视频提取人体运动轨迹
  4. 2.1 GVHMR 的作用与原理
  5. 2.2 环境配置
  6. 2.3 数据转换操作
  7. 3. GMR:将人体运动重定向到 G1 机器人
  8. 3.1 为什么需要运动重定向
  9. 3.2 数据转换:pt 到 pkl
  • 💰 8折买阿里云服务器限时8折了解详情
  • Magick API 一键接入全球大模型注册送1000万token查看
  • 🤖 一键搭建Deepseek满血版了解详情
  • 一键打造专属AI 智能体了解详情
极客日志微信公众号二维码

微信扫一扫,关注极客日志

微信公众号「极客日志V2」,在微信中扫描左侧二维码关注。展示文案:极客日志V2 zeeklog

更多推荐文章

查看全部
  • Python 实现开源 AI 模型引入及测试全过程
  • GitHub 汉化插件安装教程
  • MCAP:机器人数据容器的全面实践指南
  • 从 0 到 1 打造 RISC-V 智能家居中控:硬件 + 固件 + 通信全链路实战
  • DeepSeek 深度使用指南:提示词技巧、替代方案与本地知识库
  • LLaMA-Factory 自定义评估指标完整实现指南
  • 2026 年 3 月全球 AI 前沿动态:模型、机器人及硬件突破
  • 逻辑回归详解:原理、推导、实现与实战
  • 基于 DeepSeek 与腾讯云 HAI 设计个人网页
  • Python 基础介绍与 12 个核心开发库详解
  • Linux 系统文件 IO 与重定向原理
  • JavaScript 金额计算精度丢失与分摊方案
  • 2026 年高校 AIGC 检测升级下的论文降重工具选型指南
  • 解决 JavaScript 浮点数精度丢失与金额分摊难题
  • 2026 年 AI 编程助手组合使用心得
  • 前端金额计算:解决 JS 浮点数精度丢失与分摊问题
  • 二分算法实战:A-B 数对与烦恼的高考志愿
  • WebMCP:浏览器原生 AI 交互新范式
  • 边缘采集引擎:从 Python 迁移到 Go 的性能优化与实战方案
  • 前端组件库实战:告别重复造轮子,提升开发效率

相关免费在线工具

  • 加密/解密文本

    使用加密算法(如AES、TripleDES、Rabbit或RC4)加密和解密文本明文。 在线工具,加密/解密文本在线工具,online

  • RSA密钥对生成器

    生成新的随机RSA私钥和公钥pem证书。 在线工具,RSA密钥对生成器在线工具,online

  • Mermaid 预览与可视化编辑

    基于 Mermaid.js 实时预览流程图、时序图等图表,支持源码编辑与即时渲染。 在线工具,Mermaid 预览与可视化编辑在线工具,online

  • 随机西班牙地址生成器

    随机生成西班牙地址(支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选),支持数量快捷选择、显示全部与下载。 在线工具,随机西班牙地址生成器在线工具,online

  • Gemini 图片去水印

    基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印,支持批量处理与下载。 在线工具,Gemini 图片去水印在线工具,online

  • curl 转代码

    解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。 在线工具,curl 转代码在线工具,online