宇树 G1 人形机器人强化学习训练实战指南 | 极客日志

PythonAI算法

宇树 G1 人形机器人强化学习训练实战指南

基于 Isaac Gym 与 RSL-RL 框架，详解宇树 G1 机器人从 12 自由度到 23 自由度的强化学习环境搭建、配置修改及奖励函数设计。涵盖任务注册、观测空间计算、PD 控制参数调优及核心奖励逻辑解析，提供完整的训练实战指导。

监控大屏发布于 2026/4/8更新于 2026/7/2554 浏览

前言

人形机器人的运动控制一直是领域内的难点，强化学习为此提供了强有力的解决方案。本教程基于宇树 G1 人形机器人，从基础环境搭建入手，逐步深入高自由度模型的训练配置、奖励函数设计与优化，最终实现复杂动作的控制。我们将结合 Isaac Gym 仿真环境与 RSL-RL 框架，梳理关键步骤。

强化学习训练环境配置

基础环境搭建

训练依赖于 Isaac Gym 物理仿真环境和 RSL-RL 强化学习框架。确保这两个核心组件正确安装是第一步。启动 12 自由度 G1 机器人的基础训练命令如下：

python legged_gym/scripts/train.py --task=g1

这背后涉及任务注册系统。在 legged_gym/envs/__init__.py 中，可以看到各种机器人任务的注册逻辑：

from legged_gym import LEGGED_GYM_ROOT_DIR, LEGGED_GYM_ENVS_DIR
from legged_gym.envs.go2.go2_config import GO2RoughCfg, GO2RoughCfgPPO
from legged_gym.envs.h1.h1_config import H1RoughCfg, H1RoughCfgPPO
from legged_gym.envs.h1_2.h1_2_config import H1_2RoughCfg, H1_2RoughCfgPPO
from legged_gym.envs.g1.g1_config import G1RoughCfg, G1RoughCfgPPO
from legged_gym.envs.g1.g1_env import G1Robot
from base.legged_robot import LeggedRobot
from legged_gym.utils.task_registry import task_registry

# 任务注册
task_registry.register("go2", LeggedRobot, GO2RoughCfg(), GO2RoughCfgPPO())
task_registry.register("h1", H1Robot, H1RoughCfg(), H1RoughCfgPPO())
task_registry.register("h1_2", H1_2Robot, H1_2RoughCfg(), H1_2RoughCfgPPO())
task_registry.register("g1", G1Robot, G1RoughCfg(), G1RoughCfgPPO())

G1 机器人 12 自由度配置解析

标准配置文件位于 legged_gym/envs/g1/g1_config.py。这里定义了机器人的各项关键参数：

from legged_gym.envs.base.legged_robot_config import LeggedRobotCfg, LeggedRobotCfgPPO

class G1RoughCfg():
     (LeggedRobotCfg.init_state):
        pos = [, , ]  
        default_joint_angles = {
            : , : ,
            : -, : ,
            : -, : ,
            : , : ,
            : -, : ,
            : -, : ,
            : 
        }

     (LeggedRobotCfg.env):
        num_observations =   
        num_privileged_obs =   
        num_actions =

相关免费在线工具

加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
RSA密钥对生成器
生成新的随机RSA私钥和公钥pem证书。在线工具，RSA密钥对生成器在线工具，online
Mermaid 预览与可视化编辑
基于 Mermaid.js 实时预览流程图、时序图等图表，支持源码编辑与即时渲染。在线工具，Mermaid 预览与可视化编辑在线工具，online
随机西班牙地址生成器
随机生成西班牙地址（支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选），支持数量快捷选择、显示全部与下载。在线工具，随机西班牙地址生成器在线工具，online
Gemini 图片去水印
基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印，支持批量处理与下载。在线工具，Gemini 图片去水印在线工具，online
curl 转代码
解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。在线工具，curl 转代码在线工具，online

from legged_gym.envs.base.legged_robot_config import LeggedRobotCfg, LeggedRobotCfgPPO

class G1_23RoughCfg(LeggedRobotCfg):
    class init_state(LeggedRobotCfg.init_state):
        pos = [0.0, 0.0, 0.8]
        default_joint_angles = {
            # 腿部关节（保持原有配置）
            'left_hip_yaw_joint': 0., 'left_hip_roll_joint': 0,
            'left_hip_pitch_joint': -0.1, 'left_knee_joint': 0.3,
            'left_ankle_pitch_joint': -0.2, 'left_ankle_roll_joint': 0,
            'right_hip_yaw_joint': 0., 'right_hip_roll_joint': 0,
            'right_hip_pitch_joint': -0.1, 'right_knee_joint': 0.3,
            'right_ankle_pitch_joint': -0.2, 'right_ankle_roll_joint': 0,
            # 新增的上肢关节
            'waist_yaw_joint': 0,  # 注意：torso_joint 改名为 waist_yaw_joint
            'left_shoulder_pitch_joint': 0., 'left_shoulder_roll_joint': 0,
            'left_shoulder_yaw_joint': 0., 'left_elbow_joint': 0.,
            'left_wrist_roll_joint': 0., 'right_shoulder_pitch_joint': 0.,
            'right_shoulder_roll_joint': 0.0, 'right_shoulder_yaw_joint': 0.,
            'right_elbow_joint': 0., 'right_wrist_roll_joint': 0.
        }

class env(LeggedRobotCfg.env):
    num_observations = 80  # 普通观测维度
    num_privileged_obs = 83  # 特权观测维度（多了基座线速度 3 维）
    num_actions = 23  # 动作维度

class control(LeggedRobotCfg.control):
    control_type = 'P'
    stiffness = {
        'hip_yaw': 100, 'hip_roll': 100, 'hip_pitch': 100,
        'knee': 150, 'ankle': 40, 'waist_yaw': 250,
        'shoulder': 100, 'elbow': 50, 'wrist': 50
    }
    damping = {
        'hip_yaw': 2, 'hip_roll': 2, 'hip_pitch': 2,
        'knee': 4, 'ankle': 2, 'waist_yaw': 6,
        'shoulder': 2, 'elbow': 2, 'wrist': 2
    }
    action_scale = 0.25
    decimation = 4

python legged_gym/scripts/train.py --task=g1_23

class G1RoughCfg(LeggedRobotCfg):
    class rewards(LeggedRobotCfg.rewards):
        soft_dof_pos_limit = 0.9
        base_height_target = 0.78

        class scales(LeggedRobotCfg.rewards.scales):
            tracking_lin_vel = 1.0
            tracking_ang_vel = 0.5
            lin_vel_z = -2.0
            ang_vel_xy = -0.05
            orientation = -1.0
            base_height = -10.0
            dof_acc = -2.5e-7
            dof_vel = -1e-3
            action_rate = -0.01
            feet_air_time = 0.0
            contact = 0.18
            contact_no_vel = -0.2
            feet_swing_height = -20.0
            collision = 0.0
            dof_pos_limits = -5.0
            alive = 0.15
            hip_pos = -1.0

宇树 G1 人形机器人强化学习训练实战指南

前言

强化学习训练环境配置

基础环境搭建

G1 机器人 12 自由度配置解析

更多推荐文章

相关免费在线工具

扩展到 23 自由度模型

高自由度模型的挑战

创建 23 自由度配置

观测维度的重新计算

控制参数配置

奖励函数架构深度解析

核心作用与设计

配置详解

初始化与执行机制

关键函数解析

更多推荐文章

相关免费在线工具

宇树 G1 人形机器人强化学习训练实战指南

前言

强化学习训练环境配置

基础环境搭建

G1 机器人 12 自由度配置解析

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

扩展到 23 自由度模型

高自由度模型的挑战

创建 23 自由度配置

观测维度的重新计算

控制参数配置

奖励函数架构深度解析

核心作用与设计

配置详解

初始化与执行机制

关键函数解析

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具