机器人 3D 位姿与 5 种旋转表示法详解 | 极客日志

PythonAI算法

机器人 3D 位姿与 5 种旋转表示法详解

介绍机器人位姿概念，包含位置与姿态。详细解析五种姿态表示法：欧拉角（直观但有万向锁）、旋转矩阵（无歧义但冗余）、轴 - 角（物理意义清晰）、四元数（高效无锁但不直观）及 6D 旋转（ML 友好）。重点阐述为何神经网络偏好 6D 旋转以避免约束问题，并给出从 6D 向量到旋转矩阵的 Python 实现代码。

林间仙子发布于 2026/4/5更新于 2026/7/2858 浏览

当我们教一个机器人执行任务时，比如'拿起桌上的杯子'，我们到底在教它什么？我们不能只说'去拿杯子'。相反，我们必须给它一串精确的、机器可读的指令。

这个指令的核心，就是**'位姿 (Pose)'**。

在机器人学和 3D 视觉中，位姿是描述一个物体在空间中完整状态的术语。本文深入探讨这个概念，特别是描述'朝向'的五种主流方法。理解这些，你就能明白为什么现代机器人（尤其是那些由机器学习驱动的）会使用一些看起来非常'奇怪'的数学表示。

1. 基础：位姿 (Pose) = 位置 + 姿态

一个完整的'位姿'由两部分组成：

位置 (Position)：物体在世界坐标系中的哪个点。
姿态 (Orientation/Rotation)：物体的朝向。

📍 位置 (Position)：简单明了

这部分很简单。我们通常用一个 3D 向量 (x, y, z) 来表示，这就是我们都熟悉的笛卡尔 (Cartesian) 坐标。它回答了'物体在哪里？'

🔄 姿态 (Orientation)：真正的挑战

这部分复杂得多。它回答了'物体朝向何方？'

想象一个杯子在桌上的 (x, y, z) 位置是固定的，但它可以'正着放'、'倒着放'或'躺着放'——这就是姿态。

描述 3D 旋转有非常多种方式，每种都有其独特的优缺点。下面，我们将详细介绍五种最主要的'姿态'表示法，从最直观的到最适合机器学习的。

2. 🤖 五种主要的'姿态'表示法

1. 欧拉角 (Euler Angles) & RPY

这是最直观、最'人类友好'的一种方式。

是什么：用三个角度来描述旋转。
如何工作：想象有三个主轴（X, Y, Z）。我们按特定顺序绕这些轴旋转三个角度。例如，'ZYX 顺序'意味着：先绕 Z 轴转 α，再绕 Y 轴转 β，最后绕 X 轴转 γ。
RPY (Roll, Pitch, Yaw)：这是欧拉角的一种常见约定，通常（但不总是）对应于 ZYX 顺序。
- Roll (横滚): 绕 X 轴（前进方向）
- Pitch (俯仰): 绕 Y 轴（侧向）
- Yaw (偏航): 绕 Z 轴（垂直方向）
优点：
- 非常直观，容易理解。
- 只用 3 个数字，非常紧凑。
缺点：
- 万向锁 (Gimbal Lock)：一个致命缺陷。在特定姿态下（例如，Pitch 为 90 度时），Roll 和 Yaw 会'合并'成同一个旋转，导致你失去一个自由度。这在机器人和动画中是灾难性的。
- 歧义性：必须严格定义旋转顺序（如 ZYX, XYZ, ZXZ…）。

Python 代码示例 (使用 scipy)

import numpy as np
from scipy.spatial.transform import Rotation as R

# 创建一个欧拉角：绕 Z 轴 30 度，Y 轴 45 度，X 轴 60 度
# 'zyx' 是旋转顺序，degrees=True 表示单位是度
r_euler = R.from_euler('zyx', [30, , ], degrees=)


()
(r_euler.as_matrix())

相关免费在线工具

加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
RSA密钥对生成器
生成新的随机RSA私钥和公钥pem证书。在线工具，RSA密钥对生成器在线工具，online
Mermaid 预览与可视化编辑
基于 Mermaid.js 实时预览流程图、时序图等图表，支持源码编辑与即时渲染。在线工具，Mermaid 预览与可视化编辑在线工具，online
随机西班牙地址生成器
随机生成西班牙地址（支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选），支持数量快捷选择、显示全部与下载。在线工具，随机西班牙地址生成器在线工具，online
Gemini 图片去水印
基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印，支持批量处理与下载。在线工具，Gemini 图片去水印在线工具，online
curl 转代码
解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。在线工具，curl 转代码在线工具，online

# 绕 Z 轴旋转 90 度
theta = np.pi / 2  # 90 degrees in radians
c, s = np.cos(theta), np.sin(theta)

# Z 轴旋转矩阵
mat_z = np.array([[c, -s, 0],
                  [s, c, 0],
                  [0, 0, 1]])
r_matrix = R.from_matrix(mat_z)

print("\n--- 旋转矩阵 ---")
print(r_matrix.as_matrix())

# 从矩阵转换回欧拉角
print(f"对应的欧拉角 (zyx): {r_matrix.as_euler('zyx', degrees=True)}")

# 绕 Z 轴 (0, 0, 1) 旋转 90 度 (pi/2)
# 旋转向量 = [0, 0, 1] * (np.pi / 2)
rot_vec = np.array([0, 0, np.pi / 2])
r_rotvec = R.from_rotvec(rot_vec)

print("\n--- 轴 - 角 (旋转向量) ---")
print(f"对应的旋转矩阵:\n{r_rotvec.as_matrix()}")

# Scipy 的 from_quat 期望 (x, y, z, w) 顺序
# 绕 Z 轴 90 度 (theta=pi/2)
# w = cos(pi/4) = 0.707
# z = sin(pi/4) = 0.707
quat_xyzw = np.array([0, 0, np.sin((np.pi/2)/2), np.cos((np.pi/2)/2)])
r_quat = R.from_quat(quat_xyzw)

print("\n--- 四元数 ---")
print(f"对应的旋转矩阵:\n{r_quat.as_matrix()}")

import numpy as np

def six_d_to_rotation_matrix(d6: np.ndarray) -> np.ndarray:
    """
    将 6D 旋转表示 (旋转矩阵的前两列) 转换回一个 3x3 旋转矩阵。
    使用格拉姆 - 施密特正交化。
    
    参数:
        d6: shape (..., 6) 的 6D 旋转向量
    返回:
        R: shape (..., 3, 3) 的旋转矩阵
    """
    # 1. 将 6D 向量重塑为两个 3D 列向量 a1 和 a2
    # a1 是旋转矩阵的第一列，a2 是第二列
    a1 = d6[..., 0:3]
    a2 = d6[..., 3:6]

    # 2. 正交化：计算 b1 (第一列)
    # b1 = a1 / ||a1||
    b1 = a1 / np.linalg.norm(a1, axis=-1, keepdims=True)

    # 3. 正交化：计算 b2 (第二列)
    # b2_un = a2 - (a2·b1) * b1
    # (从 a2 中减去它在 b1 上的投影，使其与 b1 正交)
    proj_a2_on_b1 = np.sum(b1 * a2, axis=-1, keepdims=True) * b1
    b2_un = a2 - proj_a2_on_b1
    
    # b2 = b2_un / ||b2_un||
    b2 = b2_un / np.linalg.norm(b2_un, axis=-1, keepdims=True)

    # 4. 计算 b3 (第三列)
    # b3 = b1 x b2 (叉乘)
    b3 = np.cross(b1, b2, axis=-1)

    # 5. 将 b1, b2, b3 堆叠成 3x3 矩阵
    # (..., 3, 3)
    rot_mats = np.stack((b1, b2, b3), axis=-1)
    return rot_mats

表示法	维度	优点	缺点
欧拉角 (RPY)	3	直观，紧凑	万向锁, 顺序依赖
旋转矩阵	9 (3x3)	无歧义，易于组合	冗余 (9 个数), 强约束
轴 - 角	4 (轴 3+ 角 1)	物理意义清晰	不易于计算组合
四元数	4	无万向锁, 计算高效	极不直观，双重覆盖
6D 旋转	6	ML 友好, 连续，无约束	冗余 (6 个数), 不直观

机器人 3D 位姿与 5 种旋转表示法详解

1. 基础：位姿 (Pose) = 位置 + 姿态

📍 位置 (Position)：简单明了

🔄 姿态 (Orientation)：真正的挑战

2. 🤖 五种主要的'姿态'表示法

1. 欧拉角 (Euler Angles) & RPY

更多推荐文章

相关免费在线工具

2. 旋转矩阵 (Rotation Matrix)

3. 轴 - 角 (Axis-Angle)

4. 四元数 (Quaternion)

5. 6D 旋转 (6D Rotation)

3. 深入 ML：为什么神经网络偏爱 6D 旋转？

4. 核心代码：从 6D 向量到旋转矩阵

5. 总结：没有最好，只有最合适

更多推荐文章

相关免费在线工具

机器人 3D 位姿与 5 种旋转表示法详解

1. 基础：位姿 (Pose) = 位置 + 姿态

📍 位置 (Position)：简单明了

🔄 姿态 (Orientation)：真正的挑战

2. 🤖 五种主要的'姿态'表示法

1. 欧拉角 (Euler Angles) & RPY

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

2. 旋转矩阵 (Rotation Matrix)

3. 轴 - 角 (Axis-Angle)

4. 四元数 (Quaternion)

5. 6D 旋转 (6D Rotation)

3. 深入 ML：为什么神经网络偏爱 6D 旋转？

4. 核心代码：从 6D 向量到旋转矩阵

5. 总结：没有最好，只有最合适

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具