跳到主要内容
极客日志极客日志
首页博客AI提示词GitHub精选代理工具
搜索
|注册
博客列表
PythonAI算法

机器人坐标转换中的 RT 矩阵详解

综述由AI生成机器人学和计算机视觉中的 RT 矩阵(刚体变换矩阵)。RT 矩阵由 3x3 旋转矩阵 R 和 3x1 平移向量 T 组成,通过 4x4 齐次坐标形式统一处理位姿变换。文章阐述了其数学原理,解释了为何使用齐次坐标来简化线性运算,并说明了其在坐标系转换中的几何意义。此外,还涵盖了变换复合、逆变换等关键运算方法,以及在手眼标定、自动驾驶、计算机图形学等领域的实际应用。最后对比了欧拉角、四元数等其他姿态表示法,强调了 RT 矩阵作为系统内部标准格式的重要性。

山野诗人发布于 2026/3/22更新于 2026/5/321K 浏览

1. 什么是 RT 矩阵?

RT 矩阵的核心作用是描述一个刚体(比如机器人的手臂、末端执行器、自动驾驶车辆上的传感器)在三维空间中的位置和姿态,即位姿。

  • R 代表旋转:一个 3x3 的矩阵,描述了物体是如何相对于参考坐标系旋转的。
  • T 代表平移:一个 3x1 的向量,描述了物体相对于参考坐标系的位移。

为了将旋转和平移统一在一个矩阵运算中(便于连续变换和计算),我们使用一个4x4 的齐次坐标变换矩阵,这就是我们通常所说的RT 矩阵。

它的标准形式如下:

text
[ r11 r12 r13 tx ]
[ r21 r22 r23 ty ]
[ r31 r32 r33 tz ]
[ 0 0 0 1 ]

其中:

  • 左上角的 3x3 子矩阵 [r11, r12, r13; r21, r22, r23; r31, r32, r33] 就是旋转矩阵 R。
  • 最右边的 3x1 列向量 [tx, ty, tz]^T 就是平移向量 T。
  • 最后一行 [0, 0, 0, 1] 是为了满足齐次坐标计算而固定的。

2. RT 矩阵的数学原理:为什么要用 4x4 矩阵?

在三维空间中,一个点的坐标通常用 [x, y, z]^T 表示。如果我们只想进行旋转,用 3x3 矩阵乘法就够了:

P_rotated = R * P

如果我们只想进行平移,用向量加法就够了:

P_translated = P + T

但是,当我们既需要旋转又需要平移时,运算就变成了:

P_new = R * P + T

这虽然正确,但不是线性的,不便于将多个变换合并成一个。为了解决这个问题,我们引入了齐次坐标。

齐次坐标将三维点 [x, y, z] 扩展为四维 [x, y, z, 1]。这样,旋转和平移就可以通过一个单一的矩阵乘法来完成:

text
[ P_new ]   [ R T ]   [ P ]
[       ] = [     ] * [   ]
[ 1     ]   [ 0 1 ]   [ 1 ]

展开后就是: P_new = R * P + T

看到了吗?我们用一次矩阵乘法,优雅地实现了 R * P + T 这个操作。这使得连续变换变得非常简单。

3. RT 矩阵的几何意义与作用

RT 矩阵描述了一个坐标系(目标坐标系 B)到另一个坐标系(参考坐标系 A)的变换关系。

通常我们写作 ᴀTʙ,它的含义是:

'我知道一个点在坐标系 B 下的坐标,那么通过 ᴀTʙ,我就可以计算出该点在坐标系 A 下的坐标。'

数学表达: Point_A = ᴀTʙ * Point_B

几何解释:

  • 旋转部分 R:描述了如何将坐标系 B 的三个轴 (X_b, Y_b, Z_b) 旋转,才能与坐标系 A 的三个轴 (X_a, Y_a, Z_a) 对齐。
  • 平移部分 T:描述了坐标系 B 的原点在坐标系 A 中的坐标位置。

举个例子: 想象机器人的基座是坐标系 Base,机器人的手爪是坐标系 Gripper。

  • ᴮTɢ 这个矩阵就描述了手爪相对于机器人基座的位置和朝向。
  • 如果你知道一个物体(比如一个螺丝)在手爪坐标系下的坐标 P_gripper,那么通过 P_base = ᴮTɢ * P_gripper,你就能算出这个螺丝在基座坐标系下的坐标,从而让机器人知道如何移动整个身体去接近它。

4. RT 矩阵的运算

a. 变换的复合(连锁变换)

这是 RT 矩阵最大的优势之一。如果你有多个坐标系,比如从 A 到 B,再从 B 到 C,那么从 A 到 C 的变换矩阵就是:

ᴀTᴄ = ᴀTʙ * ʙTᴄ

注意顺序:矩阵乘法是右乘的,即最先发生的变换在最右边。这个顺序非常重要,不能颠倒。

例子:在机器人学中,从基座到末端执行器的变换,是由一系列连杆变换复合而成的: ᴮTᴱ = ᴮT₁ * ¹T₂ * ²T₃ * ... * ᴺ⁻¹Tᴺ * ᴺTᴱ

b. 逆变换

如果你有 ᴀTʙ,想知道 ʙTᴀ(即从坐标系 A 变换到 B 的逆过程),不需要直接求逆矩阵,有一个快速计算方法:

text
[ R^T -R^T * T ]
[ 0      1    ]

其中 R^T 是旋转矩阵 R 的转置。因为旋转矩阵是正交矩阵,所以它的逆就等于它的转置。

5. 实际应用场景

RT 矩阵在机器人和计算机视觉领域无处不在:

  1. 机器人运动学:描述机器人各个连杆之间的位姿关系,是机器人控制和轨迹规划的基础。
  2. 手眼标定:确定相机安装在机器人手上(Eye-in-Hand)或机器人外部(Eye-to-Hand)时,相机坐标系与机器人基座坐标系之间的变换关系。核心就是求解一个 AX = XB 的矩阵方程。
  3. 自动驾驶:将激光雷达、摄像头、GPS/IMU 等不同传感器坐标系的数据统一到车体坐标系下,进行融合感知。这里的 RT 矩阵通常由传感器外参标定得到。
  4. 计算机图形学:用于移动、旋转和放置三维模型中的物体。
  5. 增强现实:将虚拟物体准确地叠加到真实世界的视频画面上,需要计算相机相对于真实世界标记物的 RT 矩阵。

6. 与其他姿态表示法的关系

旋转矩阵 R 只是描述旋转的一种方式,其他常见的还有:

  • 欧拉角:直观,但有万向节死锁问题。
  • 四元数:紧凑,计算高效,常用于插值和避免死锁。
  • 轴角/旋转向量:用一根旋转轴和一个旋转角度来表示。

这些表示法都可以与旋转矩阵 R 相互转换。RT 矩阵因其统一和规范的形式,成为了在系统内部存储和传递位姿信息的标准方式。

总结

RT 矩阵是一个强大而优雅的数学工具,它将三维空间中的旋转和平移统一在一个 4x4 的矩阵中。它不仅是描述物体位姿的标准语言,更是连接不同坐标系、实现复杂空间计算的桥梁,是机器人学和计算机视觉领域的基石概念之一。

目录

  1. 1. 什么是 RT 矩阵?
  2. 2. RT 矩阵的数学原理:为什么要用 4x4 矩阵?
  3. 3. RT 矩阵的几何意义与作用
  4. 4. RT 矩阵的运算
  5. a. 变换的复合(连锁变换)
  6. b. 逆变换
  7. 5. 实际应用场景
  8. 6. 与其他姿态表示法的关系
  9. 总结
  • 💰 8折买阿里云服务器限时8折了解详情
  • GPT-5.5 超高智商模型1元抵1刀ChatGPT中转购买
  • 代充Chatgpt Plus/pro 帐号了解详情
  • 🤖 一键搭建Deepseek满血版了解详情
  • 一键打造专属AI 智能体了解详情
极客日志微信公众号二维码

微信扫一扫,关注极客日志

微信公众号「极客日志V2」,在微信中扫描左侧二维码关注。展示文案:极客日志V2 zeeklog

更多推荐文章

查看全部
  • ChatGPT 插件生态爆发下的自动化写作与工具推荐方案
  • 蜜罐技术原理、分类及 Hfish 部署实战
  • MySQL 联合查询实战:多表关联与子查询详解
  • 医疗连续体机器人模块化控制界面设计与 Python 库应用
  • AI 视频生成工具清单及免费额度说明
  • Stack-Chan 机器人开发指南
  • Linux Mint 22.3 安装指南与系统优化实战
  • 论文 AI 检测率过高?八种实用方法降低机器痕迹
  • OpenAI DALL·E API 绘图实战:从零构建 AI 绘画应用
  • Python Mode for Processing 创意编程使用指南
  • 传统线程同步通讯技术实现
  • VS Code + WSL 环境下 GitHub 访问及 Copilot 连接问题解决方案
  • Levenberg-Marquardt 非线性最小二乘优化算法 C++ 实战实现
  • JVS-APS 解析:算法驱动与低代码融合的智能排产实践
  • 昇腾平台下 DeepSeek-R1 与 Qwen2.5 强化学习训练优化实践
  • Clawdbot 整合 Qwen3-32B 本地部署与 Web 访问指南
  • Spring Cloud 微服务全栈实践:从认知到落地
  • Linux Shell 脚本中的 for 循环语句详解
  • 如何在 GitHub Copilot 中使用 MCP 服务
  • AI Agent 开发入门:零基础学习指南

相关免费在线工具

  • 加密/解密文本

    使用加密算法(如AES、TripleDES、Rabbit或RC4)加密和解密文本明文。 在线工具,加密/解密文本在线工具,online

  • RSA密钥对生成器

    生成新的随机RSA私钥和公钥pem证书。 在线工具,RSA密钥对生成器在线工具,online

  • Mermaid 预览与可视化编辑

    基于 Mermaid.js 实时预览流程图、时序图等图表,支持源码编辑与即时渲染。 在线工具,Mermaid 预览与可视化编辑在线工具,online

  • 随机西班牙地址生成器

    随机生成西班牙地址(支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选),支持数量快捷选择、显示全部与下载。 在线工具,随机西班牙地址生成器在线工具,online

  • Gemini 图片去水印

    基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印,支持批量处理与下载。 在线工具,Gemini 图片去水印在线工具,online

  • curl 转代码

    解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。 在线工具,curl 转代码在线工具,online