机器人必备知识——关于李群、李代数的理解
提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档
目录
前言
在对机器人技术的学习过程中,我们经常会听到“旋量”、“四元数”、“李群”、“李代数”等一些听起来高大上的词汇。首先得认识到,这些词汇都是实用的而非像“神经元”、“类脑”、“智能”之类华而不实的,它们是为了解决实际工程问题而发展出来的。其次,要学会如何真正使用它们还是需要一定的耐心和数学功底,不能因为难而拒绝理解。尽管当今这些工具的库已经很成熟了,而且也是开源的方便获取,甚至很多软件平台都自带这些功能函数,大家在实际使用时也可以直接调用输入输出而不需要知道其内部的具体运行机制,但这不利于大家形成机器人技术的知识体系,进而无法进行更深层次的学习。这篇博客将会详细从图解和公式两个方面理解李群、李代数的知识,这是我的学习总结笔记,如果有问题请大家多多指出。
一、问题提出
1.1 位姿的表述
所谓的机器人,可以理解为一堆连杆,或者叫一堆刚体(柔性机械臂一般简化为连续的欠驱动的多刚体机械臂)。机器人技术,便是对刚体的研究技术,这些技术都是成熟的。对于刚体间的关系,其普遍描述于欧氏空间中。欧氏空间,或者叫平直空间,全称是欧几里德空间(Euclidean Space),顾名思义就是欧几里得建立的以角和空间线的关系为法则的空间。其对于空间内固定的点集主要表现出两个特性:其一是平移特性,所有点向相同方向移动相同的距离;其二是旋转特性,所有点关于同一个旋转轴旋转相同角度。
在大量的文献资料上,不难发现机器人等效为一系列关联的坐标系。由于其描述在欧氏空间,坐标系采用的是笛卡尔坐标系,坐标系之间的关系分为旋转和平移两种,如图1所示。工程上一般将机器人描述的欧氏空间定义为x-y-z的3维欧氏空间,空间内的点表示为3×1的列向量,每一行分别对应x、y、z轴上的值。平移和旋转运算在矩阵乘法中为左乘运算。在运算上,空间内的平移可以用一个3×1的平移矢量表示,其平移运算后空间点仍旧还是空间点;空间内的旋转可以用1个9×9的旋转矩阵表示,其旋转运算后仍旧还是空间点。

从数学公式上看:
1)平移变化可以表示为
,
,
2)旋转变化可以表示为
,
,
其中,平移变化可以用3个参数表示,而旋转参数需要用9个参数表示。显然,对于3维度的空间描述过于冗余了。
因此,根据旋转矩阵的9个参数,其中大部分耦合。为了简化旋转模型,减少未知变量,产生了欧拉角描述法、旋量描述法、四元数描述法等描述法。
这样,刚体间的位姿关系就可以用平移变化和旋转变化共同表示。
在欧氏空间中,针对一个3D点的变换,这二者不好合并。一个表达形式是矩阵加法,一个表达形式是矩阵乘法,其按照3D形式表达为:
为了简化表示,最好能写成如:
的形式。因为矩阵本身就表征了向量的一种变换,便于算法的后续处理。旋转变化比较好处理,而平移矩阵如何转变成矩阵乘法依靠3D变换则比较困难。一般将待变换的点扩展1维并将多余维度补作1。
平移变换的齐次形式为:
而旋转变换的齐次形式为:
因此,平移旋转的合同齐次形式为(齐次坐标左乘旋转矩阵再左乘平移矩阵):
进而,定义位姿矩阵为:
,
因此刚体变换方程为:
1.2 矩阵求导的问题
在实际机器人技术中,需要对其涉及的一些刚体位姿进行测量,而这种测量主要是依赖特定特征空间点进行的,比如移动机器人依赖路标点对机器人本体位姿进行测量,机械臂依赖环境特征点对末端位姿进行测量等等。假想,对于一系列与刚体固定的空间点
(真实值),以及其在传感器上所表现出的“空间点”
(观测值),目的为了获得一个最佳的位姿
,使得:
这就需要让目标函数
对变换矩阵
进行求导。
求导本质上是一个高阶多项式的线性和的拆分。然而,由于乘法矩阵存在
和
两个约束,两个旋转矩阵相加后便不是旋转矩阵,进而任意两个位姿矩阵相加后并不是一个位姿矩阵。因此,矩阵
所处的空间对于加法运算不封闭,进入无法进行求导运算,李群李代数刚好能很好地解决这个问题。
刚体的三维旋转矩阵所组成集合等价于一个球体,球体上每一个点都对应了一个旋转变换。

二、李群
2.1 群数学定义
群是对称数学中的一个词。对称的定义:一个数学对象
,如果存在
的可逆变换能够使它在某种意义上不变,则该数学对象
上所有的对称就构成了一个对称群。
群的定义是:一种集合加上一种运算的代数结构。群
由集合
和运算
共同构成,对于流形内的
以及流形内的幺元
,需要满足以下约束:
a) 封闭性:
b) 同一性:
c) 可逆性:
d) 可交换性:
(注意:幺元
为集合中的单位元,与集合中其它元素结合时不会改变其它元素,比如旋转矩阵中的单位阵
)
这个对称群的变换和逆变换数学对象的性质不变,对于旋转而言是显而易见的,因为旋转对对象的形状等参数不产生任何变化。因此旋转变换应该对应了一个群。
2.2 李群和李代数的数学定义
李群的定义:具有群结构的实流形或者复流形。
李群是一个光滑(可微)流形,而其元素满足群的公理。光滑流形是一个局部近似于线性空间的拓扑空间,其光滑性意味着空间内每个点都存在一个唯一的切空间,而这个空间是可以做微积分的线性空间,或是叫做向量空间,如图3所示。

可以看到,对于机器人状态空间,则假如流形是机器人的位置空间,那么其切空间便是机器人的速度空间。对于旋转矩阵而言,约束于一个具有单位模长(模长为1)半径的球面流形,其球面上每个点都可以进行微分运算,如图4所示。

对于李群,流形上的每一个点都是类似的,其切空间也是相似的。李群的切空间,也称作李群的李代数。
下面利用常见的单位球模型简要说明李群和李代数的关系(1940年Hans证明了只有
具有李群结构):
a)如图5所示,假设具有李群结构的单位圆
位于平面
上,该群的集合包含了所有单位复数。单位复数的乘积是单位复数,并且
,其中
是
的共轭复数,也是
的逆。那么,李代数
则是由虚数构成的直线
,其与实直线
同构,,所以图中用蓝色直线绘制。

对于初始李群元素
(用实轴虚轴表示),其经过另一个李群元素
(用θ和虚轴表示)左乘运算后得到另一个李群元素
,
。相较于初始向量
,该旋转的结果在李群
上对应着唯一的相对角度
,在李代数
上也一定对应了一个长度
,但是维度降低了。
根据完美的欧拉公式:
可以得到:
,
,
可以发现,对于乘法运算,李群和李代数之间可以用指数关系描述。通过对数变换,李群的乘法等效于李代数的加法;通过指数变换,李代数的加法等于李群的乘法。
(注意:这类变换和拉氏变换表征时域和频域关系类似。我们知道,拉氏变换联系了信号的时域和频域,时域中的信号乘积等于频域中的卷积,时域中的卷积等于频域中的乘积。)
b)如图6所示,假设具有李群结构的3维单位球单位球
位于空间
上,该群的集合包含了所有的单位四元数,即
,其中
是一个单位向量,
是一个单位角。单位四元数其也存在
的性质。该李群所对应的李代数位于与球面相切的纯虚四元数空间
中,并与
同构,图中用红色网格表示。

对于初始李群元素
(用实轴虚轴表示),
,其经过另一个李群元素
(用θ和虚轴i、j、k表示)进行乘运算后得到另一个李群元素
,
。相较于初始向量
,该旋转的结果在李群
上对应着唯一的相对角度
,在李代数
上也一定对应了一个长度
,但是维度降低了。
可以推导出:
,
可以发现,其
李群推导结果与
李群相似。
2.3 欧拉公式
上述李群和李代数之间的映射主要用到了指数映射,而指数映射中核心运算为欧拉公式:
公式右边
描述是复平面的单位圆周运动,如图7所示。其自变量是
,也就是圆周上点在复平面上的方向;

公式左边
可以利用泰勒级数公式展开:
这是利用泰勒级数公式展开得到,不是十分形象,可以利用更一般的式子进行形象表述e的指数旋转过程。
根据定义:
,
复数乘法中,乘以
等价于伸缩和旋转运动,其幅度与
的取值直接相关。
当
(旋转弧度1),
时,
其在复平面运动如图8所示:

当
(旋转弧度1),
时,
其在复平面运动如图9所示:

当
(旋转弧度1),
时,
其在复平面运动如图10所示:

因此,可以推断出,当
时,
在单位圆上转过了1弧度。同样,当
时,
在单位圆上转过了半圈;当
时,
在单位圆上转过了整圈;详见知乎:https://www.matongxue.com/madocs/8/
特别的,
控制了变换的幅度,
控制了变换的角度。
总的来说,通过欧拉公式可以看到,指数变换可以理解为是一个卷曲的映射。
三、李群在机器人中的应用
经过第二章的推导可以得到李群的定义:
给定一个李群
和一个集合
,将
作用于元素
记作:
,其中
,定义这类作用为需满足李群约束:
其具备以下李群性质:
a)同一性:
b)交换性:
3.1 SO(3)特殊正交群
常见的有旋转矩阵
构成的李群
,以及其对应的
李代数。
李群也被称作特殊正交群,记为:
,
具有3个自由度,比李群
9个参数简洁,记为:
具体数学推导包括:
由于旋转矩阵
是正交矩阵,其满足的条件:
则可以得到
假设
是一个随着时间变化的量(实际也得变化),那么
可以用
表示,则,
等式两边对
进行求导,可以得到:
不难发现,
是一个反对称矩阵,令:
两边同右乘
求解该微分方程可以得到:
即,通过指数映射关系,
与
一一对应。
更一般地,
李群和李代数的关系被写作:
给定李代数
可以计算唯一对应的旋转矩阵
。这是李代数和李群之间的指数映射。
值得注意的是,反对称标识符为:
,
。
反对称矩阵
,其主要性质包括:
1)反对称矩阵的主对角线元素均为0,而非主对角线上的上三角和下三角元素反号;
2)若A为反对称矩阵,则A的逆,λA均为反对称矩阵;
3)若A,B均为反对称矩阵,则A±B亦为反对称矩阵;
4)若A为反对称矩阵,B为对称矩阵,则AB-BA为对称矩阵;
5)奇数阶的反对称矩阵行列式必为0,比如
6)反对称矩阵的特征值是0或者是纯虚数,并且对应于纯虚数的特征向量的实部和虚部形成的实向量等长且相互正交。
特别的,李代数可以用向量
表示,这是一个用3个未知量
表示
矩阵
的方法,即
,
其中,
但是,在继续计算中发现,对于矩阵的指数运算,我们没有合适的运算工具,只能通过泰勒展开:
注意到这里的n需要趋于无穷,显然这运算量巨大,不是一种好的逼近方法,需要将其再进一步转换回旋转标识。
考虑到李代数
其为一个三维向量,那么其可以用一个模长
和方向向量
进行表示,即:
对于方向向量
,其存在以下两条性质:
以及其推论
再回到李代数根据微分方程的解:
直接对其进行泰勒展开
无法处理,需要将其分解为模长和向量的形式,进而,
这也被称作罗德里格斯公式(Rodriguez formula),表征了由旋转向量
到旋转矩阵
的映射关系。
因此,指数映射关系可以重写为:
反之,如果要从李代数
推导到李群
,则需要依靠对数映射。其推导过程如下:
对于公式
两边取自然对数,得到对数映射的通式
考虑到对数的泰勒展开公式:
进而对等式的右侧进行泰勒级数展开:
这也没办法进行求解。
对于李代数
,可以利用矩阵的迹对其方向和模长进行分开求解。
其中对于李代数的模长
,这是标量,最快的求解方式是对罗德里格斯公式两边取迹:
可以得到
和
的对应关系:
对于其转轴方向
,由于旋转矩阵的特性,其存在
。这就等价于
为矩阵
特征值为1所对应的特征向量,对该矩阵进行求解再进行归一化可以得到旋转轴单位向量
。
可以发现,旋转矩阵的李群和李代数之间的变换运算主要是依赖罗德里格斯公式进行的,而罗德里格斯公式的核心并不是李代数,而是李代数的拆解形式
,也就是旋量的形式,其李群李代数的直观表现如图10所示,三维向量p旋转至新的向量p‘时,这个旋转变换所对应的旋转矩阵R可以等效为绕轴a旋转θ角度的定轴旋转,也就是旋量,旋量在其切空间的表示就是李代数。

3.2 SE(3)特殊欧氏群
欧氏矩阵是旋转矩阵和位移向量的齐次补齐,欧氏矩阵所构成的
李群也被称作特殊欧氏群,记为:
相较于旋转矩阵
所形成的
李群的李代数
处于
空间,欧氏矩阵
所形成的
群其对应的李代数
处于
空间中,其具有6个独立的变量,记为:
同样,其具体数学推到为:
考虑到欧氏变换矩阵与其逆矩阵的乘积为单位向量,即不对物体产生作用:
,
对上述等式两边进行对
求导,可以得到:
同样,令
,不难发现
也是一个反对称矩阵。
值得注意的是,欧式变换矩阵的逆矩阵为:
,
因此,
令
,
,则
对于
,很容易发现其为一个3×1的矩阵,而
是
,因此特殊欧氏群的李代数
可用6个变量表示,这就是旋量,记为:
这里有的论文将
中的平移部分放上面,旋转部分放下面,有的则反过来旋转部分放上面,平移部分放下面。本文采用的是前者。
和特殊正交群一样,特殊欧氏群的李群和李代数之间也是指数/对数映射关系,根据等式:
其通解也是:
该式子仅在时刻
附近有效。当知道李代数
和时间
时,欧式变换矩阵
也通过指数映射唯一确定,这是
到
的映射关系。
对
进行指数映射展开:
通过递推关系可以发现:
,
,
,
...
,
因此,指数展开式重写为:
这里注意到矩阵的指数展开有一个单位阵
这使得右下角0元素变为1。
对于
,由
的计算可以知道,
对于矩阵
同样指数映射需要借助罗德里格斯公式将
转化为方向向量
和模长
进行化简,
这样,再已知
的
和
之后,可以将
转化为
和
,进而求解出欧式变换矩阵T。
反之,求取
到
的对数映射,其与
到
的变换类似,
利用和从
中利用旋转矩阵
提取旋量
和
一模一样的方法,我们可以获得欧氏变换矩阵的
和
,这样可以得到
中的
。
同时,考虑到平移变换满足关系:
,
因此,通过计算旋量
和
也可以计算得到
,进而根据平移向量
求解线性方程可以得到
中的
。这就完成了
到
的对数映射。
a至此,在机器人应用中的李群李代数的变换关系为如图11所示(来自《视觉SLAM十四讲》)。

3.3 李代数的指数映射性质
假设李代数
存在,则其指数映射存在以下几个性质(后续为了书写方便,
):
(1)
;
(2)
(3)
(4)
...
目前想到的就这么多,看到这想必大家已经入门了,剩下的探索就交给大家吧
总结
为了求导,人类可谓是无所不用其极!