树的基础概念
树是一种非线性的数据结构,由 n(n≥0)个有限结点组成一个具有层次关系的集合。之所以叫'树',是因为它看起来像一棵倒挂的树,根朝上,叶朝下。
树是递归定义的。有一个特殊的结点称为根结点,它没有前驱结点。除根结点外,其余结点被分成 M(M>0) 个互不相交的集合 T1、T2……Tm,其中每一个集合 Ti 又是一棵结构与树类似的子树。子树之间不能有交集,否则就不是树形结构了。
树的术语与定义
理解树的结构需要掌握一些基本术语:
- 父结点/双亲结点:若一个结点含有子结点,则这个结点称为其子结点的父结点。
- 子结点/孩子结点:一个结点含有的子树的根结点称为该结点的子结点。
- 结点的度:一个结点有几个孩子,它的度就是多少。树的度则是树中所有结点的度的最大值。
- 叶子结点/终端结点:度为 0 的结点称为叶结点。
- 分支结点/非终端结点:度不为 0 的结点。
- 兄弟结点:具有相同父结点的结点互称为兄弟结点。
- 结点的层次:从根开始定义起,根为第 1 层,根的子结点为第 2 层,以此类推。
- 树的高度或深度:树中结点的最大层次。
- 路径:一条从树中任意节点出发,沿父节点 - 子节点连接,达到任意节点的序列。
- 森林:由 m(m>0)棵互不相交的树的集合称为森林。
树的实现结构
树结构相对线性表比较复杂,既要保存值域部分,也要保存结点和结点之间的关系。实际中树有很多种表示方式,常见的有以下几种:
- 双亲表示法:用数组存储每个节点,每个节点记录其双亲节点的数组下标。优点是查找双亲节点极快(O(1)),缺点是查找孩子节点需遍历整个数组(O(n))。适用于频繁查询父节点的场景。
- 孩子表示法:每个节点的所有孩子节点用单链表存储,再用数组记录每个节点的数据和孩子链表的头指针。优点是查找孩子节点高效,缺点是查找双亲节点需遍历所有节点(O(n))。适用于频繁查询子节点的场景。
- 孩子双亲表示法:结合前两种方法,每个节点同时记录双亲下标和孩子链表头指针。兼顾双亲与孩子的查询效率,但结构较复杂,内存占用略高。
其中最常用的是孩子兄弟表示法。这部分作为了解即可,在实际应用中,二叉树这种结构的应用相对来说更广泛。
二叉树详解
在树形结构中,我们最常用的是二叉树。定义为:由 n(n≥0)个节点组成的有限集合,满足空集合(空二叉树);或由一个根节点和两棵互不相交的左子树、右子树组成,左、右子树本身也是二叉树。
特殊二叉树类型
满二叉树
如果一个二叉树层次为 k,其结点总数就是 2^k - 1,则它就是满二叉树。每一层的节点个数都达到最大值。判断方法是:深度为 k 且节点总数为 2^k - 1 的二叉树,每一层节点数达到最大值,所有叶子节点集中在最底层。每个节点要么是叶子节点(度为 0),要么有两个子节点(度为 2),不存在度为 1 的节点。
完全二叉树
完全二叉树是由满二叉树而来的。对于深度为 k 的,有 n 个结点的二叉树,当且仅当其每一个结点都与深度为 k 的满二叉树中编号从 1 至 n 的结点一一对应时称之为完全二叉树。注意满二叉树是一种特殊的完全二叉树。
完全二叉树的特点:叶子节点仅在最后两层,且最底层叶子靠左连续排列;若有度为 1 的节点,最多 1 个且仅含左孩子。
二叉树存储结构
二叉树一般可以使用两种结构存储:顺序结构和链式结构。
顺序结构
顺序结构存储实际上就是使用数组来存储。一般使用数组只适合表示完全二叉树,因为不是完全二叉树会有空间的浪费。如果树中有很多的空节点,不存储任何值,我们也需要为空节点开辟空间,那样会造成空间上的浪费。 现实中我们通常把堆(一种二叉树)使用顺序结构的数组来存储。需要注意的是这里的堆和操作系统虚拟进程地址空间中的堆是两回事,一个是数据结构,一个是操作系统中管理内存的一块区域分段。
链式结构
二叉树的链式存储结构是指,用链表来表示一棵二叉树,即用链来指示元素的逻辑关系。通常的方法是链表中每个结点由三个域组成:数据域和左右指针域,左右指针分别用来给出该结点左孩子和右孩子所在的链结点的存储地址。链式结构又分为二叉链和三叉链,当前学习中一般都是二叉链。


