数据结构:二叉树初阶与链式存储实现
一、树的基本概念
1. 树的定义
树是一种非线性数据结构,由 n(n>=0)个有限结点组成一个具有层次关系的集合。有一个特殊的结点称为根结点,它没有前驱结点。除根结点外,其余结点被分成 M(M>0) 个互不相交的集合 T1、T2、……、Tm,其中每一个集合 Ti(1<= i <= m) 又是一棵结构与树类似的子树。每棵子树的根结点有且只有一个前驱,可以有 0 个或多个后继。
2. 常见术语
- 结点的度:一个结点含有的子树的个数。
- 叶结点或终端结点:度为 0 的结点。
- 双亲结点或父结点:若一个结点含有子结点,则这个结点称为其子结点的父结点。
- 子结点:一个结点含有的子树的根结点称为该结点的子结点。
- 树的高度或深度:树中结点的最大层次。
二、二叉树详解
1. 二叉树是什么?
二叉树是一种特殊的树,其树的度最大为 2。也就是说,一个结点最多有两个分叉。由于树的结构复杂,实际应用中最常用的是二叉树。
2. 二叉树的组成
二叉树由一个根结点加上两棵别称为左子树和右子树的二叉树组成。注意二叉树的子树有左右之分,次序不能颠倒,因此二叉树是有序树。
3. 特殊的二叉树
- 满二叉树:一个二叉树,如果每一层的结点数都达到最大值,则这个二叉树就是满二叉树。如果一个二叉树的层数为 K,且结点总数是 2^K - 1,则它就是满二叉树。
- 完全二叉树:对于深度为 K 的,有 n 个结点的二叉树,当且仅当其每一个结点都与深度为 K 的满二叉树中编号从 1 至 n 的结点一一对应时称之为完全二叉树。需要注意的是,满二叉树是一种特殊的完全二叉树。
4. 二叉树的顺序存储
对于完全二叉树,由于其编号是连续的,我们可以用数组来进行存储,用下标来进行编号。二叉树顺序存储在物理上是一个数组,而在逻辑上是一颗二叉树。
5. 二叉树的一些性质
- 若规定根结点的层数为 1,则一棵非空二叉树的第 i 层上最多有 2^(i-1) 个结点。
- 若规定根结点的层数为 1,则深度为 h 的二叉树的最大结点数是 2^h - 1。
- 对任何一棵二叉树,如果度为 0 其叶结点个数为 n₀,度为 2 的分支结点个数为 n₂,则有 n₀ = n₂ + 1。
- 若规定根结点的层数为 1,具有 n 个结点的满二叉树的深度,h = log₂(n + 1)。
- 对于具有 n 个结点的完全二叉树,如果按照从上至下从左至右的数组顺序对所有结点从 0 开始编号,存在:若父亲在数组中下标为 i,则该父亲的左孩子下标为 2i + 1,右孩子下标为 2i + 2;若孩子在数组中下标为 i,则该孩子的父亲下标为 (i - 1)/2。注意前提是这些下标所对应的值存在。
三、二叉树的实现
1. 二叉树的链式存储
前面我们提到存储完全二叉树可以用数组,是因为完全二叉树的编号是连续的。而非完全二叉树却不是如此,若强行用数组来存储会浪费大量的空间。因此,我们通常使用链式存储。
链式存储是用链表来表示一颗二叉树,用链来指示元素的逻辑关系。通常的方法是创建一链表,使每个结点由三个域组成:数据域和左右指针域。左右指针分别用来给出该结点左孩子和右孩子所在结点的地址。
2. 实现思路
与单链表的实现类似,二叉树中的每一个节点有以下三个成员:
- 节点中存储的数据
- 指向节点左孩子的指针
- 指向节点右孩子的指针
3. 代码实现
本文以创建一个 char 类型的二叉树为例。
(1)文件结构
在编写复杂程序时,建议将函数声明放在头文件中,函数定义放在源文件中,测试代码单独编写,这样条理清晰。
(2)定义二叉树
首先定义一个二叉树结构体。这里我们重定义 char 类型为 BTDataType,方便以后修改类型。同时重定义变量名为 BTNode。


