数据结构:二叉树基础概念与 C 语言实现
一、树是什么?
1. 树的定义
树是一种非线性数据结构,由 n(n>=0)个有限结点组成一个具有层次关系的集合。
- 根结点:有一个特殊的结点,没有前驱结点。
- 子树:除根结点外,其余结点被分成 M(M>0) 个互不相交的集合 T1、T2……Tm,每一个集合 Ti 又是一棵结构与树类似的子树。每棵子树的根结点有且只有一个前驱,可以有 0 个或多个后继。
2. 常见术语
- 结点的度:一个结点含有的子树的个数。
- 叶结点:度为 0 的结点。
- 双亲结点:若一个结点含有子结点,则这个结点称为其子结点的父结点。
- 子结点:一个结点含有的子树的根结点称为该结点的子结点。
- 树的高度或深度:树中结点的最大层次。
二、二叉树
1. 二叉树的概念
二叉树是一种特殊的树,其树的度最大为 2。也就是说,一个结点最多有两个分叉。在实际应用中,由于普通树结构复杂,最实用的是二叉树。
2. 二叉树的组成
二叉树由一个根结点加上两棵别称为左子树和右子树的二叉树组成。注意二叉树的子树有左右之分,次序不能颠倒,因此二叉树是有序树。
3. 特殊的二叉树
- 满二叉树:一个二叉树,如果每一层的结点数都达到最大值,则这个二叉树就是满二叉树。如果层数为 K,且结点总数是 2^K - 1,则它是满二叉树。
- 完全二叉树:对于深度为 K 的、有 n 个结点的二叉树,当且仅当其每一个结点都与深度为 K 的满二叉树中编号从 1 至 n 的结点一一对应时称之为完全二叉树。满二叉树是一种特殊的完全二叉树。
4. 二叉树的顺序存储
对于完全二叉树,由于其编号是连续的,可以用数组进行存储。物理上是一个数组,逻辑上是一颗二叉树。
5. 二叉树的性质
- 若规定根结点的层数为 1,则一棵非空二叉树的第 i 层上最多有 2^(i-1) 个结点。
- 若规定根结点的层数为 1,则深度为 h 的二叉树的最大结点数是 2^h - 1。
- 对任何一棵二叉树,如果度为 0 的叶结点个数为 n₀,度为 2 的分支结点个数为 n₂,则有 n₀ = n₂ + 1。
- 若规定根结点的层数为 1,具有 n 个结点的满二叉树的深度 h = log₂(n + 1)。
- 对于具有 n 个结点的完全二叉树,如果按照从上至下从左至右的数组顺序对所有结点从 0 开始编号,存在以下关系:
- 若父亲在数组中下标为 i,则该父亲的左孩子下标为 2 * i + 1,右孩子下标为 2 * i + 2。
- 若孩子在数组中下标为 i,则该孩子的父亲下标为 (i - 1) / 2。 (注:前提是这些下标所对应的值存在)
三、二叉树的实现
1. 链式存储
前面提到完全二叉树可以用数组存储,但非完全二叉树若强行用数组会浪费大量空间。因此通常采用链式存储,即创建链表,使每个结点由三个域组成:数据域和左右指针域。左右指针分别用来给出该结点左孩子和右孩子所在结点的地址。
2. 节点定义
与单链表类似,二叉树中的每一个节点有以下三个成员:
- 节点中存储的数据
- 指向节点左孩子的指针
- 指向节点右孩子的指针
为了便于类型修改,我们使用 typedef 重定义数据类型。
// BTNode.h
#pragma once
BTDataType;
BTDataType data;
} BTNode;


