树的概念与结构
树是一种非线性的数据结构,由 n(n≥0)个有限结点组成一个具有层次关系的集合。之所以称为'树',是因为它看起来像一棵倒挂的树,根朝上,叶朝下。
树是递归定义的。有一个特殊的结点称为根结点,它没有前驱结点。除根结点外,其余结点被分成 M(M>0) 个互不相交的集合 T1、T2……Tm,其中每一个集合 Ti 又是一棵结构与树类似的子树。每棵子树的根结点有且只有一个前驱,可以有 0 个或多个后继。需要注意的是,子树之间不能有交集,否则就不是树形结构了。
相关术语和定义
理解树的结构需要掌握一些基本术语:
- 父结点/双亲结点:若一个结点含有子结点,则这个结点称为其子结点的父结点。
- 子结点/孩子结点:一个结点含有的子树的根结点称为该结点的子结点。
- 结点的度:一个结点有几个孩子,它的度就是多少。树的度则是树中所有结点的度的最大值。
- 叶子结点/终端结点:度为 0 的结点称为叶结点。
- 分支结点/非终端结点:度不为 0 的结点。
- 兄弟结点:具有相同父结点的结点互称为兄弟结点。
- 结点的层次:从根开始定义起,根为第 1 层,根的子结点为第 2 层,以此类推。
- 树的高度或深度:树中结点的最大层次。
- 祖先与子孙:从根到该结点所经分支上的所有结点为该结点的祖先;以某结点为根的子树中任一结点都称为该结点的子孙。
- 森林:由 m(m>0)棵互不相交的树的集合称为森林。
树的实现结构
树结构相对线性表比较复杂,存储表示起来也比较麻烦,既需要保存值域部分,也要保存结点和结点之间的关系。实际中树有很多种表示方式,这里主要介绍三种常见的结构:
双亲表示法
核心思想是用数组存储每个节点,每个节点记录其双亲节点的数组下标。
- 优点:查找双亲节点极快(O(1))。
- 缺点:查找孩子节点需遍历整个数组(O(n))。
- 适用场景:频繁查询父节点的场景。
孩子表示法
每个节点的所有孩子节点用单链表存储,再用数组记录每个节点的数据和孩子链表的头指针。
- 优点:查找孩子节点高效(直接遍历链表)。
- 缺点:查找双亲节点需遍历所有节点(O(n))。
- 适用场景:频繁查询子节点的场景。
孩子双亲表示法
结合前两种方法,每个节点同时记录双亲下标和孩子链表头指针,兼顾双亲与孩子的查询效率。
- 优点:同时支持 O(1) 查找双亲、O(k) 查找孩子。
- 缺点:结构较复杂,内存占用略高。
在实际应用中,最常用的是孩子兄弟表示法。不过对于二叉树这种结构,应用更为广泛。
树的应用场景
文件系统是计算机存储和管理文件的一种方式,它利用树形结构来组织和管理文件和文件夹。在文件系统中,树结构被广泛应用,通过父结点和子结点之间的关系来表示不同层级的文件和文件夹之间的关联。
二叉树部分知识讲解
一.二叉树概念与结构
二叉树是由 n(n≥0)个节点组成的有限集合,满足:空集合(空二叉树);或由一个根节点和两棵互不相交的左子树、右子树组成,左、右子树本身也是二叉树。
二叉树有 5 种基本形态:空二叉树、仅含根节点、根节点 + 左子树、根节点 + 右子树、根节点 + 左子树 + 右子树。
补充说明:
- 二叉树不存在度大于 2 的结点。
- 二叉树的子树有左右之分,次序不能颠倒,因此二叉树是有序树。


