跳到主要内容
数据结构:二叉树与堆的结构及实现 | 极客日志
C 算法
数据结构:二叉树与堆的结构及实现 综述由AI生成 系统讲解了树与二叉树的基础概念、性质及存储方式,重点阐述了堆(Heap)的数据结构特性与大/小顶堆的实现原理。内容涵盖堆的初始化、插入、删除、上下调整算法,并展示了堆在 Top-K 问题筛选及堆排序中的实际应用。文章采用 C 语言进行代码演示,适合数据结构初学者深入理解。
不知所云 发布于 2026/3/25 更新于 2026/6/11 37 浏览数据结构:二叉树与堆
1. 树概念及结构
1.1 树的概念
树是一种非线性的数据结构,它是由 n(n>=0)个有限结点组成一个具有层次关系的集合。把它叫做树是因为它看起来像一棵倒挂的树,也就是说它是根朝上,而叶朝下的。
有一个特殊的结点,称为根结点 ,根结点没有前驱结点。
除根结点外,其余结点被分成 M(M>0) 个互不相交的集合 T1、T2、……、Tm ,其中每一个集合 Ti(1<= i <= m) 又是一棵结构与树类似的子树 。每棵子树的根结点有且只有一个前驱,可以有 0 个或多个后继。
因此,树是递归定义的 。
注意:树形结构中,子树之间不能有交集,否则就不是树形结构。
1.2 树的相关概念
结点的度 :一个结点含有的子树的个数称为该结点的度。
叶结点或终端结点 :度为 0 的结点称为叶结点 。
非终端结点或分支结点 :度不为 0 的结点 。
双亲结点或父结点 :若一个结点含有子结点,则这个结点称为其子结点的父结点。
孩子结点或子结点 :一个结点含有的子树的根结点称为该结点的子结点。
兄弟结点 :具有相同父结点的结点互称为兄弟结点。
树的度 :一棵树中,最大的结点的度称为树的度。
结点的层次 :从根开始定义起,根为第 1 层 ,根的子结点为第 2 层,以此类推。
树的高度或深度 :树中结点的最大层次。
堂兄弟结点 :双亲在同一层的结点互为堂兄弟。
结点的祖先 :从根到该结点所经分支上的所有结点。
子孙 :以某结点为根的子树中任一结点都称为该结点的子孙。
森林 :由 m(m>0)棵互不相交的树的集合称为森林。
空树高度为 0,只有根节点高度为一。
1.3 树的表示
树结构相对线性表就比较复杂了,要存储表示起来就比较麻烦了。既然保存值域,也要保存结点和结点之间的关系 ,实际中树有很多种表示方式如:双亲表示法,孩子表示法、孩子双亲表示法以及孩子兄弟表示法等。我们这里就简单的了解其中最常用的孩子兄弟表示法 。
typedef int DataType;
struct TreeNode {
struct TreeNode * leftChild ;
struct TreeNode * rightBrother ;
DataType data;
};
无论一个父亲节点有多少孩子,child 指向左边第一个节点。
1.4 树在实际中的运用
2. 二叉树概念及结构
2.1 概念
或者为空
由一个根结点加上两棵别称为左子树和右子树的二叉树组成
二叉树不存在度大于 2 的结点
二叉树的子树有左右之分,次序不能颠倒,因此二叉树是有序树
注意:对于任意的二叉树都是由以下几种情况复合而成的。
2.2 特殊的二叉树
满二叉树 :一个二叉树,如果每一个层的结点数都达到最大值,则这个二叉树就是满二叉树。也就是说,如果一个二叉树的层数为 K,且结点总数是 2^k-1,则它就是满二叉树。
完全二叉树 :完全二叉树是效率很高的数据结构,完全二叉树是由满二叉树而引出来的。对于深度为 K 的,有 n 个结点的二叉树,当且仅当其每一个结点都与深度为 K 的满二叉树中编号从 1 至 n 的结点一一对应时称之为完全二叉树。要注意的是满二叉树是一种特殊的完全二叉树 。
2.3 二叉树的性质
若规定根结点的层数为 1,则一棵非空二叉树的第 i 层上最多有 2^(i-1) 个结点.
若规定根结点的层数为 1,则深度为 h 的二叉树的最大结点数是 2^h-1 .
对任何一棵二叉树,如果度为 0 其叶结点个数为 n,度为 2 的分支结点个数为 m,则有 n=m+1
若规定根结点的层数为 1,具有 n 个结点的满二叉树的深度,h= log(n+1) 底数默认为 2
对于具有 n 个结点的完全二叉树,如果按照从上至下从左至右的数组顺序对所有结点从 0 开始编号,则对于序号为 i 的结点有:
若 i>0,i 位置结点的双亲序号:(i-1)/2;i=0,i 为根结点编号,无双亲结点
若 2i+1<n,左孩子序号:2i+1,2i+1>=n 否则无左孩子
若 2i+2<n,右孩子序号:2i+2,2i+2>=n 否则无右孩子
2.4 二叉树的存储结构 二叉树一般可以使用两种结构存储,一种顺序结构,一种链式结构。
1. 顺序存储 顺序结构存储就是使用数组来存储 ,一般使用数组只适合表示完全二叉树,因为不是完全二叉树会有空间的浪费。而现实中使用中只有堆 才会使用数组来存储。二叉树顺序存储在物理上是一个数组,在逻辑上是一颗二叉树。
2. 链式存储 二叉树的链式存储结构是指,用链表来表示一棵二叉树,即用链来指示元素的逻辑关系。通常的方法是链表中每个结点由三个域组成,数据域和左右指针域,左右指针分别用来给出该结点左孩子和右孩子所在的链结点的存储地址。链式结构又分为二叉链和三叉链,当前我们学习中一般都是二叉链,后面课程学到高阶数据结构如红黑树等会用到三叉链。
3. 二叉树的顺序结构及实现
3.1 二叉树的顺序结构 普通的二叉树是不适合用数组来存储的,因为可能会存在大量的空间浪费。而完全二叉树 更适合使用顺序结构存储。现实中我们通常把堆 (一种二叉树) 使用顺序结构的数组来存储,需要注意的是这里的堆和操作系统虚拟进程地址空间中的堆是两回事,一个是数据结构,一个是操作系统中管理内存的一块区域分段 。
3.2 堆的概念及结构 如果有一个关键码的集合 K = { , , ,…, },把它的所有元素按完全二叉树的顺序存储方式存储在一个一维数组中,并满足: <= 且 <= ( >= 且 >= ) i = 0,1,2…,则称为小堆 (或大堆)。将根结点最大的堆叫做最大堆或大根堆,根结点最小的堆叫做最小堆或小根堆。
堆中某个结点的值总是不大于或不小于其父结点的值;
堆总是一棵完全二叉树 。
大堆:所有的父亲>=儿子 根节点最大
小堆:所有的父亲<=儿子 根节点最小
3.3 堆的实现 同样使用多文件操作,Heap.h 用来放函数的声明,Heap.c 放函数的实现,test.c 用来测试。
1. 定义一个堆 typedef int HPDataType;
typedef struct Heap {
HPDataType* a;
int size;
int capacity;
} HP;
2. 初始化 void HPInit (HP* php) {
assert(php);
php->a = NULL ;
php->capacity = php->size = 0 ;
}
3. 销毁 void HPDestroy (HP* php) {
assert(php);
free (php->a);
php->a = NULL ;
php->capacity = php->size = 0 ;
}
4. 向上调整 void AdjustUp (HPDataType* a, int child) {
int parent = (child - 1 ) / 2 ;
while (child > 0 ) {
if (a[child] < a[parent]) {
Swap(&a[child], &a[parent]);
child = parent;
parent = (child - 1 ) / 2 ;
} else {
break ;
}
}
}
5. 堆的插入 void HPPush (HP* php, HPDataType x) {
assert(php);
if (php->size == php->capacity) {
int newcapacity = php->capacity == 0 ? 4 : php->capacity * 2 ;
HPDataType* tmp = (HPDataType*)realloc (php->a, newcapacity * sizeof (HPDataType));
if (tmp == NULL ) {
perror("realloc fail" );
return ;
}
php->a = tmp;
php->capacity = newcapacity;
}
php->a[php->size] = x;
php->size++;
AdjustUp(php->a, php->size - 1 );
}
6. 向下调整 void AdjustDown (HPDataType* a, int n, int parent) {
int child = parent * 2 + 1 ;
while (child < n)
{
if (child + 1 < n && a[child + 1 ] < a[child])
{
child++;
}
if (a[child] < a[parent]) {
Swap(&a[child], &a[parent]);
parent = child;
child = parent * 2 + 1 ;
} else {
break ;
}
}
}
7. 删除堆顶数据 删除堆是删除堆顶的数据,将堆顶的数据根最后一个数据一换,然后删除数组最后一个数据,再进行向下调整算法。
void HPPop (HP* php) {
assert(php);
assert(php->size > 0 );
Swap(&php->a[0 ], &php->a[php->size - 1 ]);
php->size--;
AdjustDown(php->a, php->size, 0 );
}
8. 判空 bool HPEmpty (HP* php) {
assert(php);
return php->size == 0 ;
}
9. 返回堆顶元素 HPDataType HPTop (HP* php)
{
assert(php);
assert(php->size > 0 );
return php->a[0 ];
}
10. 按顺序打印 #include "Heap.h"
void Test01 () {
int a[] = {2 , 4 , 5 , 7 , 3 , 2 , 1 , 5 };
HP hp;
HPInit(&hp);
for (size_t i = 0 ; i < sizeof (a) / sizeof (int ); i++) {
HPPush(&hp, a[i]);
}
while (!HPEmpty(&hp)) {
printf ("%d " , HPTop(&hp));
HPPop(&hp);
}
}
int main () {
Test01();
return 0 ;
}
11. 程序源码 #pragma once
#include <stdio.h>
#include <stdlib.h>
#include <assert.h>
#include <stdbool.h>
typedef int HPDataType;
typedef struct Heap {
HPDataType* a;
int size;
int capacity;
} HP;
void HPInit (HP* php) ;
void HPDestroy (HP* php) ;
void HPPush (HP* php, HPDataType x) ;
void HPPop (HP* php) ;
void AdjustUp (HPDataType* a, int x) ;
void AdjustDown (HPDataType* a, int n, int parent) ;
HPDataType HPTop (HP* php) ;
bool HPEmpty (HP* php) ;
#define _CRT_SECURE_NO_WARNINGS
#include "Heap.h"
void Swap (HPDataType* p1, HPDataType* p2) {
HPDataType tmp = *p1;
*p1 = *p2;
*p2 = tmp;
}
void HPInit (HP* php) {
assert(php);
php->a = NULL ;
php->capacity = php->size = 0 ;
}
void HPDestroy (HP* php) {
assert(php);
free (php->a);
php->a = NULL ;
php->capacity = php->size = 0 ;
}
void HPPush (HP* php, HPDataType x) {
assert(php);
if (php->size == php->capacity) {
int newcapacity = php->capacity == 0 ? 4 : php->capacity * 2 ;
HPDataType* tmp = (HPDataType*)realloc (php->a, newcapacity * sizeof (HPDataType));
if (tmp == NULL ) {
perror("realloc fail" );
return ;
}
php->a = tmp;
php->capacity = newcapacity;
}
php->a[php->size] = x;
php->size++;
AdjustUp(php->a, php->size - 1 );
}
void AdjustUp (HPDataType* a, int child) {
int parent = (child - 1 ) / 2 ;
while (child > 0 ) {
if (a[child] < a[parent]) {
Swap(&a[child], &a[parent]);
child = parent;
parent = (child - 1 ) / 2 ;
} else {
break ;
}
}
}
void HPPop (HP* php) {
assert(php);
assert(php->size > 0 );
Swap(&php->a[0 ], &php->a[php->size - 1 ]);
php->size--;
AdjustDown(php->a, php->size, 0 );
}
void AdjustDown (HPDataType* a, int n, int parent) {
int child = parent * 2 + 1 ;
while (child < n)
{
if (child + 1 < n && a[child + 1 ] < a[child])
{
child++;
}
if (a[child] < a[parent]) {
Swap(&a[child], &a[parent]);
parent = child;
child = parent * 2 + 1 ;
} else {
break ;
}
}
}
HPDataType HPTop (HP* php)
{
assert(php);
assert(php->size > 0 );
return php->a[0 ];
}
bool HPEmpty (HP* php) {
assert(php);
return php->size == 0 ;
}
#define _CRT_SECURE_NO_WARNINGS
#include "Heap.h"
void Test01 () {
int a[] = {2 , 4 , 5 , 7 , 3 , 2 , 1 , 5 };
HP hp;
HPInit(&hp);
for (size_t i = 0 ; i < sizeof (a) / sizeof (int ); i++) {
HPPush(&hp, a[i]);
}
int k = 0 ;
scanf ("%d" , &k);
while (k--) {
printf ("%d " , HPTop(&hp));
HPPop(&hp);
}
}
int main () {
Test01();
return 0 ;
}
3.4 堆的应用
1. TOP-k 问题 TOP-K 问题:即求数据集合中前 K 个最大的元素或者最小的元素,一般情况下数据量都比较大。
比如:专业前 10 名、世界 500 强、富豪榜、游戏中前 100 的活跃玩家等。
对于 Top-K 问题,能想到的最简单直接的方式就是排序,但是:如果数据量非常大,排序就不太可取了 (可能数据都不能一下子全部加载到内存中)。最佳的方式就是用堆来解决,基本思路如下:
用数据集合中前 K 个元素来建堆
前 k 个最大的元素,则建小堆
前 k 个最小的元素,则建大堆
用剩余的 N-K 个元素依次与堆顶元素来比较,不满足则替换堆顶元素
将剩余 N-K 个元素依次与堆顶元素比完之后,堆中剩余的 K 个元素就是所求的前 K 个最小或者最大的元素。
void PrintTopK (int * a, int n, int k) {
}
void TestTopk () {
int n = 10000 ;
int * a = (int *)malloc (sizeof (int )*n);
srand(time(0 ));
for (size_t i = 0 ; i < n; ++i) {
a[i] = rand() % 1000000 ;
}
a[5 ] = 1000000 + 1 ;
a[1231 ] = 1000000 + 2 ;
a[531 ] = 1000000 + 3 ;
a[5121 ] = 1000000 + 4 ;
a[115 ] = 1000000 + 5 ;
a[2335 ] = 1000000 + 6 ;
a[9999 ] = 1000000 + 7 ;
a[76 ] = 1000000 + 8 ;
a[423 ] = 1000000 + 9 ;
a[3144 ] = 1000000 + 10 ;
PrintTopK(a, n, 10 );
}
2. 堆排序 堆排序即利用堆的思想来进行排序,总共分为两个步骤:
建堆
利用堆删除思想来进行排序
建堆和堆删除中都用到了向下调整,因此掌握了向下调整 ,就可以完成堆排序。
相关免费在线工具 加密/解密文本 使用加密算法(如AES、TripleDES、Rabbit或RC4)加密和解密文本明文。 在线工具,加密/解密文本在线工具,online
Gemini 图片去水印 基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印,支持批量处理与下载。 在线工具,Gemini 图片去水印在线工具,online
Base64 字符串编码/解码 将字符串编码和解码为其 Base64 格式表示形式即可。 在线工具,Base64 字符串编码/解码在线工具,online
Base64 文件转换器 将字符串、文件或图像转换为其 Base64 表示形式。 在线工具,Base64 文件转换器在线工具,online
Markdown转HTML 将 Markdown(GFM)转为 HTML 片段,浏览器内 marked 解析;与 HTML转Markdown 互为补充。 在线工具,Markdown转HTML在线工具,online
HTML转Markdown 将 HTML 片段转为 GitHub Flavored Markdown,支持标题、列表、链接、代码块与表格等;浏览器内处理,可链接预填。 在线工具,HTML转Markdown在线工具,online