数据结构核心：树、二叉树、堆排序与 TOP-K 问题详解 | 极客日志

C算法

数据结构核心：树、二叉树、堆排序与 TOP-K 问题详解

数据结构中树与二叉树是基础非线性结构，堆作为特殊二叉树在排序与极值查询中表现优异。文章详细讲解了树的基本概念、术语及表示法，深入剖析了二叉树的性质与存储方式。重点阐述了堆的实现细节，包括初始化、上下调整算法、插入删除操作，并对比了堆排序与冒泡排序的效率差异。针对大数据量的 TOP-K 问题，提供了基于堆的高效解决方案，分析了内存占用与算法复杂度，展示了从理论到实战的完整技术链路。

深海蔚蓝发布于 2026/3/15更新于 2026/7/2434 浏览

数据结构示意图

没有一种数据结构能应对所有场景，评估其优劣需结合具体需求。例如频繁头部操作选链表，尾部操作频繁则顺序表更优。不同的场景需要选择不同的数据结构。

一、树

1. 树的基本概念

树是一种非线性的数据结构，由 n（n>=0）个有限结点组成具有层次关系的集合。之所以叫树，是因为它看起来像一棵倒挂的树——根朝上，叶朝下。

有一个特殊的结点称为根结点，它没有前驱结点。除根结点外，其余结点被分成 M(M>0) 个互不相交的集合 T1、T2……Tm，每个集合又是一棵结构与树类似的子树。每棵子树的根结点有且只有一个前驱，可以有 0 个或多个后继。因此，树是递归定义的。

整棵树可以看成一个大集合，A 就是根节点，而大集合可以分成一个个独立的小集合称为子树。注意每个集合互不相交，如果相交则不是树而是图。

结论：

子树是不相交
除了根节点外，每个节点有且仅有一个父节点
一棵 N 个节点的树有 N-1 条边

2. 树相关术语

叶结点或终端结点：度为 0 的结点
非终端结点或分支结点：度不为 0 的结点
双亲结点或父结点：若一个结点含有子结点，则这个结点称为其子结点的父结点
孩子结点或子结点：一个结点含有的子树的根结点称为该结点的子结点
兄弟结点：具有相同父结点的结点互称为兄弟结点
结点的度：一个结点含有的子树的个数
树的度：一棵树中，最大的结点的度
结点的层次：从根开始定义起，根为第 1 层，根的子结点为第 2 层，以此类推
树的高度或深度：树中结点的最大层次
堂兄弟结点：双亲在同一层的结点互为堂兄弟
路径：一条从树中任意节点出发，沿父节点 - 子节点连接，达到任意节点的序列
结点的祖先：从根到该结点所经分支上的所有结点
子孙：以某结点为根的子树中任一结点都称为该结点的子孙
森林：由 m（m>0）棵互不相交的树的集合

3. 树的表示

树结构相对线性表比较复杂，实际中树有很多种表示方式，如双亲表示法、孩子表示法、孩子双亲表示法以及孩子兄弟表示法等。这里主要了解最常用的孩子兄弟表示法：

typedef int DataType;
struct Node {
    struct Node* child; // 左边开始的第一个孩子节点
    struct Node* ; 
    DataType data; 
};

相关免费在线工具

加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
Gemini 图片去水印
基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印，支持批量处理与下载。在线工具，Gemini 图片去水印在线工具，online
Base64 字符串编码/解码
将字符串编码和解码为其 Base64 格式表示形式即可。在线工具，Base64 字符串编码/解码在线工具，online
Base64 文件转换器
将字符串、文件或图像转换为其 Base64 表示形式。在线工具，Base64 文件转换器在线工具，online
Markdown转HTML
将 Markdown（GFM）转为 HTML 片段，浏览器内 marked 解析；与 HTML转Markdown 互为补充。在线工具，Markdown转HTML在线工具，online
HTML转Markdown
将 HTML 片段转为 GitHub Flavored Markdown，支持标题、列表、链接、代码块与表格等；浏览器内处理，可链接预填。在线工具，HTML转Markdown在线工具，online

typedef int HPDataType;
// 堆的结构
typedef struct Heap {
    HPDataType* arr;
    int size; // 有效数据个数
    int capacity; // 容量
} HP;

void HPInit(HP* php) {
    assert(php);
    php->arr = NULL;
    php->capacity = php->size = 0;
}

void HPDestroy(HP* php) {
    assert(php);
    if (php->arr) free(php->arr);
    php->arr = NULL;
    php->capacity = php->size = 0;
}

// 交换
void Swap(int* x, int* y) {
    int tmp = *x;
    *x = *y;
    *y = tmp;
}

// 向上调整算法 前提：往有效的堆中调整
void AdjustUp(HPDataType *arr, int child) {
    int parent = (child - 1) / 2;
    while (child > 0) {
        // >: 大堆
        // <: 小堆
        if (arr[child] < arr[parent]) {
            Swap(&arr[child], &arr[parent]);
            child = parent;
            parent = (child - 1) / 2;
        } else {
            break;
        }
    }
}

// 插入数据
void HPPush(HP* php, HPDataType x) {
    assert(php);
    if (php->size == php->capacity) {
        int newcapacity = php->capacity == 0 ? 4 : 2 * php->capacity;
        // 空间满了，需要增容
        HPDataType* tmp = (HPDataType*)realloc(php->arr, sizeof(HPDataType) * newcapacity);
        if (tmp == NULL) {
            perror("realloc fail!");
            exit(1);
        }
        php->arr = tmp;
        php->capacity = newcapacity;
    }
    php->arr[php->size] = x;
    // 向上调整
    AdjustUp(php->arr, php->size);
    ++php->size;
}

bool HPEmpty(HP* php) {
    assert(php);
    return php->size == 0;
}

int HPSize(HP* php) {
    assert(php);
    return php->size;
}

void AdjustDown(HPDataType* arr, int parent, int n) {
    int child = parent * 2 + 1;
    while (child < n) {
        // 先找最大的孩子，这里排序是<
        // 如果是文件的是创建大堆，所以是>
        if (child + 1 < n && arr[child] > arr[child + 1]) {
            child++;
        }
        // 先找最大的孩子，这里排序是>
        // 如果是文件的是创建大堆，所以是<
        if (arr[child] < arr[parent]) {
            Swap(&arr[child], &arr[parent]);
            parent = child;
            child = parent * 2 + 1;
        } else {
            break;
        }
    }
}

HPDataType HPTOP(HP* php) {
    assert(!HPEmpty(php));
    return php->arr[0];
}

// 排升序----建大堆，因为调用 AdjustDown 函数，将大的放到最后一个子节点，依次这样进行，会使得最小的在根节点处，就变成升序
// 排降序----建小堆，因为调用 AdjustDown 函数，将小的放到最后一个子节点，依次这样进行，会使得最大的在根节点处，就变成降序
// 借助数据结构---堆
void test01() {
    int arr[] = {17, 20, 10, 13, 19, 15};
    int n = sizeof(arr) / sizeof(arr[0]);
    HP hp;
    HPInit(&hp);
    // 调用 push 将数组中的数据建堆
    for (int i = 0; i < n; i++) {
        HPPush(&hp, arr[i]);
    }
    int i = 0;
    while (!HPEmpty(&hp)) {
        arr[i++] = HPTOP(&hp);
        HPPop(&hp);
    }
    for (int j = 0; j < n; j++) {
        printf("%d ", arr[j]);
    }
    HPDestroy(&hp);
}

// 冒泡排序，时间复杂度 O（n^2）
void BubbleSort(int* arr, int n) {
    for (int i = 0; i < n; i++) {
        int exchange = 0;
        for (int j = 0; j < n - i - 1; j++) {
            if (arr[j] > arr[j + 1]) {
                exchange = 1;
                Swap(&arr[j], &arr[j + 1]);
            }
        }
        if (exchange == 0) {
            break;
        }
    }
}

void HeapSort(int* arr, int n) {
    // 根据给定的 arr 来进行建堆
    // child:n-1 parent:(n-1-1)/2
    for (int i = (n - 1 - 1) / 2; i >= 0; i--) {
        AdjustDown(arr, i, n);
    }
}

void CreateNDate() {
    // 造数据
    int n = 100000;
    srand(time(0));
    const char* file = "data.txt";
    FILE* fin = fopen(file, "w");
    if (fin == NULL) {
        perror("fopen error");
        return;
    }
    for (int i = 0; i < n; ++i) {
        int x = (rand() + i) % 1000000;
        fprintf(fin, "%d\n", x);
    }
    fclose(fin);
}

void TopK() {
    int k = 0;
    printf("请输入 K：");
    scanf("%d", &k);
    // 读取文件中前 k 个数据建堆
    const char* file = "data.txt";
    FILE* fout = fopen(file, "r");
    if (fout == NULL) {
        perror("fopen error");
        exit(1);
    }
    // 找最大的前 K 个数，建小堆
    int* minHeap = (int*)malloc(sizeof(int) * k);
    if (minHeap == NULL) {
        perror("malloc fail!");
        exit(2);
    }
    // 读取文件中前 K 个数据建堆
    for (int i = 0; i < k; i++) {
        fscanf(fout, "%d", &minHeap[i]);
    }
    // 建堆
    for (int i = (k - 1 - 1) / 2; i >= 0; i--) {
        AdjustDown(minHeap, i, k);
    }
    // 遍历剩下的 n-k 个数据，跟堆顶比较，谁大谁入堆
    // 调整堆
    int x = 0;
    while (fscanf(fout, "%d", &x) != EOF) {
        if (x > minHeap[0]) {
            minHeap[0] = x;
            AdjustDown(minHeap, 0, k);
        }
    }
    for (int i = 0; i < k; i++) {
        printf("%d ", minHeap[i]);
    }
    fclose(fout);
}

数据结构核心：树、二叉树、堆排序与 TOP-K 问题详解

一、树

1. 树的基本概念

2. 树相关术语

3. 树的表示

更多推荐文章

相关免费在线工具

4. 树形结构实际运用场景

二、二叉树

1. 概念与结构

现实中的二叉树

特殊的二叉树

二叉树的性质

二叉树存储结构

三、手动模拟实现顺序二叉树——堆

1. 堆的结构

2. 初始化

3. 销毁

4. 向上调整算法

5. 插入数据

6. 判空

7. 求 size

8. 向下调整算法

9. 删除堆顶数据

10. 获取堆顶数据

四、堆排序

1. 思考

2. 冒泡排序

3. 建堆——算法复杂度的优与劣

4. 排序

五、TOP-K 问题

总结

更多推荐文章

相关免费在线工具

数据结构核心：树、二叉树、堆排序与 TOP-K 问题详解

一、树

1. 树的基本概念

2. 树相关术语

3. 树的表示

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

4. 树形结构实际运用场景

二、二叉树

1. 概念与结构

现实中的二叉树

特殊的二叉树

二叉树的性质

二叉树存储结构

三、手动模拟实现顺序二叉树——堆

1. 堆的结构

2. 初始化

3. 销毁

4. 向上调整算法

5. 插入数据

6. 判空

7. 求 size

8. 向下调整算法

9. 删除堆顶数据

10. 获取堆顶数据

四、堆排序

1. 思考

2. 冒泡排序

3. 建堆——算法复杂度的优与劣

4. 排序

五、TOP-K 问题

总结

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具