数据结构详解：树、二叉树、堆排序与 TOP-K 问题 | 极客日志

C算法

数据结构详解：树、二叉树、堆排序与 TOP-K 问题

数据结构是处理不同场景的基础工具。树作为非线性结构，包含根节点与子树关系。二叉树限制度为 2，有满二叉树和完全二叉树之分。堆是特殊的完全二叉树，分为大根堆和小根堆，支持向上和向下调整。堆排序利用建堆和调整实现 O(nlogn) 复杂度。TOP-K 问题在大数据量下通过维护 K 个元素的堆来高效解决，避免全量排序带来的内存压力。

人间失格发布于 2026/3/23更新于 2026/5/2013 浏览

请添加图片描述

为什么我们要学那么多的数据结构？这是因为没有一种数据结构能够去应对所有场景。我们在不同的场景需要选择不同的数据结构，所以数据结构没有好坏之分，而评估数据结构的好坏要针对场景。

一、树

1. 树的基本概念

树是一种非线性的数据结构，它是由 n（n>=0）个有限结点组成一个具有层次关系的集合。把它叫做树是因为它看起来像一棵倒挂的树，也就是说它是根朝上，而叶朝下的。

有一个特殊的结点，称为根结点，根结点没有前驱结点。除根结点外，其余结点被分成 M(M>0) 个互不相交的集合 T1、T2、……、Tm，其中每一个集合 Ti(1<= i <= m) 又是一棵结构与树类似的子树。每棵子树的根结点有且只有一个前驱，可以有 0 个或多个后继。因此，树是递归定义。

结论： 1.子树是不相交；2.除了根节点外，每个节点有且仅有一个父节点；3.一棵 N 个节点的树有 N-1 条边。

2. 树相关术语

叶结点或终端结： 度为 0 的结点称为叶结点。
非终端结点或分支结点： 度不为 0 的结点。
双亲结点或父结点： 若一个结点含有子结点，则这个结点称为其子结点的父结点。
孩子结点或子结点： 一个结点含有的子树的根结点称为该结点的子结点。
兄弟结点： 具有相同父结点的结点互称为兄弟结点。
结点的度： 一个结点含有的子树的个数称为该结点的度。
树的度： 一棵树中，最大的结点的度称为树的度。
结点的层次： 从根开始定义起，根为第 1 层，根的子结点为第 2 层，以此类推。
树的高度或深度： 树中结点的最大层次。
堂兄弟结点： 双亲在同一层的结点互为堂兄弟。
路径： 一条从树中任意节点出发，沿父节点 - 子节点连接，达到任意节点的序列。
结点的祖先： 从根到该结点所经分支上的所有结点。
子孙： 以某结点为根的子树中任一结点都称为该结点的子孙。
森林： 由 m（m>0）棵互不相交的树的集合称为森林。

3. 树的表示

实际中树有很多种表示方式如：双亲表示法，孩子表示法、孩子双亲表示法以及孩子兄弟表示法等。这里主要介绍最常用的孩子兄弟表示法。

typedef int DataType;
struct Node {
    struct Node* child; // 左边开始的第一个孩子节点
     * ; 
    DataType data; 
};

相关免费在线工具

加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
Gemini 图片去水印
基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印，支持批量处理与下载。在线工具，Gemini 图片去水印在线工具，online
Base64 字符串编码/解码
将字符串编码和解码为其 Base64 格式表示形式即可。在线工具，Base64 字符串编码/解码在线工具，online
Base64 文件转换器
将字符串、文件或图像转换为其 Base64 表示形式。在线工具，Base64 文件转换器在线工具，online
Markdown转HTML
将 Markdown（GFM）转为 HTML 片段，浏览器内 marked 解析；与 HTML转Markdown 互为补充。在线工具，Markdown转HTML在线工具，online
HTML转Markdown
将 HTML 片段转为 GitHub Flavored Markdown，支持标题、列表、链接、代码块与表格等；浏览器内处理，可链接预填。在线工具，HTML转Markdown在线工具，online

typedef int HPDataType;
// 堆的结构
typedef struct Heap {
    HPDataType* arr;
    int size; // 有效数据个数
    int capacity; // 容量
} HP;

void HPInit(HP* php) {
    assert(php);
    php->arr = NULL;
    php->capacity = php->size = 0;
}

void HPDestroy(HP* php) {
    assert(php);
    if (php->arr) free(php->arr);
    php->arr = NULL;
    php->capacity = php->size = 0;
}

// 交换
void Swap(int* x, int* y) {
    int tmp = *x;
    *x = *y;
    *y = tmp;
}

// 向上调整算法 前提；往有效的堆中调整
void AdjustUp(HPDataType *arr, int child) {
    int parent = (child - 1) / 2;
    while (child > 0) {
        // >: 大堆
        // <: 小堆
        if (arr[child] < arr[parent]) {
            Swap(&arr[child], &arr[parent]);
            child = parent;
            parent = (child - 1) / 2;
        } else {
            break;
        }
    }
}

// 插入数据
void HPPush(HP* php, HPDataType x) {
    assert(php);
    if (php->size == php->capacity) {
        int newcapacity = php->capacity == 0 ? 4 : 2 * php->capacity;
        // 空间满了，需要增容
        HPDataType* tmp = (HPDataType*)realloc(php->arr, sizeof(HPDataType) * newcapacity);
        if (tmp == NULL) {
            perror("realloc fail!\n");
            exit(1);
        }
        php->arr = tmp;
        php->capacity = newcapacity;
    }
    php->arr[php->size] = x;
    // 向上调整
    AdjustUp(php->arr, php->size);
    ++php->size;
}

bool HPEmpty(HP* php) {
    assert(php);
    return php->size == 0;
}

int HPSize(HP* php) {
    assert(php);
    return php->size;
}

void AdjustDown(HPDataType* arr, int parent, int n) {
    int child = parent * 2 + 1;
    while (child < n) {
        // 先找最大的孩子，这里排序是<
        // 如果是文件的是创建大堆，所以是>
        if (child + 1 < n && arr[child] > arr[child + 1]) {
            child++;
        }
        // 先找最大的孩子，这里排序是>
        // 如果是文件的是创建大堆，所以是<
        if (arr[child] < arr[parent]) {
            Swap(&arr[child], &arr[parent]);
            parent = child;
            child = parent * 2 + 1;
        } else {
            break;
        }
    }
}

HPDataType HPTOP(HP* php) {
    assert(!HPEmpty(php));
    return php->arr[0];
}

// 排升序----建大堆，因为调用 AdjustDown 函数，将大的放到最后一个子节点，依次这样进行，会使得最小的在根节点处，就变成升序
// 排降序----建小堆，因为调用 AdjustDown 函数，将小的放到最后一个子节点，依次这样进行，会使得最大的在根节点处，就变成降序
// 借助数据结果---堆
void test01() {
    int arr[] = {17, 20, 10, 13, 19, 15};
    int n = sizeof(arr) / sizeof(arr[0]);
    HP hp;
    HPInit(&hp);
    // 调用 push 将数组中的数据建堆
    for (int i = 0; i < n; i++) {
        HPPush(&hp, arr[i]);
    }
    int i = 0;
    while (!HPEmpty(&hp)) {
        arr[i++] = HPTOP(&hp);
        HPPop(&hp);
    }
    for (int j = 0; j < n; j++) {
        printf("%d ", arr[j]);
    }
    HPDestroy(&hp);
}

// 冒泡排序，时间复杂度 O（n^2）
void BubbleSort(int* arr, int n) {
    for (int i = 0; i < n; i++) {
        int exchange = 0;
        for (int j = 0; j < n - i - 1; j++) {
            if (arr[j] > arr[j + 1]) {
                exchange = 1;
                Swap(&arr[j], &arr[j + 1]);
            }
        }
        if (exchange == 0) {
            break;
        }
    }
}

void HeapSort(int* arr, int n) {
    // 根据给定的 arr 来进行建堆
    // child:n-1 parent;(n-1-1)/2
    for (int i = (n - 1 - 1) / 2; i >= 0; i--) {
        AdjustDown(arr, i, n);
    }
}

void CreateNDate() {
    // 造数据
    int n = 100000;
    srand(time(0));
    const char* file = "data.txt";
    FILE* fin = fopen(file, "w");
    if (fin == NULL) {
        perror("fopen error");
        return;
    }
    for (int i = 0; i < n; ++i) {
        int x = (rand() + i) % 1000000;
        fprintf(fin, "%d\n", x);
    }
    fclose(fin);
}

void TopK() {
    int k = 0;
    printf("请输入 K：");
    scanf("%d", &k);
    // 读取文件中前 k 个数据建堆
    const char* file = "data.txt";
    FILE* fout = fopen(file, "r");
    if (fout == NULL) {
        perror("fopen error");
        exit(1);
    }
    // 找最大的前 K 个数，建小堆
    int* minHeap = (int*)malloc(sizeof(int) * k);
    if (minHeap == NULL) {
        perror("malloc fail!");
        exit(2);
    }
    // 读取文件中前 K 个数据建堆
    for (int i = 0; i < k; i++) {
        fscanf(fout, "%d", &minHeap[i]);
    }
    // 建堆
    for (int i = (k - 1 - 1) / 2; i >= 0; i--) {
        AdjustDown(minHeap, i, k);
    }
    // 遍历剩下的 n-k 个数据，跟堆顶比较，谁大谁入堆
    // 调整堆
    int x = 0;
    while (fscanf(fout, "%d", &x) != EOF) {
        if (x > minHeap[0]) {
            minHeap[0] = x;
            AdjustDown(minHeap, 0, k);
        }
    }
    for (int i = 0; i < k; i++) {
        printf("%d ", minHeap[i]);
    }
    fclose(fout);
}

数据结构详解：树、二叉树、堆排序与 TOP-K 问题

一、树

1. 树的基本概念

2. 树相关术语

3. 树的表示

更多推荐文章

相关免费在线工具

4. 树形结构实际运用场景

二、二叉树

1. 概念与结构

现实中的二叉树

特殊的二叉树

二叉树的性质

二叉树存储结构

三、手动模拟实现顺序二叉树——堆

1. 堆的结构

2. 初始化

3. 销毁

4. 向上调整算法

5. 插入数据

6. 判空

7. 求 size

8. 向下调整算法

9. 删除堆顶数据

10. 获取堆顶数据

五、堆排序

1. 思考

2. 冒泡排序：

3. 建堆——算法复杂度的优与劣

4. 排序

六、TOP-K 问题

总结

更多推荐文章

相关免费在线工具

数据结构详解：树、二叉树、堆排序与 TOP-K 问题

一、树

1. 树的基本概念

2. 树相关术语

3. 树的表示

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

4. 树形结构实际运用场景

二、二叉树

1. 概念与结构

现实中的二叉树

特殊的二叉树

二叉树的性质

二叉树存储结构

三、手动模拟实现顺序二叉树——堆

1. 堆的结构

2. 初始化

3. 销毁

4. 向上调整算法

5. 插入数据

6. 判空

7. 求 size

8. 向下调整算法

9. 删除堆顶数据

10. 获取堆顶数据

五、堆排序

1. 思考

2. 冒泡排序：

3. 建堆——算法复杂度的优与劣

4. 排序

六、TOP-K 问题

总结

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具