数据结构实战：堆排序与 TopK 问题详解 | 极客日志

C算法

数据结构实战：堆排序与 TopK 问题详解

堆排序利用堆结构特性将无序数组转化为有序序列，建堆阶段采用向下调整算法可将时间复杂度优化至 O(N)。升序排序需构建大顶堆，通过交换堆顶与末尾元素并重新调整实现。TopK 问题在海量数据场景下，使用大小为 K 的小顶堆可避免全量排序的空间开销，仅遍历一次数据即可筛选出前 K 个极值。

安卓系统发布于 2026/3/26更新于 2026/7/226 浏览

前言

在深入理解堆的基础概念并实现其结构后，我们来看堆在实际工程中的两个核心应用：高效的堆排序算法和解决海量数据 TopK 问题的巧妙方法。

一、建堆策略

建堆是将无序数组转化为符合堆规则的完全二叉树的过程。相比于通过逐个插入元素（向上调整）需要 O(NlogN) 的时间复杂度，利用向下调整算法可以在 O(N) 时间内完成建堆，这是堆排序优化的关键前提。

1.1 向上调整算法回顾

向上调整通常用于插入新元素或维护堆性质。当子节点比父节点更'合适'时（例如小堆中子节点更小），子节点上浮直到找到正确位置。

核心逻辑：

新元素插入堆尾。
比较子节点与父节点，若不满足堆序则交换。
更新索引继续上浮，直至根节点或满足条件。

void AdjustUp(int* a, int child) {
    int parent = (child - 1) / 2;
    while (child > 0) {
        if (a[child] < a[parent]) {
            Swap(&a[child], &a[parent]);
            child = parent;
            parent = (child - 1) / 2;
        } else {
            break;
        }
    }
}

若构建大顶堆，只需将比较符号反转即可。

1.2 向下调整算法与 O(N) 建堆

向下调整更适合整体建堆。利用完全二叉树的特性，从最后一个非叶子节点开始向前遍历，对每个节点执行向下调整。由于叶子节点天然满足堆性质，无需调整，因此只需关注非叶子节点。

时间复杂度分析： 虽然单次向下调整最坏为 O(logN)，但考虑到不同高度节点的数量分布，整体建堆的复杂度实际为 O(N)。

void AdjustDown(int* a, int size, int parent) {
    int child = parent * 2 + 1;
    while (child < size) {
        // 若有右孩子且右孩子更小，指向右孩子
        if (child + 1 < size && a[child + 1] < a[child]) {
            child++;
        }
        // 若子节点小于父节点，交换并继续下沉
        if (a[child] < a[parent]) {
            Swap(&a[child], &a[parent]);
            parent = child;
            child = parent *  + ;
        }  {
            ;
        }
    }
}


  {
     ( i = (size -  - ) / ; i >= ; i--) {
        AdjustDown(a, size, i);
    }
}

相关免费在线工具

加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
Gemini 图片去水印
基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印，支持批量处理与下载。在线工具，Gemini 图片去水印在线工具，online
Base64 字符串编码/解码
将字符串编码和解码为其 Base64 格式表示形式即可。在线工具，Base64 字符串编码/解码在线工具，online
Base64 文件转换器
将字符串、文件或图像转换为其 Base64 表示形式。在线工具，Base64 文件转换器在线工具，online
Markdown转HTML
将 Markdown（GFM）转为 HTML 片段，浏览器内 marked 解析；与 HTML转Markdown 互为补充。在线工具，Markdown转HTML在线工具，online
HTML转Markdown
将 HTML 片段转为 GitHub Flavored Markdown，支持标题、列表、链接、代码块与表格等；浏览器内处理，可链接预填。在线工具，HTML转Markdown在线工具，online

void HeapSortAsc(int* a, int size) {
    // 1. 建大顶堆
    for (int i = (size - 1 - 1) / 2; i >= 0; i--) {
        AdjustDownMax(a, size, i); // 假设存在对应的大顶堆调整函数
    }

    int end = size - 1;
    while (end > 0) {
        Swap(&a[0], &a[end]);
        AdjustDownMax(a, end, 0); // 调整剩余部分
        end--;
    }
}

#include <stdio.h>
#include <stdlib.h>
#include <time.h>

#define N 10000

void Swap(int* x, int* y) {
    int tmp = *x;
    *x = *y;
    *y = tmp;
}

// 向下调整（小顶堆）
void AdjustDownMin(int* a, int size, int parent) {
    int child = parent * 2 + 1;
    while (child < size) {
        if (child + 1 < size && a[child + 1] < a[child]) {
            child++;
        }
        if (a[child] < a[parent]) {
            Swap(&a[child], &a[parent]);
            parent = child;
            child = parent * 2 + 1;
        } else {
            break;
        }
    }
}

// 获取前 K 个最大的数
void GetTopK(int* arr, int k) {
    int* kheap = malloc(sizeof(int) * k);
    if (!kheap) return;

    // 1. 初始化前 K 个元素
    for (int i = 0; i < k; i++) {
        kheap[i] = arr[i];
    }

    // 2. 建小顶堆
    for (int i = (k - 1 - 1) / 2; i >= 0; i--) {
        AdjustDownMin(kheap, k, i);
    }

    // 3. 遍历剩余数据
    for (int i = k; i < N; i++) {
        if (arr[i] > kheap[0]) {
            kheap[0] = arr[i];
            AdjustDownMin(kheap, k, 0);
        }
    }

    printf("最大的 %d 个数为：", k);
    for (int i = 0; i < k; i++) {
        printf("%d ", kheap[i]);
    }
    free(kheap);
}

void TestTopK() {
    srand((unsigned int)time(NULL));
    int* arr = malloc(sizeof(int) * N);
    for (int i = 0; i < N; i++) {
        arr[i] = rand() % 10000 + i;
    }
    // 模拟几个极大值
    arr[10] = 1000000 + 1;
    arr[11] = 1000000 + 2;
    
    GetTopK(arr, 5);
    free(arr);
}

int main() {
    TestTopK();
    return 0;
}

数据结构实战：堆排序与 TopK 问题详解

前言

一、建堆策略

1.1 向上调整算法回顾

1.2 向下调整算法与 O(N) 建堆

更多推荐文章

相关免费在线工具

二、堆排序原理

2.1 升序排序：建大顶堆

2.2 降序排序：建小顶堆

三、TopK 问题解决方案

3.1 暴力法的局限

3.2 堆优化方案

更多推荐文章

相关免费在线工具

数据结构实战：堆排序与 TopK 问题详解

前言

一、建堆策略

1.1 向上调整算法回顾

1.2 向下调整算法与 O(N) 建堆

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

二、堆排序原理

2.1 升序排序：建大顶堆

2.2 降序排序：建小顶堆

三、TopK 问题解决方案

3.1 暴力法的局限

3.2 堆优化方案

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具