数据结构：堆（Heap） | 极客日志

C++算法

数据结构：堆（Heap）

详细介绍堆（Heap）这一核心数据结构。涵盖其定义（完全二叉树 + 堆序性）、存储方式（数组映射）、核心操作（上浮/下沉/建堆）及时间复杂度分析。通过 C++ 模板实现展示大根堆与小根堆逻辑，并深入讲解堆排序、优先队列、TopK 问题及中位数查询等经典应用场景。最后对比堆与 BST 区别，总结优缺点及常见误区，帮助读者掌握堆的原理与实战应用。

PhpPioneer发布于 2026/3/26更新于 2026/5/3135 浏览

数据结构：堆（Heap）

堆是计算机科学中核心的数据结构之一，基于完全二叉树构建，兼具高效的插入、删除和极值查询能力，广泛应用于优先队列、堆排序、TopK 问题等场景。

一、堆的定义与核心性质

1.1 本质定义

堆是一种完全二叉树（Complete Binary Tree），同时满足堆序性（Heap Property）。完全二叉树的定义是：除最后一层外，每一层的节点数均为最大值，且最后一层的节点从左到右连续排列（无空洞）。这种结构决定了堆可以用数组高效存储，无需额外指针开销。

1.2 堆序性规则

堆序性是堆与普通完全二叉树的核心区别，分为两种类型：

大根堆（Max Heap）：每个父节点的值 大于等于 其左右子节点的值（parent.val ≥ left.val && parent.val ≥ right.val），堆顶（根节点）是整个堆的最大值。
小根堆（Min Heap）：每个父节点的值 小于等于 其左右子节点的值（parent.val ≤ left.val && parent.val ≤ right.val），堆顶是整个堆的最小值。

1.3 与二叉搜索树（BST）的区别

堆和 BST 常被混淆，但核心目标完全不同：

特性	堆（大根堆/小根堆）	二叉搜索树（BST）
结构要求	完全二叉树	任意二叉树（通常平衡化）
有序性	仅父子节点满足堆序（全局无序）	左子树 < 根 < 右子树（全局有序）
核心操作效率	插入/删除堆顶 O(logn)，查极值 O(1)	插入/删除/查找 O(logn)（平衡 BST）
适用场景	优先队列、TopK、堆排序	动态查找、有序遍历

二、堆的存储结构

由于堆是完全二叉树，无空洞节点，因此数组是堆的最优存储方式，无需额外空间存储指针。数组与二叉树节点的映射关系如下：

假设堆的数组为 vector<T> heap，对于索引为 i 的节点（从 0 开始计数）：

父节点索引：parent = (i - 1) / 2（整数除法，自动向下取整）
左子节点索引：left = 2 * i + 1
右子节点索引：right = 2 * i + 2

示例：小根堆 [2, 5, 3, 8, 7, 6] 对应的完全二叉树结构：

 2 (i=0)
 / \
5(i=1) 3(i=2)
/ \ /
8(i=) (=) (=)

相关免费在线工具

加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
Gemini 图片去水印
基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印，支持批量处理与下载。在线工具，Gemini 图片去水印在线工具，online
Base64 字符串编码/解码
将字符串编码和解码为其 Base64 格式表示形式即可。在线工具，Base64 字符串编码/解码在线工具，online
Base64 文件转换器
将字符串、文件或图像转换为其 Base64 表示形式。在线工具，Base64 文件转换器在线工具，online
Markdown转HTML
将 Markdown（GFM）转为 HTML 片段，浏览器内 marked 解析；与 HTML转Markdown 互为补充。在线工具，Markdown转HTML在线工具，online
HTML转Markdown
将 HTML 片段转为 GitHub Flavored Markdown，支持标题、列表、链接、代码块与表格等；浏览器内处理，可链接预填。在线工具，HTML转Markdown在线工具，online

#include <vector>
#include <algorithm>
#include <stdexcept>

// 比较函数对象：大根堆（默认）
template<typename T>
struct MaxHeapCompare {
    bool operator()(const T& a, const T& b) const {
        return a < b; // 父节点需大于子节点，故 a<b 时需交换
    }
};

// 比较函数对象：小根堆
template<typename T>
struct MinHeapCompare {
    bool operator()(const T& a, const T& b) const {
        return a > b; // 父节点需小于子节点，故 a>b 时需交换
    }
};

// 堆模板类：T 为元素类型，Compare 为比较规则
template<typename T, typename Compare = MaxHeapCompare<T>>
class Heap {
private:
    std::vector<T> data; // 存储堆的数组
    Compare cmp;         // 比较函数对象

    // 上浮操作：从索引 i 向上调整堆
    void siftUp(int i) {
        while (i > 0) {
            int parent = (i - 1) / 2;
            if (!cmp(data[parent], data[i])) break;
            std::swap(data[parent], data[i]);
            i = parent;
        }
    }

    // 下沉操作：从索引 i 向下调整堆
    void siftDown(int i) {
        int n = data.size();
        while (true) {
            int maxChild = i;
            int left = 2 * i + 1;
            int right = 2 * i + 2;

            if (left < n && cmp(data[maxChild], data[left])) maxChild = left;
            if (right < n && cmp(data[maxChild], data[right])) maxChild = right;

            if (maxChild == i) break;
            std::swap(data[i], data[maxChild]);
            i = maxChild;
        }
    }

public:
    Heap() = default;

    Heap(const std::vector<T>& arr) : data(arr) {
        buildHeap();
    }

    void buildHeap() {
        int n = data.size();
        int lastNonLeaf = (n - 2) / 2;
        for (int i = lastNonLeaf; i >= 0; --i) {
            siftDown(i);
        }
    }

    void push(const T& val) {
        data.push_back(val);
        siftUp(data.size() - 1);
    }

    void pop() {
        if (empty()) throw std::runtime_error("Heap is empty, cannot pop!");
        int n = data.size();
        data[0] = data[n - 1];
        data.pop_back();
        if (!empty()) siftDown(0);
    }

    const T& top() const {
        if (empty()) throw std::runtime_error("Heap is empty, cannot get top!");
        return data[0];
    }

    bool empty() const { return data.empty(); }
    size_t size() const { return data.size(); }
};

template<typename T>
void heapSort(std::vector<T>& arr) {
    int n = arr.size();
    if (n <= 1) return;

    auto buildMaxHeap = [&](std::vector<T>& a, int size) {
        int lastNonLeaf = (size - 2) / 2;
        for (int i = lastNonLeaf; i >= 0; --i) {
            int parent = i;
            while (true) {
                int maxChild = parent;
                int left = 2 * parent + 1;
                int right = 2 * parent + 2;
                if (left < size && a[left] > a[maxChild]) maxChild = left;
                if (right < size && a[right] > a[maxChild]) maxChild = right;
                if (maxChild == parent) break;
                std::swap(a[parent], a[maxChild]);
                parent = maxChild;
            }
        }
    };

    buildMaxHeap(arr, n);
    for (int i = n - 1; i > 0; --i) {
        std::swap(arr[0], arr[i]);
        buildMaxHeap(arr, i);
    }
}

#include <queue>
#include <functional>
#include <iostream>
#include <string>

struct Task {
    std::string name;
    int priority;
    Task(std::string n, int p) : name(n), priority(p) {}
};

struct TaskCompare {
    bool operator()(const Task& a, const Task& b) const {
        return a.priority > b.priority;
    }
};

int main() {
    std::priority_queue<Task> maxPq;
    maxPq.push(Task("任务 A", 3));
    maxPq.push(Task("任务 B", 5));
    maxPq.push(Task("任务 C", 2));

    while (!maxPq.empty()) {
        auto task = maxPq.top();
        maxPq.pop();
        std::cout << "执行：" << task.name << "（优先级：" << task.priority << ")" << std::endl;
    }
    return 0;
}

#include <vector>
#include <queue>
#include <iostream>

std::vector<int> topK(std::vector<int>& data, int k) {
    if (data.empty() || k <= 0 || k > data.size()) throw std::invalid_argument("Invalid input!");

    std::priority_queue<int, std::vector<int>, std::greater<int>> minHeap;
    for (int i = 0; i < k; ++i) minHeap.push(data[i]);

    for (int i = k; i < data.size(); ++i) {
        if (data[i] > minHeap.top()) {
            minHeap.pop();
            minHeap.push(data[i]);
        }
    }

    std::vector<int> result;
    while (!minHeap.empty()) {
        result.push_back(minHeap.top());
        minHeap.pop();
    }
    return result;
}

#include <vector>
#include <queue>
#include <iostream>
#include <stdexcept>

class MedianFinder {
private:
    std::priority_queue<int> leftHeap; // 大根堆
    std::priority_queue<int, std::vector<int>, std::greater<int>> rightHeap; // 小根堆

    void balance() {
        if (leftHeap.size() - rightHeap.size() == 2) {
            rightHeap.push(leftHeap.top());
            leftHeap.pop();
        } else if (rightHeap.size() - leftHeap.size() == 1) {
            leftHeap.push(rightHeap.top());
            rightHeap.pop();
        }
    }

public:
    MedianFinder() = default;

    void addNum(int num) {
        if (leftHeap.empty() || num <= leftHeap.top()) {
            leftHeap.push(num);
        } else {
            rightHeap.push(num);
        }
        balance();
    }

    double findMedian() {
        if (leftHeap.empty() && rightHeap.empty()) throw std::runtime_error("No data!");
        if (leftHeap.size() > rightHeap.size()) return leftHeap.top();
        return (leftHeap.top() + rightHeap.top()) / 2.0;
    }
};

数据结构：堆（Heap）

数据结构：堆（Heap）

一、堆的定义与核心性质

1.1 本质定义

1.2 堆序性规则

1.3 与二叉搜索树（BST）的区别

二、堆的存储结构

更多推荐文章

相关免费在线工具

三、堆的核心操作（C++ 模板实现）

3.1 模板类框架

3.2 核心操作详解

3.2.1 上浮（siftUp）

3.2.2 下沉（siftDown）

3.2.3 建堆（buildHeap）

四、堆的经典应用

4.1 堆排序（原地排序）

C++ 实现：

4.2 优先队列（Priority Queue）

改为小根堆的两种方式：

示例：任务调度

4.3 TopK 问题（海量数据前 K 大元素）

C++ 实现：

4.4 中位数问题（动态数据实时获取中位数）

C++ 实现：

五、堆的优缺点与适用场景

5.1 优点

5.2 缺点

5.3 适用场景

六、常见误区与注意事项

补充建堆的 O(n) 复杂度推导

第一步：计算求和式的精确值

第二步：建立 h 与 n 的关系

第三步：推导 S = O(n)

更多推荐文章

相关免费在线工具

数据结构：堆（Heap）

数据结构：堆（Heap）

一、堆的定义与核心性质

1.1 本质定义

1.2 堆序性规则

1.3 与二叉搜索树（BST）的区别

二、堆的存储结构

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

三、堆的核心操作（C++ 模板实现）

3.1 模板类框架

3.2 核心操作详解

3.2.1 上浮（siftUp）

3.2.2 下沉（siftDown）

3.2.3 建堆（buildHeap）

四、堆的经典应用

4.1 堆排序（原地排序）

C++ 实现：

4.2 优先队列（Priority Queue）

改为小根堆的两种方式：

示例：任务调度

4.3 TopK 问题（海量数据前 K 大元素）

C++ 实现：

4.4 中位数问题（动态数据实时获取中位数）

C++ 实现：

五、堆的优缺点与适用场景

5.1 优点

5.2 缺点

5.3 适用场景

六、常见误区与注意事项

补充建堆的 O(n) 复杂度推导

第一步：计算求和式的精确值

第二步：建立 h 与 n 的关系

第三步：推导 S = O(n)

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具