堆排序算法原理与实现

堆排序算法详解

**关键定义：**二叉堆，不稳定的选择排序算法

**定义：**堆排序标准定义

堆排序（Heap Sort）是基于二叉堆数据结构实现的一种原地、不稳定的选择排序算法，其核心是利用堆'父节点与子节点间的大小约束特性'，通过构建初始堆和反复提取堆顶极值 + 重新堆化的操作，将无序序列逐步转换为有序序列。

一、前置知识点

1. 二叉堆

堆是一个完全二叉树，主要存在两种类型：

大顶堆：每个父节点的值 ≥ 其左右子节点的值，堆顶（根节点）是整个堆的最大值。
小顶堆：每个父节点的值 ≤ 其左右子节点的值，堆顶是整个堆的最小值。

注：采用大顶堆则堆排序为升序，采用小顶堆为降序。

2. 链表和数组这两种线性存储结构

堆排序中对于元素的储存大多采用数组结构，原因如下：

特性	数组	链表（单链表）
存储结构	连续内存空间	非连续节点 + 指针串联
访问方式	随机访问（O(1)）	顺序访问（O(n)）
插入 / 删除（中间）	O(n)（需移动元素）	O(1)（仅改指针，找前驱 O(n)）
长度特性	静态固定（动态数组需扩容）	动态可变
内存开销	仅存数据，开销小	数据 + 指针，额外开销大
缓存友好性	优（连续预加载）	差（分散无预加载）
内存分配要求	需连续大空间，要求高	小块分散空间，要求低
代码实现复杂度	简单	较高（需处理指针）

结构先天适配：堆是完全二叉树，节点排列有规律，能和数组的连续索引一一对应，通过简单公式即可定位父/子节点，这是数组成为堆最优存储结构的根本原因；

效率完美匹配：数组的 O(1) 节点定位、缓存友好、原地存储特性，让堆排序的核心操作（堆化、构建堆、堆顶交换）保持高效，确保堆排序 O(n log n) 的时间复杂度和 O(1) 的空间复杂度；

短板完全规避，优势充分发挥：数组的通用缺点（连续内存、静态长度）在堆排序的固定数据量、无动态增删场景下可忽略，而链表的核心优点（动态增删、内存灵活）在堆排序中无意义，核心短板（定位慢、开销大、缓存差）却会直接让堆排序的效率大幅下降，甚至丧失算法优势。

二、堆排序实现过程（数组实现）

假设有如下二叉树

文章配图

步骤 1：确定堆化的起始节点（最后一个非叶子节点）

构建初始大顶堆时，无需对叶子节点执行堆化（叶子节点无左右子节点，本身已满足堆性质），只需从最后一个非叶子节点开始，从后向前依次对每个节点执行「向下堆化」操作。

最后一个非叶子节点索引计算：

数组最后一个元素的索引为 n-1，其父节点即为最后一个非叶子节点，索引公式为 (n-1 - 1) // 2 = (n-2) // 2。

// 测试代码 #include "XSort.h" #include <iostream> // -------------------------- 测试核心函数 -------------------------- int main() { // 1. 定义超大数组参数（可调整大小，建议根据电脑性能修改，10 万/50 万/100 万） const int BIG_ARRAY_SIZE = 100000; // 超大数组长度（10 万个元素，可按需增大） // 2. 动态分配原始超大数组（避免栈溢出，静态数组无法存储超大数据） int* pOriginalArray = new int[BIG_ARRAY_SIZE]; if (pOriginalArray == nullptr) { std::cout << "原始数组内存分配失败！" << std::endl; return -1; } // 3. 初始化随机数种子（确保每次运行随机数不同） srand((unsigned int)time(nullptr)); // 4. 填充超大数组为随机整数（值域：0~9999，保证计数排序高效运行） std::cout << "正在初始化 " << BIG_ARRAY_SIZE << " 个随机元素的超大数组..." << std::endl; for (int i = 0; i < BIG_ARRAY_SIZE; ++i) { pOriginalArray[i] = rand() % 10000; // 随机数范围：0~9999 } std::cout << "数组初始化完成！" << std::endl << std::endl; // 5. 创建 XSort 对象 XSort sortTool; // 6. 定义临时数组（用于存储原始数组副本，避免排序后破坏原始数据） int* pTempArray = new int[BIG_ARRAY_SIZE]; if (pTempArray == nullptr) { std::cout << "临时数组内存分配失败！" << std::endl; delete[] pOriginalArray; pOriginalArray = nullptr; return -1; } // 7. 测试排序算法并统计时间 clock_t start, end; double elapsedTime; // 耗时（单位：秒） // 测试：堆排序 std::memcpy(pTempArray, pOriginalArray, BIG_ARRAY_SIZE * sizeof(int)); std::cout << "\n开始测试【堆排序】..." << std::endl; start = clock(); bool heapResult = sortTool.HeapSort(pTempArray, BIG_ARRAY_SIZE); end = clock(); elapsedTime = (double)(end - start) / CLOCKS_PER_SEC; if (heapResult) std::cout << "堆排序成功！耗时：" << elapsedTime << " 秒" << std::endl; else std::cout << "堆排序失败！" << std::endl; // 8. 释放动态内存，避免内存泄漏 delete[] pOriginalArray; pOriginalArray = nullptr; delete[] pTempArray; pTempArray = nullptr; std::cout << "\n所有排序测试完成！" << std::endl; return 0; }

堆排序算法原理与实现

堆排序算法详解

一、前置知识点

1. 二叉堆

2. 链表和数组这两种线性存储结构

二、堆排序实现过程（数组实现）

步骤 1：确定堆化的起始节点（最后一个非叶子节点）

更多推荐文章

相关免费在线工具

步骤 2：构建初始大顶堆（核心：向下堆化）

步骤 3：提取堆顶极值并重新堆化（核心排序过程）

三、堆排序的核心特性

1. 时间复杂度

2. 空间复杂度

3. 稳定性

4. 适用场景

核心代码实现

测试代码

测试结果

更多推荐文章

相关免费在线工具

堆排序算法原理与实现

堆排序算法详解

一、前置知识点

1. 二叉堆

2. 链表和数组这两种线性存储结构

二、堆排序实现过程（数组实现）

步骤 1：确定堆化的起始节点（最后一个非叶子节点）

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

步骤 2：构建初始大顶堆（核心：向下堆化）

步骤 3：提取堆顶极值并重新堆化（核心排序过程）

三、堆排序的核心特性

1. 时间复杂度

2. 空间复杂度

3. 稳定性

4. 适用场景

核心代码实现

测试代码

测试结果

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具