【数据结构初阶】--快速排序进阶

【数据结构初阶】--快速排序进阶
🔥个人主页:@草莓熊Lotso

🎬作者简介:C++研发方向学习者

📖个人专栏: 《C语言》 《数据结构与算法》《C语言刷题集》《Leetcode刷题指南》

⭐️人生格言:生活是默默的坚持,毅力是永久的享受。

前言: 在之前的博客中我们实现了递归版本和非递归版本的快速排序,其中递归版本中的找基准的方法我们学习了三种。但是有些特殊的情况,比如重复元素过多或者已经有序的时候,我们的时间效率就会受到影响了,这次的进阶篇中,我们会通过一些方法来优化快速排序


目录

一.三数取中和随机数选择基准

三数取中法:

随机数选择法: 

两种方法的对比分析 :

 二.三路划分

实现步骤: 

代码实现: 

三路划分和传统二路划分思路的对比: 

 三.自省排序

核心思想: 

代码实现:


一.三数取中和随机数选择基准

三数取中法:

原理:从子数组的首元素、尾元素、中间元素中选择中位数作为基准。通过选取中间大小的值,避免极端值(如最大/最小值)作为基准,从而平衡左右子数组的划分。

核心逻辑:

  1. 计算子数组的中间索引 mid = left + (right - left) / 2;
  2. 比较 arr[left]、arr[mid]、arr[right] 三个元素;
  3. 将三者中的中位数作为基准,并交换到合适位置。

代码实现: 

//三数取中 int threewaymid(int* arr, int left, int right) { int mid = (left + right) / 2; if (arr[left] > arr[right]) { swap(&arr[left], &arr[right]); } if (arr[mid] > arr[right]) { swap(&arr[mid], &arr[right]); } if (arr[mid] < arr[left]) { swap(&arr[mid], &arr[left]); } return mid; }

 --注意我这里返回的下标,后续需要在快速排序主体函数里面操作一下

随机数选择法: 

原理:从子数组的 [left, right] 范围内随机选择一个元素作为基准。通过随机性避免固定模式导致的最坏情况(如对有序数组排序时总是选首元素作为基准)。

核心逻辑:

  1. 生成 [left, right] 范围内的随机整数作为基准索引;
  2. 将随机选中的元素与固定位置交换。

 代码实现:(直接在快排主函数里面)

//随机数取法 srand((unsigned int)time(NULL)); int randi = left + rand() % (right - left + 1); swap(&arr[left], &arr[randi]);

两种方法的对比分析 :

实际使用场景建议: 

1. 优先选择三数取中:
在多数实际场景(尤其是可能存在部分有序的数据)中,三数取中法的划分平衡性更稳定,且无随机数生成的额外开销,综合性能更优。C语言标准库中的快速排序实现(如qsort)常采用类似优化。

2. 随机数法的补充场景:
当数据分布完全未知或需要避免潜在的“对抗性输入”(如刻意构造的最坏情况数组)时,随机数选择法是更安全的选择。 


 二.三路划分

前面实现的两个方式是解决如何找key的问题以及数组接近有序的情况,而三路划分主要是用于处理有大量与Key值相同的元素时的情况。

在快速排序中,当数组存在大量重复元素时,传统的二路划分(小于基准/大于基准)会导致分割失衡,效率下降。三路划分 通过将数组分为“小于基准、等于基准、大于基准”三部分,有效解决重复元素问题,提升排序稳定性。 

核心逻辑: 将数组划分为3个部分(其中begin和end分别记录left和right的初始位置)

  • arr[begin,left-1],所有元素都小于基准
  • arr[left,right],所有元素都等于基准
  • arr[right+1,end],所有元素都大于基准

实现步骤: 

1.选择基准:我们可以采用面的三数取中或者随机数选择法

2.初始化指针:

  • begin记录left初始位置
  • end记录right初始位置
  • cur=left+1,遍历使用的指针

3.遍历和划分: 

  • 若 arr[cur] < key:交换 arr[cur] 与 arr[left],left++,cur++(扩展小于区域)
  • 若 arr[cur] == key:cur++(直接纳入等于区域)
  • 若 arr[cur] > key:交换 arr[cur] 与 arr[right],right--(扩展大于区域,cur不变,需重新检查交换后的元素)
     

4.递归处理: 遍历结束后,递归排序arr[begin,left-1],arr[right+1,end]

代码实现: 

//快速排序进阶 //三路划分实现快速排序(结合随机数法或三位取中)--应对大量重复数据和有序的情况 //三数取中 int threewaymid(int* arr, int left, int right) { int mid = (left + right) / 2; if (arr[left] < arr[right]) { swap(&arr[left], &arr[right]); } if (arr[mid] > arr[right]) { swap(&arr[mid], &arr[right]); } if (arr[mid] < arr[left]) { swap(&arr[mid], &arr[left]); } return mid; } void QuickSortMore(int* arr, int left, int right) { if (left >= right) { return; } ////随机数取法 //srand((unsigned int)time(NULL)); //int randi = left + rand() % (right - left + 1); //swap(&arr[left], &arr[randi]); //三数取中 int midi = threewaymid(arr, left, right); swap(&arr[midi], &arr[left]); int key = arr[left]; int cur = left + 1; int begin = left; int end = right; while (cur <= right) { if (arr[cur] < key) { swap(&arr[left], &arr[cur]); left++; cur++; } else if (arr[cur] > key) { swap(&arr[right], &arr[cur]); right--; } else { cur++; } } //三路划分【begin,left-1】【left,right】【right+1,end】 QuickSortMore(arr, begin, left - 1); QuickSortMore(arr, right + 1, end); } 
图示如下: 



--我们通过上面描述的操作通过画图模拟过程后可以发现,确实能成功的划分出来三个部分,且每个分区的边界都很清晰

三路划分和传统二路划分思路的对比: 

总结:三路划分是对传统快排的针对性优化,在重复元素场景下优势明显,而在随机分布的无重复元素场景中,性能与传统快排接近(仅略高常数开销),是一种更通用的快排改进方案。

--这里给大家提供一个测试快排效率的代码,大家可以自己去试试 

#include<stdio.h> #include<stdlib.h> #include<time.h> #include<string.h> void PrintArray(int* a, int n) { for (int i = 0; i < n; ++i) { printf("%d ", a[i]); } printf("\n"); } void Swap(int* p1, int* p2) { int tmp = *p1; *p1 = *p2; *p2 = tmp; } // hoare // [left, right] int PartSort1(int* a, int left, int right) { int keyi = left; ++left; while (left <= right) { //left和right相遇的位置的值⽐基准值要⼤ //right找到⽐基准值⼩或等 while (left <= right && a[right] > a[keyi]) { right--; } //left找到⽐基准值⼤或等 while (left <= right && a[left] < a[keyi]) { left++; } //right left if (left <= right) { Swap(&a[left++], &a[right--]); } } //right keyi交换 Swap(&a[keyi], &a[right]); return right; } // 前后指针 int PartSort2(int* a, int left, int right) { int prev = left; int cur = left + 1; int keyi = left; while (cur <= right) { if (a[cur] < a[keyi] && ++prev != cur) { Swap(&a[prev], &a[cur]); } ++cur; } Swap(&a[prev], &a[keyi]); keyi = prev; return keyi; } typedef struct { int leftKeyi; int rightKeyi; } KeyWayIndex; // 三路划分 KeyWayIndex PartSort3Way(int* a, int left, int right) { int key = a[left]; // left和right指向就是跟key相等的区间 // [开始, left-1][left, right][right+1, 结束] int cur = left + 1; while (cur <= right) { // 1、cur遇到⽐key⼩,⼩的换到左边,同时把key换到中间位置 // 2、cur遇到⽐key⼤,⼤的换到右边 if (a[cur] < key) { Swap(&a[cur], &a[left]); ++cur; ++left; } else if (a[cur] > key) { Swap(&a[cur], &a[right]); --right; } else { ++cur; } } KeyWayIndex kwi; kwi.leftKeyi = left; kwi.rightKeyi = right; return kwi; } void TestPartSort1() { int a1[] = { 6, 1, 7, 6, 6, 6, 4, 9 }; int a2[] = { 3, 2, 3, 3, 3, 3, 2, 3 }; int a3[] = { 2, 2, 2, 2, 2, 2, 2, 2 }; PrintArray(a1, sizeof(a1) / sizeof(int)); int keyi1 = PartSort1(a1, 0, sizeof(a1) / sizeof(int) - 1); PrintArray(a1, sizeof(a1) / sizeof(int)); printf("hoare keyi:%d\n\n", keyi1); PrintArray(a2, sizeof(a2) / sizeof(int)); int keyi2 = PartSort1(a2, 0, sizeof(a2) / sizeof(int) - 1); PrintArray(a2, sizeof(a2) / sizeof(int)); printf("hoare keyi:%d\n\n", keyi2); PrintArray(a3, sizeof(a3) / sizeof(int)); int keyi3 = PartSort1(a3, 0, sizeof(a3) / sizeof(int) - 1); PrintArray(a3, sizeof(a3) / sizeof(int)); printf("hoare keyi:%d\n\n", keyi3); } void TestPartSort2() { int a1[] = { 6, 1, 7, 6, 6, 6, 4, 9 }; int a2[] = { 3, 2, 3, 3, 3, 3, 2, 3 }; int a3[] = { 2, 2, 2, 2, 2, 2, 2, 2 }; PrintArray(a1, sizeof(a1) / sizeof(int)); int keyi1 = PartSort2(a1, 0, sizeof(a1) / sizeof(int) - 1); PrintArray(a1, sizeof(a1) / sizeof(int)); printf("前后指针 keyi:%d\n\n", keyi1); PrintArray(a2, sizeof(a2) / sizeof(int)); int keyi2 = PartSort2(a2, 0, sizeof(a2) / sizeof(int) - 1); PrintArray(a2, sizeof(a2) / sizeof(int)); printf("前后指针 keyi:%d\n\n", keyi2); PrintArray(a3, sizeof(a3) / sizeof(int)); int keyi3 = PartSort2(a3, 0, sizeof(a3) / sizeof(int) - 1); PrintArray(a3, sizeof(a3) / sizeof(int)); printf("前后指针 keyi:%d\n\n", keyi3); } void TestPartSort3() { //int a0[] = { 6,1,2,7,9,3,4,5,10,4 }; int a1[] = { 6, 1, 7, 6, 6, 6, 4, 9 }; int a2[] = { 3, 2, 3, 3, 3, 3, 2, 3 }; int a3[] = { 2, 2, 2, 2, 2, 2, 2, 2 }; PrintArray(a1, sizeof(a1) / sizeof(int)); KeyWayIndex kwi1 = PartSort3Way(a1, 0, sizeof(a1) / sizeof(int) - 1); PrintArray(a1, sizeof(a1) / sizeof(int)); printf("3Way keyi:%d,%d\n\n", kwi1.leftKeyi, kwi1.rightKeyi); PrintArray(a2, sizeof(a2) / sizeof(int)); KeyWayIndex kwi2 = PartSort3Way(a2, 0, sizeof(a2) / sizeof(int) - 1); PrintArray(a2, sizeof(a2) / sizeof(int)); printf("3Way keyi:%d,%d\n\n", kwi2.leftKeyi, kwi2.rightKeyi); PrintArray(a3, sizeof(a3) / sizeof(int)); KeyWayIndex kwi3 = PartSort3Way(a3, 0, sizeof(a3) / sizeof(int) - 1); PrintArray(a3, sizeof(a3) / sizeof(int)); printf("3Way keyi:%d,%d\n\n", kwi3.leftKeyi, kwi3.rightKeyi); } int main() { TestPartSort1(); TestPartSort2(); TestPartSort3(); return 0; } 

 三.自省排序

“自省排序”(Introspective Sort,简称IntroSort)是对快速排序的一种增强优化算法,它结合了快速排序、堆排序和插入排序的优点,通过“自省”(监控排序过程)动态调整排序策略,避免快速排序在极端情况下的性能退化,是一种兼具高效性和稳定性的综合排序方案。

核心思想: 

  1. 初始阶段使用快速排序,利用其在平均情况下的高效性(O(n log n));
  2. 通过监控递归深度,当深度超过阈值(通常为 2×logn))时,判断可能出现了分割失衡,自动切换为堆排序,避免快排最坏情况的O(n²)时间复杂度;
  3. 当子数组规模小于阈值(如16)时,切换为插入排序,减少递归和分割的开销。

这种“自省”机制确保了算法在各种数据场景下的稳定性,既保留快排的平均高效性,又通过堆排序兜底最坏情况。

代码实现:

--我这里的部分实现和前面一些示例会有一些差别,但是都是正确的,大家都可以参考实现一下。

#include"introsort.h" void Swap(int* x, int* y) { int tmp = *x; *x = *y; *y = tmp; } void AdjustDown(int* a, int n, int parent) { int child = parent * 2 + 1; while (child < n) { // 选出左右孩⼦中⼤的那⼀个 if (child + 1 < n && a[child + 1] > a[child]) { ++child; } if (a[child] > a[parent]) { Swap(&a[child], &a[parent]); parent = child; child = parent * 2 + 1; } else { break; } } } void HeapSort(int* a, int n) { // 建堆 -- 向下调整建堆 -- O(N) for (int i = (n - 1 - 1) / 2; i >= 0; --i) { AdjustDown(a, n, i); } // 需要自己先实现 -- O(N*logN) int end = n - 1; while (end > 0) { Swap(&a[end], &a[0]); AdjustDown(a, end, 0); --end; } } void InsertSort(int* a, int n) { for (int i = 1; i < n; i++) { int end = i - 1; int tmp = a[i]; // 将tmp插⼊到[0,end]区间中,保持有序 while (end >= 0) { if (tmp < a[end]) { a[end + 1] = a[end]; --end; } else { break; } } a[end + 1] = tmp; } } // 三值取中函数 int MedianOfThree(int* arr, int left, int right) { int mid = left + (right - left) / 2; // 比较并交换,确保 arr[left] <= arr[mid] <= arr[right] if (arr[left] > arr[mid]) Swap(&arr[left], &arr[mid]); if (arr[left] > arr[right]) Swap(&arr[left], &arr[right]); if (arr[mid] > arr[right]) Swap(&arr[mid], &arr[right]); // 使用中间值作为基准值,并将其移到 left 位置 Swap(&arr[left], &arr[mid]); return arr[left]; // 返回基准值 } void IntroSort(int* a, int left, int right, int depth, int defaultDepth) { if (left >= right) return; // 数组⻓度小于16的小数组,换为插入排序,简单递归次数 if (right - left + 1 < 16) { InsertSort(a + left, right - left + 1); return; } // 当深度超过2*logN时改用堆排序 if (depth > defaultDepth) { HeapSort(a + left, right - left + 1); return; } depth++; int begin = left; int end = right; // 随机选key int randi = left + (rand() % (right - left + 1)); Swap(&a[left], &a[randi]); //也可以三值取中选key //int key = MedianOfThree(arr, left, right); int prev = left; int cur = prev + 1; int keyi = left; while (cur <= right) { if (a[cur] < a[keyi] && ++prev != cur) { Swap(&a[prev], &a[cur]); } ++cur; } Swap(&a[prev], &a[keyi]); keyi = prev; // [begin, keyi-1] keyi [keyi+1, end] IntroSort(a, begin, keyi - 1, depth, defaultDepth); IntroSort(a, keyi + 1, end, depth, defaultDepth); } void QuickSort(int* a, int left, int right) { int depth = 0; int logn = 0; int N = right - left + 1; for (int i = 1; i < N; i *= 2) { logn++; } // introspective sort -- ⾃省排序 IntroSort(a, left, right, depth, logn * 2); } int* sortArray(int* nums, int numsSize, int* returnSize) { srand(time(0)); QuickSort(nums, 0, numsSize - 1); *returnSize = numsSize; return nums; }
我这里的代码演示是直接在力扣上排序数组这道题里测试的,这个题目也是非常有意思的,官方的快排答案竟然过不了。大家可以用我们上面实现的三路划分或者这个自省排序,都可以通过这道题,当然像其它的几个时间复杂度比较优秀的排序算法也可以通过。

题目链接:912. 排序数组 - 力扣(LeetCode)

往期回顾:

【数据结构初阶】--排序(一):直接插入排序,希尔排序

【数据结构初阶】--排序(二)--直接选择排序,堆排序

【数据结构初阶】--排序(三):冒泡排序,快速排序

【数据结构初阶】--排序(四):归并排序

【数据结构初阶】--排序(五)--计数排序,排序算法复杂度对比和稳定性分析

结语:本篇博客就到此结束了,大家如果是快速排序掌握的还可以的话,可以好好学习一下这篇博客中的一些优化的方法,如果时间不够或者之前掌握的不牢固的可以先放一放,后续再来学习,如果文章对你有帮助的话,欢迎评论,点赞,收藏加关注,感谢大家的支持。

Read more

LFU缓存算法全解:从双哈希+双向链表到O(1)艺术,解锁长期热点守护神

LFU缓存算法全解:从双哈希+双向链表到O(1)艺术,解锁长期热点守护神

文章目录 * 本篇摘要 * 一、核心原理 * 二、关键特性与实现机制 * 1. **数据结构设计(高效实现的核心)** * 2. **频率动态更新** * 3.实现思想及代码测试 * 4.为什么LFU用 双哈希表 + 双向链表? * 三、典型优势与劣势 * **优势场景** * **劣势与挑战** * 四、典型问题与优化策略 * 1. **新数据冷启动优化** * 2. **频率衰减(避免历史权重过高)** * 五、适用场景与典型用例 * 六、LFU vs LRU 对比 * 八、一句话总结 * 九、模版源码 * 本篇小结 本篇摘要 一、核心原理 基础规则: 优先淘汰历史访问频率最低的数据(长期统计维度)。 * 每个缓存条目维护两个核心属性:键值对数据 + 访问频率计数器。当缓存容量达到上限时,

By Ne0inhk
算法总结——【图论】

算法总结——【图论】

九 图论 1 图论方法总结 考察频率比较其他的少一些。重点在于ACM模式下比较难处理 1.1 dfs深度优先搜索 dfs就是往一个方向去搜索,不到黄河不回头。类似于回溯,两个关键点: * 搜索方向,是认准一个方向搜,直到碰壁之后再换方向 * 换方向是撤销原路径,改为节点链接的下一个路径,回溯的过程。 模板: voiddfs(参数){if(终止条件){ 存放结果;return;}for(选择:本节点所连接的其他节点){ 处理节点;dfs(图,选择的节点);// 递归 回溯,撤销处理结果 // 关键点撤销操作}} 类似回溯: voidbacktracking(参数){if(终止条件){ 存放结果;return;}for(选择:本层集合中元素(树中节点孩子的数量就是集合的大小)){ 处理节点;backtracking(

By Ne0inhk
马年“码”上发力:用Manacher“马拉车”算法,拉平最长回文难题

马年“码”上发力:用Manacher“马拉车”算法,拉平最长回文难题

💗博主介绍:计算机专业的一枚大学生 来自重庆 @燃于AC之乐✌专注于C++技术栈,算法,竞赛领域,技术学习和项目实战✌ 💗根据博主的学习进度更新(可能不及时) 💗后续更新主要内容:C语言,数据结构,C++、linux(系统编程和网络编程)、MySQL、Redis、QT、Python、Git、爬虫、数据可视化、小程序、AI大模型接入,C++实战项目与学习分享。 👇🏻 精彩专栏 推荐订阅👇🏻 点击进入🌌作者专栏🌌: 算法画解 ✅ C++ ✅ 🌟算法相关题目点击即可进入实操🌟 感兴趣的可以先收藏起来,请多多支持,还有大家有相关问题都可以给我留言咨询,希望希望共同交流心得,一起进步,你我陪伴,学习路上不孤单! 文章目录 * 前言 * Manacher(马拉车)算法 * 问题: * 1.相关概念引入

By Ne0inhk
【LeetCode_206】反转链表

【LeetCode_206】反转链表

刷爆LeetCode系列 * LeetCode第206题:反转链表 * github地址 * 前言 * 题目描述 * 题目与思路分析 * 思路一:反转链表的指针指向 * 思路二:取链表的结点,头插到新链表中 * 代码实现 * 思路一:反转指针指向 * 以下两种写法是保存curNext指针的方式不同 * 思路二:取原链表中的节点,头插到新链表 * 试错代码 * 算法代码优化 * 思路一优化: LeetCode第206题:反转链表 github地址 有梦想的电信狗 前言 本文用C++实现LeetCode第206题:反转链表 题目描述 * 题目链接:https://leetcode-cn.com/problems/reverse-linked-list/description/ 题目与思路分析 目标分析: 1. 有单链表的头节点 head ,反转原链表 2. 返回反转后的链表的头指针 3. 提高要求:时间复杂度为O(n)

By Ne0inhk