排序算法的速度美学:快速排序深度漫游

排序算法的速度美学:快速排序深度漫游

目录

一、快速排序思想

二、Hoare版本

1、Hoare版本介绍

2、编码实操

3、时间复杂度分析

4、有序情况优化

4.1 随机选keyi

4.2 三数取中

小贴士:

5、稳定性分析

三、挖坑法

1、挖坑法介绍

2、编码实操

四、lomuto前后指针版本

1、前后指针版本介绍

2、编码实操

3、小区间优化

五、迭代版本(非递归)

1、递归的缺陷

2、非递归思路

3、编码实操

六、三路划分

1、三路划分思想

2、编码实操

3、普通快排和三路划分效率对比


一、快速排序思想

快速排序的核心思想是分治策略,简单来说就是 “分而治之”,它通过三步实现高效排序:

1、选基准:从待排序数组中选择一个元素作为「基准值」(pivot)。

2、分区操作:遍历数组,将小于基准值的元素放到基准值左侧,大于基准值的元素放到右侧,等于基准值的元素可在任意一侧。这一步结束后,基准值会被放到最终排序的正确位置。

3、递归排序子区间:对基准值左侧和右侧的两个子数组,重复执行 “选基准→分区” 的步骤,直到所有子数组的长度为 0 或 1(此时子数组已有序)。

思想本质

快速排序的高效性,正是源于「分区」这一步:它通过一次遍历就将一个大问题拆分成了两个规模更小的子问题,而子问题的排序可以独立进行,无需额外的合并操作。这种 “拆分为小问题→独立解决→自然合并” 的思路,是分治思想的典型体现。


二、Hoare版本

1、Hoare版本介绍

Hoare 版本是快速排序的经典原地分区实现,由算法发明者 Tony Hoare 提出,核心是双指针相向遍历

核心步骤

针对升序排序:首先选取区间首元素作为基准值 key,然后右指针从右向左寻找首个小于 key 的元素,左指针再从左向右寻找首个大于 key 的元素,交换两指针指向的元素并重复此过程,直到两指针相遇,最后将基准值与相遇位置的元素交换,即可完成分区(分区后基准左侧均小于 key、右侧均大于 key)。

特点:原地分区、无额外空间开销,但需遵循「右指针先行」规则,否则会导致基准归位错误。

2、编码实操

void QuickSort1(int* a, int left, int right) { // 递归终止条件:区间元素个数≤1时,无需排序直接返回 if (left >= right) { return; } // 初始化指针:begin/end遍历区间,keyi标记基准值初始位置(选左端点为基准) int begin = left; int end = right; int keyi = left; // 双指针相向遍历,完成区间分区(升序排序) while (begin < end) { // 右指针从后往前找:第一个比基准值小的元素 while (begin < end && a[end] >= a[keyi]) { end--; } // 左指针从前往后找:第一个比基准值大的元素 while (begin < end && a[begin] <= a[keyi]) { begin++; } // 交换找到的两个元素,让小值到左、大值到右 swap(&a[begin],&a[end]); } // 指针相遇时,该位置就是基准值的最终位置,交换归位 swap(&a[keyi],&a[begin]); keyi = begin; // 递归处理基准值左右两侧的子区间,完成整体排序 QuickSort1(a, left, keyi - 1); QuickSort1(a, keyi + 1, right); }

 问题1:为什么left 和 right指定的数据和key值相等时不能交换?

3、时间复杂度分析

这张图展示的是快速排序在最优情况下的时间复杂度推导:每次划分都能将数组均匀分成两部分,递归树会有 logN 层,且每一层都需要处理约 N 个元素,总的时间复杂度为 O(NlogN)

有些同学可能会疑惑,为啥每层遍历的元素都是 N?实际上每层遍历的元素个数是 N 减去该层基准值的数量,但基准值数量相对于 N 是低阶项,在大 O 表示法中可以忽略不计,因此我们仍认为每层总遍历元素数约为 N

那如果数组是有序的情况还能达到均分吗?显而易见,不能

但是在实际中我们会对快排进行优化,让其能近似达到一个平衡二叉树的状态

4、有序情况优化

4.1 随机选keyi
void QuickSort1(int* a, int left, int right) { //递归结束条件 // >:只有一个元素 // =:没有元素 if (left >= right) { return; } int begin = left; int end = right; int keyi = left; //优化1:随机选keyi int randi = left + rand() % (right - left + 1); swap(&a[randi], &a[keyi]); //处理[begin end]区间 //当 begin 和 end 指针相遇时,就找到了基准值 key 最终应该放置的位置 while (begin < end) { //右边找小:升序 while (begin < end && a[end] >= a[keyi]) { end--; } //左边找大:升序 while (begin < end && a[begin] <= a[keyi]) { begin++; } //找到后交换 swap(&a[begin],&a[end]); } //走到这代表begin和end当前位置就是 key 的合适位置 swap(&a[keyi],&a[begin]); keyi = begin; //递归子区间 //[left keyi - 1] keyi [keyi + 1 right] QuickSort1(a,left,keyi - 1); QuickSort1(a,keyi + 1, right); }

即使输入是有序数组,随机选基准也能大概率避免 “每次选到最左 / 最右元素”,让递归树尽可能平衡,将最坏时间复杂度 O(n2) 优化为概率上的 O(nlogn)

4.2 三数取中
int GetMidNumi(int* a,int left,int right) { int midi = (right + left)/2; if (a[left] < a[midi]) { if (a[right] < a[left]) { return left; } else if (a[right] > a[midi]) { return midi; } else { return right; } } else //a[left] > a[midi] { if (a[right] > a[left]) { return left; } else if(a[midi] > a[right]) { return midi; } else { return right; } } } void QuickSort1(int* a, int left, int right) { //递归结束条件 // >:只有一个元素 // =:没有元素 if (left >= right) { return; } int begin = left; int end = right; int keyi = left; //优化2:三数取中 int midi = GetMidNumi(a,left,right); swap(&a[midi], &a[keyi]); //处理[begin end]区间 //当 begin 和 end 指针相遇时,就找到了基准值 key 最终应该放置的位置 while (begin < end) { //右边找小:升序 while (begin < end && a[end] >= a[keyi]) { end--; } //左边找大:升序 while (begin < end && a[begin] <= a[keyi]) { begin++; } //找到后交换 swap(&a[begin],&a[end]); } //走到这代表begin和end当前位置就是 key 的合适位置 swap(&a[keyi],&a[begin]); keyi = begin; //递归子区间 //[left keyi - 1] keyi [keyi + 1 right] QuickSort1(a,left,keyi - 1); QuickSort1(a,keyi + 1, right); }

这段代码为快速排序实现了三数取中优化,核心是通过 GetMidNumi 函数从区间的左、中、右三个位置中选出数值居中的元素下标,将其交换到区间左端点作为基准值,以此避免在有序数组中选到极值导致的性能退化,让递归树更接近平衡,从而将时间复杂度稳定在 O(NlogN)

小贴士:

随机选基准三数取中可避免快排在有序数组下的性能退化,二选一即可;但面对大量重复数据时效率仍会下降,后续将介绍三路划分来解决这一问题。

5、稳定性分析

由于快排在分区过程中会进行跨位置的交换操作(例如 swap(&a[cur], &a[prev])),这会打乱相等元素的相对位置,因此快速排序是不稳定的排序算法

三、挖坑法

1、挖坑法介绍

挖坑法快排(以升序为例)的核心思路是:先选一个基准值并把它的位置设为第一个 “坑”,然后用右指针从后向前找比基准值小的元素填入左坑,左指针再从前向后找比基准值大的元素填入右坑,不断形成新坑,直到双指针相遇,最后把基准值填入最终的坑位完成分区,再递归排序左右子区间。

如果是降序排序,只需调整指针查找条件:右指针找比基准值大的元素,左指针找比基准值小的元素即可。

2、编码实操

void QuickSort2(int* a, int left, int right) { if (left >= right) { return; } //基准值 int key = a[left]; //坑 int hole = left; //区间控制 int begin = left; int end = right; //随机选keyi优化 int randi = left + (rand() % (right - left + 1)); swap(&a[randi],&a[hole]); //相等就表示已经为Key找到合适的坑位了 while (begin < end) { //右边先走,找小 while (begin < end && key <= a[end]) { end--; } a[hole] = a[end]; hole = end; //左边后走,找大 while (begin < end && key >= a[begin]) { begin++;; } a[hole] = a[begin]; hole = begin; } //让基准值入坑 a[hole] = key; //[left hole - 1] hole [hole + 1 right] //递归子区间 QuickSort2(a, left, hole - 1); QuickSort2(a,hole + 1,right); } 

四、lomuto前后指针版本

1、前后指针版本介绍

Lomuto 前后指针版快排(以升序为例)的核心思路是:先选一个基准值,初始时 prevcur 指向同一位置,然后用 cur 指针从左向右遍历,遇到比基准值小的元素时,prev 右移一位并交换二者位置;遇到比基准值大的元素时,cur 直接右移。遍历结束后,交换 prev 与基准值的位置完成分区,再递归排序左右子区间。

如果是降序排序,只需调整指针查找条件:cur 指针找比基准值大的元素即可。

2、编码实操

void QuickSort3(int* a, int left, int right) { if (left >= right) { return; } int keyi = left; //prev 从头开始的设计,是为了让遍历结束时,它刚好标记出基准值应处的位置 int prev = left; int cur = left+1; int randi = left + (rand() % (right - left + 1)); swap(&a[randi], &a[keyi]); while (cur <= right) { //cur找到了小于key的值 if (a[cur] < a[keyi]) { prev++; swap(&a[prev],&a[cur]); cur++; } else { cur++; } } swap(&a[prev],&a[keyi]); keyi = prev; //[left keyi - 1] keyi [keyi + 1 right] QuickSort3(a, left ,keyi-1); QuickSort3(a, keyi+1 ,right); } 

3、小区间优化

在快速排序中,小区间优化是一种常见的优化策略。当递归到小区间时,继续使用快速排序可能会因为递归调用的开销而导致性能下降。此时采用插入排序等简单排序算法来处理小区间,能减少递归深度调用次数,降低栈空间的使用,同时利用插入排序在小规模数据上的优势,从而提高快速排序的综合性能

void InsertSort(int* a,int n) { for (int i = 0;i < n - 1;i++) { int end = i; int tmp = a[i+1]; while (end >= 0) { if (a[end] > tmp) { a[end + 1] = a[end]; end--; } else { break; } } a[end + 1] = tmp; } } void QuickSort3(int* a, int left, int right) { if (left >= right) { return; } //小区间优化 if ((right - left + 1) < 15) { InsertSort(a+left, right - left + 1); return; } int keyi = left; //prev 从头开始的设计,是为了让遍历结束时,它刚好标记出基准值应处的位置 int prev = left; int cur = left+1; int randi = left + (rand() % (right - left + 1)); swap(&a[randi], &a[keyi]); while (cur <= right) { //cur找到了小于key的值 if (a[cur] < a[keyi]) { prev++; swap(&a[prev],&a[cur]); cur++; } else { cur++; } } swap(&a[prev],&a[keyi]); keyi = prev; //[left keyi - 1] keyi [keyi + 1 right] QuickSort3(a, left ,keyi-1); QuickSort3(a, keyi+1 ,right); } 

小区间优化的大小一般设置为 10~20(行业通用经验值,最常用的是 15)

五、迭代版本(非递归)

1、递归的缺陷

递归版快排虽逻辑清晰,但存在函数调用开销与递归深度过大导致的栈溢出风险;因此可通过手动维护栈来模拟递归调用,实现非递归版本,这也是快排非递归实现的主流方式。

2、非递归思路

非递归快排的核心思路:用栈模拟递归调用,先压入整个数组的边界,然后循环弹出边界、分区,再把左右子区间的边界压入栈,直到栈为空,排序完成。

3、编码实操

void QuickSortNonR(int* a,int left, int right) { stack st; STInit(&st); //入[left right]区间 //先入right是为了能正确取到[left right]区间 STPush(&st,right); STPush(&st,left); while (!STEmpty(&st)) { int begin = STTop(&st); STPop(&st); int end = STTop(&st); STPop(&st); //小区间优化 if (end - begin + 1 < 15) { InsertSort(a + begin,end - begin + 1); continue; } //随机选keyi int randi = begin + (rand()%(end - begin + 1)); swap(&a[randi],&a[begin]); //前后指针版本 int keyi = begin; int prev = begin; int cur = begin + 1; while (cur <= end) { if (a[cur] < a[keyi]) { prev++; swap(&a[cur],&a[prev]); cur++; } else { cur++; } } swap(&a[prev],&a[keyi]); keyi = prev; //子区间处理 //[begin keyi - 1] keyi [keyi + 1 end] if (begin < keyi - 1) { STPush(&st, keyi - 1); STPush(&st, begin); } if(keyi + 1 < end) { STPush(&st, end); STPush(&st, keyi + 1); } } STDestroy(&st); } 

六、三路划分

1、三路划分思想

三路划分思想:把数组一次分成小于基准、等于基准、大于基准三部分,等于基准的元素直接就位不再递归,只递归左右两区,大量重复数据时效率极高,可直接替代普通快排。

2、编码实操

void QuickSortT(int* a, int left, int right) { if (left >= right) { return; } //小区间优化 if ((right - left + 1) < 15) { InsertSort(a + left,right - left + 1); return; } int begin = left; int end = right; int cur = left + 1; //随机选keyi int randi = left + (rand() % (right - left + 1)); swap(&a[randi],&a[left]); int key = a[left]; while (cur <= end) { if (a[cur] > key) { swap(&a[cur],&a[end]); end--; //不能直接++cur是因为从尾部交换过来的值我们还没检查过 } else if (a[cur] < key) { swap(&a[begin],&a[cur]); begin++; //cur可以直接++是因为begin的值已经被我们检查过了 cur++; } else { cur++; } } //[left begin - 1] [begin end] [end + 1 right] QuickSortT(a,left,begin - 1); QuickSortT(a,end + 1, right); }

3、普通快排和三路划分效率对比

数据场景三路划分时间复杂度普通快排时间复杂度
全重复值(如全 2)O(n)O(n²)
大量重复值(如 80% 是 2)接近 O (n)O(nlogn)~O(n²)
无重复值(随机数组)O(nlogn)O(nlogn)

Read more

初始Python篇(11)—— 面向对象三大特征

初始Python篇(11)—— 面向对象三大特征

找往期文章包括但不限于本期文章中不懂的知识点: 个人主页:我要学编程(ಥ_ಥ)-ZEEKLOG博客 所属专栏: Python 目录 封装 继承的基本概念以及使用  继承 继承的基本概念以及使用  方法重写  多态 多态的概念以及基本使用    封装 继承的基本概念以及使用  封装的概念:隐藏内部实现的细节,只对外提供操作方法(接口)。这个概念我们在上一小节中也已经学习过了,我们主要是去了解其在代码中是如何去实现的:通过有着类似 访问修饰限定符 功能的下划线来实现。 权限控制:通过对属性或方法添加单下划线、双下划线以及首尾双下划线来实现。 下划线种类功能单下划线开头表示protected,受保护的成员,这类成员被视为仅供内部家族使用,允许类本身和子类进行访问,但实际上它可以被外部代码访问双下划线开头表示private,私有的成员,这类成员只允许定义该属性或方法的类本身进行访问首尾双下划线一般表示特殊的方法 代码演示: class Dog(): # 首尾双线划线 ——> 特殊方法 def __init__(self, name, age):

By Ne0inhk
AutoGPT+Python:让AI智能体自动完成复杂任务的终极指南

AutoGPT+Python:让AI智能体自动完成复杂任务的终极指南

AutoGPT+Python:让AI智能体自动完成复杂任务的终极指南 引言:在人工智能迈向自主化的新阶段,AutoGPT作为基于大语言模型(LLM)的自主智能体代表,正掀起一场让AI自己思考、自主执行的技术革命。当它遇上Python的全栈生态与极致灵活性,开发者不再只是调用AI接口,而是能深度定制专属智能体——让AI听懂自然语言、拆解复杂目标、调用外部工具、联网检索信息、迭代优化结果,独立完成从市场调研、内容创作、代码开发到自动化运维的全流程任务。 本文从核心原理、本地部署、Python实战、插件扩展、生产优化五大维度,手把手带你从0到1搭建可落地、可监控、可进化的AI智能体系统,不管是AI爱好者、全栈开发者还是创业者,都能靠这份指南,掌握下一代人机协作的核心生产力。 一、先搞懂:AutoGPT到底是什么? 传统ChatGPT类模型是被动应答,你问一句它答一句,需要人工一步步引导;而AutoGPT是自主智能体,你只给它一个最终目标,它就能自己完成: * 任务拆解:把复杂目标拆成可执行子步骤 * 自主决策:判断下一步该做什么、调用什么工具 * 记忆管理:短期记忆存上下文

By Ne0inhk
【探寻C++之旅】C++ 智能指针完全指南:从原理到实战,彻底告别内存泄漏

【探寻C++之旅】C++ 智能指针完全指南:从原理到实战,彻底告别内存泄漏

前言 作为 C++ 开发者,你是否曾因以下场景头疼不已?函数中new了数组,却因异常抛出导致后续delete没执行,排查半天定位到内存泄漏;多模块共享一块内存,不知道该由谁负责释放,最后要么重复释放崩溃,要么漏释放泄漏;用了auto_ptr后,拷贝对象导致原对象 “悬空”,访问时直接崩溃却找不到原因。 如果你有过这些经历,那智能指针一定是你必须掌握的现代 C++ 工具。它基于 RAII 思想,自动管理动态资源,让你无需手动delete,从根源上减少内存泄漏风险。今天,我们就从 “为什么需要智能指针” 到 “不同智能指针的实战场景”,带你系统掌握这一核心特性。 请君浏览 * 前言 * 一、智能指针的诞生:解决手动管理内存的 “千古难题” * 1.1 一个典型的内存泄露场景 * 1.2 智能指针的核心:RAII 思想 * 二、C++ 标准库智能指针:

By Ne0inhk
C++核心知识点全解析(一)

C++核心知识点全解析(一)

1. C++中值传递和引用传递的区别? 1) 值传递: 在函数调用时,会触发一次参数的拷贝动作,所以对参数的修改不会影响原始的值。如果是较大的对象,复制整个对象,效率较低。 2) 引用传递: 函数调用时,函数接收的就是参数的引用,不会触发参数的拷贝动作,效率较高,但对参数的修改会直接作用于原始的值。 2. C 和 C++ 的区别 可以考虑从以下几个方面回答: 1) 面向对象还是面向过程: * C语言是一门面向过程的语言,侧重于通过过程(函数)来解决问题。 * C++是一门多范式语言,主要支持面向对象,侧重于使用类和对象来组织代码。 2) 继承: * C++支持继承,允许一个子类继承一个或多个父类,达到代码复用的目的。 * C语言中没有继承的概念。 3) 函数重载: * C++支持函数通过参数类型和参数个数的重载。 * C语言不支持重载,函数名必须唯一才行。 4) 模板: * C+

By Ne0inhk