跳到主要内容
快速排序深度解析与实战优化 | 极客日志
C++ 算法
快速排序深度解析与实战优化 快速排序基于分治思想,通过选基准、分区、递归子区间实现高效排序。详解 Hoare、挖坑法、Lomuto 三种经典分区方案,对比其稳定性与复杂度。针对有序数组退化问题,引入随机选基准、三数取中及小区间插入排序优化策略。涵盖非递归迭代实现与三路划分处理重复数据场景,提供完整的 C++ 代码实战与性能分析。
快速排序核心思想
快速排序的核心在于分治策略,简单来说就是'分而治之'。它通过三步实现高效排序:
选基准 :从待排序数组中选择一个元素作为「基准值」(pivot)。
分区操作 :遍历数组,将小于基准值的元素放到左侧,大于基准值的放到右侧。这一步结束后,基准值会被放到最终排序的正确位置。
递归排序子区间 :对基准值左右两侧的子数组,重复执行上述步骤,直到所有子数组长度为 0 或 1。
这种'拆分为小问题→独立解决→自然合并'的思路,正是分治思想的典型体现。其高效性源于「分区」这一步:一次遍历就将大问题拆分成了两个规模更小的子问题。
Hoare 版本原理
Hoare 版本是经典的原地分区实现,由算法发明者 Tony Hoare 提出,核心是双指针相向遍历。
针对升序排序,首先选取区间首元素作为基准值 key,然后右指针从右向左寻找首个小于 key 的元素,左指针再从左向右寻找首个大于 key 的元素,交换两指针指向的元素并重复此过程,直到两指针相遇。最后将基准值与相遇位置的元素交换,即可完成分区。
该版本特点是原地分区、无额外空间开销,但需遵循「右指针先行」规则,否则会导致基准归位错误。
编码实操
void QuickSort1 (int * a, int left, int right) {
if (left >= right) {
return ;
}
int begin = left;
int end = right;
int keyi = left;
while (begin < end) {
while (begin < end && a[end] >= a[keyi]) {
end--;
}
while (begin < end && a[begin] <= a[keyi]) {
begin++;
}
swap (&a[begin], &a[end]);
}
swap (&a[keyi], &a[begin]);
keyi = begin;
(a, left, keyi - );
(a, keyi + , right);
}
QuickSort1
1
QuickSort1
1
这里有个细节值得注意:当 left 和 right 指定的数据和 key 值相等时不能交换,否则可能导致死循环或逻辑错误,具体表现可参考下图逻辑。
时间复杂度分析 在最优情况下,每次划分都能将数组均匀分成两部分,递归树会有 logN 层,且每一层都需要处理约 N 个元素,总的时间复杂度为 O(NlogN)。有些同学可能会疑惑,为啥每层遍历的元素都是 N?实际上每层遍历的元素个数是 N 减去该层基准值的数量,但基准值数量相对于 N 是低阶项,在大 O 表示法中可以忽略不计。
那如果数组是有序的情况还能达到均分吗?显而易见,不能。此时会退化为 O(n²)。
但在实际开发中,我们会对快排进行优化,让其能近似达到一个平衡二叉树的状态。
有序情况优化
随机选 keyi 即使输入是有序数组,随机选基准也能大概率避免'每次选到最左 / 最右元素',让递归树尽可能平衡,将最坏时间复杂度 O(n²) 优化为概率上的 O(nlogN)。
void QuickSort1 (int * a, int left, int right) {
if (left >= right) {
return ;
}
int begin = left;
int end = right;
int keyi = left;
int randi = left + rand () % (right - left + 1 );
swap (&a[randi], &a[keyi]);
while (begin < end) {
while (begin < end && a[end] >= a[keyi]) {
end--;
}
while (begin < end && a[begin] <= a[keyi]) {
begin++;
}
swap (&a[begin], &a[end]);
}
swap (&a[keyi], &a[begin]);
keyi = begin;
QuickSort1 (a, left, keyi - 1 );
QuickSort1 (a, keyi + 1 , right);
}
三数取中 这段代码实现了三数取中优化,核心是通过 GetMidNumi 函数从区间的左、中、右三个位置中选出数值居中的元素下标,将其交换到区间左端点作为基准值。以此避免在有序数组中选到极值导致的性能退化,让递归树更接近平衡。
int GetMidNumi (int * a, int left, int right) {
int midi = (right + left) / 2 ;
if (a[left] < a[midi]) {
if (a[right] < a[left]) {
return left;
} else if (a[right] > a[midi]) {
return midi;
} else {
return right;
}
} else {
if (a[right] > a[left]) {
return left;
} else if (a[midi] > a[right]) {
return midi;
} else {
return right;
}
}
}
void QuickSort1 (int * a, int left, int right) {
if (left >= right) {
return ;
}
int begin = left;
int end = right;
int keyi = left;
int midi = GetMidNumi (a, left, right);
swap (&a[midi], &a[keyi]);
while (begin < end) {
while (begin < end && a[end] >= a[keyi]) {
end--;
}
while (begin < end && a[begin] <= a[keyi]) {
begin++;
}
swap (&a[begin], &a[end]);
}
swap (&a[keyi], &a[begin]);
keyi = begin;
QuickSort1 (a, left, keyi - 1 );
QuickSort1 (a, keyi + 1 , right);
}
提示:随机选基准和三数取中可避免快排在有序数组下的性能退化,二选一即可;但面对大量重复数据时效率仍会下降,后续将介绍三路划分来解决这一问题。
稳定性分析 由于快排在分区过程中会进行跨位置的交换操作,这会打乱相等元素的相对位置,因此快速排序是不稳定的排序算法。
挖坑法 挖坑法快排的核心思路是:先选一个基准值并把它的位置设为第一个'坑',然后用右指针从后向前找比基准值小的元素填入左坑,左指针再从前向后找比基准值大的元素填入右坑,不断形成新坑,直到双指针相遇,最后把基准值填入最终的坑位完成分区。
如果是降序排序,只需调整指针查找条件:右指针找比基准值大的元素,左指针找比基准值小的元素即可。
编码实操 void QuickSort2 (int * a, int left, int right) {
if (left >= right) {
return ;
}
int key = a[left];
int hole = left;
int begin = left;
int end = right;
int randi = left + (rand () % (right - left + 1 ));
swap (&a[randi], &a[hole]);
while (begin < end) {
while (begin < end && key <= a[end]) {
end--;
}
a[hole] = a[end];
hole = end;
while (begin < end && key >= a[begin]) {
begin++;
}
a[hole] = a[begin];
hole = begin;
}
a[hole] = key;
QuickSort2 (a, left, hole - 1 );
QuickSort2 (a, hole + 1 , right);
}
Lomuto 前后指针版本 Lomuto 前后指针版快排的核心思路是:先选一个基准值,初始时 prev 和 cur 指向同一位置,然后用 cur 指针从左向右遍历,遇到比基准值小的元素时,prev 右移一位并交换二者位置;遇到比基准值大的元素时,cur 直接右移。遍历结束后,交换 prev 与基准值的位置完成分区。
编码实操 void QuickSort3 (int * a, int left, int right) {
if (left >= right) {
return ;
}
int keyi = left;
int prev = left;
int cur = left + 1 ;
int randi = left + (rand () % (right - left + 1 ));
swap (&a[randi], &a[keyi]);
while (cur <= right) {
if (a[cur] < a[keyi]) {
prev++;
swap (&a[prev], &a[cur]);
cur++;
} else {
cur++;
}
}
swap (&a[prev], &a[keyi]);
keyi = prev;
QuickSort3 (a, left, keyi - 1 );
QuickSort3 (a, keyi + 1 , right);
}
小区间优化 在快速排序中,小区间优化是一种常见的策略。当递归到小区间时,继续使用快速排序可能会因为递归调用的开销而导致性能下降。此时采用插入排序等简单排序算法来处理小区间,能减少递归深度和调用次数,降低栈空间的使用,同时利用插入排序在小规模数据上的优势。
void InsertSort (int * a, int n) {
for (int i = 0 ; i < n - 1 ; i++) {
int end = i;
int tmp = a[i + 1 ];
while (end >= 0 ) {
if (a[end] > tmp) {
a[end + 1 ] = a[end];
end--;
} else {
break ;
}
}
a[end + 1 ] = tmp;
}
}
void QuickSort3 (int * a, int left, int right) {
if (left >= right) {
return ;
}
if ((right - left + 1 ) < 15 ) {
InsertSort (a + left, right - left + 1 );
return ;
}
int keyi = left;
int prev = left;
int cur = left + 1 ;
int randi = left + (rand () % (right - left + 1 ));
swap (&a[randi], &a[keyi]);
while (cur <= right) {
if (a[cur] < a[keyi]) {
prev++;
swap (&a[prev], &a[cur]);
cur++;
} else {
cur++;
}
}
swap (&a[prev], &a[keyi]);
keyi = prev;
QuickSort3 (a, left, keyi - 1 );
QuickSort3 (a, keyi + 1 , right);
}
小区间优化的大小一般设置为 10~20(行业通用经验值,最常用的是 15)。
迭代版本(非递归) 递归版快排虽逻辑清晰,但存在函数调用开销与递归深度过大导致的栈溢出风险。因此可通过手动维护栈来模拟递归调用,实现非递归版本。
非递归思路 用栈模拟递归调用,先压入整个数组的边界,然后循环弹出边界、分区,再把左右子区间的边界压入栈,直到栈为空,排序完成。
编码实操 void QuickSortNonR (int * a, int left, int right) {
stack st;
STInit (&st);
STPush (&st, right);
STPush (&st, left);
while (!STEmpty (&st)) {
int begin = STTop (&st);
STPop (&st);
int end = STTop (&st);
STPop (&st);
if (end - begin + 1 < 15 ) {
InsertSort (a + begin, end - begin + 1 );
continue ;
}
int randi = begin + (rand () % (end - begin + 1 ));
swap (&a[randi], &a[begin]);
int keyi = begin;
int prev = begin;
int cur = begin + 1 ;
while (cur <= end) {
if (a[cur] < a[keyi]) {
prev++;
swap (&a[cur], &a[prev]);
cur++;
} else {
cur++;
}
}
swap (&a[prev], &a[keyi]);
keyi = prev;
if (begin < keyi - 1 ) {
STPush (&st, keyi - 1 );
STPush (&st, begin);
}
if (keyi + 1 < end) {
STPush (&st, end);
STPush (&st, keyi + 1 );
}
}
STDestroy (&st);
}
三路划分 三路划分思想:把数组一次分成小于基准、等于基准、大于基准三部分,等于基准的元素直接就位不再递归,只递归左右两区,大量重复数据时效率极高。
编码实操 void QuickSortT (int * a, int left, int right) {
if (left >= right) {
return ;
}
if ((right - left + 1 ) < 15 ) {
InsertSort (a + left, right - left + 1 );
return ;
}
int begin = left;
int end = right;
int cur = left + 1 ;
int randi = left + (rand () % (right - left + 1 ));
swap (&a[randi], &a[left]);
int key = a[left];
while (cur <= end) {
if (a[cur] > key) {
swap (&a[cur], &a[end]);
end--;
} else if (a[cur] < key) {
swap (&a[begin], &a[cur]);
begin++;
cur++;
} else {
cur++;
}
}
QuickSortT (a, left, begin - 1 );
QuickSortT (a, end + 1 , right);
}
普通快排和三路划分效率对比 数据场景 三路划分时间复杂度 普通快排时间复杂度 全重复值(如全 2) O(n) O(n²) 大量重复值(如 80% 是 2) 接近 O(n) O(nlogN)~O(n²) 无重复值(随机数组) O(nlogN) O(nlogN)
将字符串、文件或图像转换为其 Base64 表示形式。 在线工具,Base64 文件转换器在线工具,online
Markdown转HTML 将 Markdown(GFM)转为 HTML 片段,浏览器内 marked 解析;与 HTML转Markdown 互为补充。 在线工具,Markdown转HTML在线工具,online
HTML转Markdown 将 HTML 片段转为 GitHub Flavored Markdown,支持标题、列表、链接、代码块与表格等;浏览器内处理,可链接预填。 在线工具,HTML转Markdown在线工具,online
JSON 压缩 通过删除不必要的空白来缩小和压缩JSON。 在线工具,JSON 压缩在线工具,online