数据结构：快速排序进阶优化

在之前的实现中，我们完成了递归与非递归版本的快速排序，并学习了三种基准选择方法。但在实际场景中，面对大量重复元素或近乎有序的数据时，传统快排的性能会显著下降。本文将通过几种进阶策略来优化快速排序，提升其在复杂数据下的表现。

一、基准选择的优化

1. 三数取中法

原理： 从子数组的首、尾、中间三个位置选取中位数作为基准。这能有效避免极端值（如最大/最小值）被选为基准，从而平衡左右子数组的划分。

核心逻辑：

计算中间索引 mid = left + (right - left) / 2；
比较 arr[left]、arr[mid]、arr[right]；
将中位数交换到合适位置（通常是 left）。

// 三数取中函数
int threewaymid(int* arr, int left, int right) {
    int mid = left + (right - left) / 2;
    if (arr[left] > arr[right]) swap(&arr[left], &arr[right]);
    if (arr[mid] > arr[right]) swap(&arr[mid], &arr[right]);
    if (arr[mid] < arr[left]) swap(&arr[mid], &arr[left]);
    return mid;
}

2. 随机数选择法

原理： 在 [left, right] 范围内随机选择一个元素作为基准。利用随机性打破固定模式，防止针对特定输入（如已排序数组）构造的最坏情况。

核心逻辑：

生成范围内的随机整数作为索引；
将随机选中的元素与首元素交换。

// 随机数取法示例
srand((unsigned int)time(NULL));
int randi = left + rand() % (right - left + 1);
swap(&arr[left], &arr[randi]);

3. 方案对比与建议

优先选择三数取中： 在多数存在部分有序数据的场景下，其划分更稳定且无随机数生成的开销。C 语言标准库 qsort 常采用类似优化。
随机数法的补充场景： 当数据分布完全未知或需防御对抗性输入时，随机选择更安全。

二、三路划分处理重复元素

当数组中存在大量与基准值相同的元素时，传统的二路划分会导致分割失衡。三路划分将数组分为'小于基准'、'等于基准'、'大于基准'三部分，显著提升此类场景的效率。

核心逻辑：

#include "introsort.h" void Swap(int* x, int* y) { int tmp = *x; *x = *y; *y = tmp; } // 向下调整建堆 void AdjustDown(int* a, int n, int parent) { int child = parent * 2 + 1; while (child < n) { if (child + 1 < n && a[child + 1] > a[child]) ++child; if (a[child] > a[parent]) { Swap(&a[child], &a[parent]); parent = child; child = parent * 2 + 1; } else break; } } // 堆排序 void HeapSort(int* a, int n) { for (int i = (n - 1 - 1) / 2; i >= 0; --i) AdjustDown(a, n, i); int end = n - 1; while (end > 0) { Swap(&a[end], &a[0]); AdjustDown(a, end, 0); --end; } } // 插入排序 void InsertSort(int* a, int n) { for (int i = 1; i < n; i++) { int end = i - 1, tmp = a[i]; while (end >= 0 && tmp < a[end]) { a[end + 1] = a[end]; --end; } a[end + 1] = tmp; } } // 三值取中 int MedianOfThree(int* arr, int left, int right) { int mid = left + (right - left) / 2; if (arr[left] > arr[mid]) Swap(&arr[left], &arr[mid]); if (arr[left] > arr[right]) Swap(&arr[left], &arr[right]); if (arr[mid] > arr[right]) Swap(&arr[mid], &arr[right]); Swap(&arr[left], &arr[mid]); return arr[left]; } // 自省排序主逻辑 void IntroSort(int* a, int left, int right, int depth, int defaultDepth) { if (left >= right) return; // 小数组使用插入排序 if (right - left + 1 < 16) { InsertSort(a + left, right - left + 1); return; } // 深度超限切换堆排序 if (depth > defaultDepth) { HeapSort(a + left, right - left + 1); return; } depth++; int prev = left, cur = prev + 1, keyi = left; // 随机选 key 或三值取中 int randi = left + (rand() % (right - left + 1)); Swap(&a[left], &a[randi]); while (cur <= right) { if (a[cur] < a[keyi] && ++prev != cur) Swap(&a[prev], &a[cur]); ++cur; } Swap(&a[prev], &a[keyi]); keyi = prev; IntroSort(a, begin, keyi - 1, depth, defaultDepth); IntroSort(a, keyi + 1, end, depth, defaultDepth); } void QuickSort(int* a, int left, int right) { int depth = 0, N = right - left + 1, logn = 0; for (int i = 1; i < N; i *= 2) logn++; IntroSort(a, left, right, depth, logn * 2); }

数据结构：快速排序进阶优化