SQL 内置高级算法原理与实现 | 极客日志

SQL算法

SQL 内置高级算法原理与实现

深入解析 SQL 语句背后的核心算法机制。涵盖排序算法（快速/归并）、聚合算法（哈希/排序）、连接算法（嵌套循环/哈希/归并）、窗口函数实现以及索引结构（B+Tree/位图）。通过阐述各算法的原理、DBMS 实现策略及扩展应用，帮助开发者理解数据库优化逻辑，提升 SQL 编写效率与系统设计能力。

LinuxPan发布于 2026/3/28更新于 2026/7/2148 浏览

在这里插入图片描述

引言：SQL 是算法的宝库

SQL（Structured Query Language）是一种声明式语言。用户只需指定'想要什么'（What），而无需关心'如何实现'（How）。这个'How'就是数据库管理系统（DBMS）如 PostgreSQL、MySQL、Oracle 等需要解决的问题。数十年来，数据库领域的专家们将无数经典的算法和数据结构优化后融入 DBMS 的核心引擎中，使得一条简单的 SQL 语句背后可能是数个诺贝尔奖级别算法的高效协作。

理解这些算法，不仅能让我们写出更高效的 SQL，更能将这些思想应用于其他的编程和系统设计场景中。

第一章：排序算法（ORDER BY）

SQL 语句：SELECT * FROM users ORDER BY age DESC, name ASC;

原理与实现

DBMS 不会在所有场景下都使用一种排序算法。它会根据数据量、内存大小、是否涉及索引等因素智能选择最优策略。

内存排序（当数据可完全放入内存）：
- 快速排序（Quicksort）：是内排序中最常见的算法。它是一种分治算法，通过选择一个'基准'元素将数据分割成独立的两部分，其中一部分的所有数据都比另一部分的所有数据要小，然后再按此方法对这两部分数据分别进行快速排序。平均时间复杂度为 O(n log n)。
- 内省排序（Introsort）：是 C++ STL sort() 的实现，也可能是现代 DBMS 的选择。它结合了快速排序、堆排序和插入排序的优点：
  - 开始使用快速排序。
  - 当递归深度超过一定 level（如 log(n)）时，转为堆排序（Heapsort）以避免快排的最坏情况 O(n²)。
  - 当数据量很小（如 < 16）时，转为插入排序（Insertion Sort），因为插入排序在小数组上常数因子极小，非常快。
外部排序（当数据量巨大，无法放入内存）：
- 归并排序（Merge Sort）：是外部排序的基石。其核心是'分而治之'和'归并'。
- 实现步骤（以两路归并为例）：
  - 阶段一：排序阶段 (Run Generation)：
    - 数据库每次读取一定数量的数据页（Page）到内存中。
    - 用内排序算法（如快排）对这些数据进行排序。
    - 将排序好的数据作为一个'有序段'（Sorted Run）写回磁盘。重复此过程，直到处理完所有数据，生成多个有序段。
  - 阶段二：合并阶段 (Merge Phase)：
    - 打开所有有序段文件。
    - 每次从每个有序段中读取一部分数据到内存的'输入缓冲区'。
    - 使用一个'最小堆'或简单的比较，从所有缓冲区当前元素中选出最小的（或最大的，取决于 ORDER BY）输出到'输出缓冲区'。
    - 输出缓冲区满则写回磁盘，并清空。
    - 当一个输入缓冲区为空时，从对应的有序段文件中读取下一批数据。
    - 重复直到所有有序段的数据都被处理完毕，最终生成一个完全有序的大文件。

代码文字实现（外部排序简化版）：

def external_sort(data_iterator, chunk_size, key_func):
    """外部排序生成器"""
    
    runs = []
     :
        chunk = []
        :
             _  (chunk_size):
                chunk.append((data_iterator))
         StopIteration:
            
          chunk:
            
        chunk.sort(key=key_func)
        
        run_file = write_chunk_to_disk(chunk)
        runs.append(run_file)
    
    
    
    iterators = [(read_chunk_from_disk(run))  run  runs]
    
    heap = []
     i, it  (iterators):
        :
            value = (it)
            heapq.heappush(heap, (key_func(value), i, value, it))
         StopIteration:
            
     heap:
        key, idx, value, it = heapq.heappop(heap)
         value
        :
            next_value = (it)
            heapq.heappush(heap, (key_func(next_value), idx, next_value, it))
         StopIteration:
            
    
     run  runs:
        os.remove(run)

相关免费在线工具

加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
Gemini 图片去水印
基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印，支持批量处理与下载。在线工具，Gemini 图片去水印在线工具，online
SQL 美化和格式化
在线格式化和美化您的 SQL 查询（它支持各种 SQL 方言）。在线工具，SQL 美化和格式化在线工具，online
SQL转CSV/JSON/XML
解析 INSERT 等受限 SQL，导出为 CSV、JSON、XML、YAML、HTML 表格（见页内语法说明）。在线工具，SQL转CSV/JSON/XML在线工具，online
CSV 工具包
CSV 与 JSON/XML/HTML/TSV/SQL 等互转，单页多 Tab。在线工具，CSV 工具包在线工具，online
Base64 字符串编码/解码
将字符串编码和解码为其 Base64 格式表示形式即可。在线工具，Base64 字符串编码/解码在线工具，online

哈希聚合（Hash Aggregation）：
- 原理：使用一个哈希表，键是 GROUP BY 的列的组合（department），值是聚合函数的中间状态（如 count、sum、min 等）。
- 实现步骤：
  - 初始化一个空哈希表。
  - 扫描表 employees 的每一行。
  - 对每一行，计算 GROUP BY 键的哈希值。
  - 在哈希表中查找该键。
    - 如果找到，则更新该键对应的聚合状态（例如，count++, sum += salary）。
    - 如果未找到，则插入该键，并初始化其聚合状态（例如，count=1, sum=salary）。
  - 扫描完成后，遍历哈希表，计算最终值（如 AVG = sum / count）并输出结果。
- 优势：通常只需要单次表扫描，效率极高，时间复杂度近似 O(n)。
排序聚合（Sort Aggregation）：
- 原理：先对数据按照 GROUP BY 的列进行排序。排序后，相同的键会紧挨在一起。然后只需按顺序扫描排序后的数据，每当键发生变化时，就输出上一个组的聚合结果。
- 实现步骤：
  - 对 employees 表按 department 排序（使用上文的外部排序）。
  - 初始化一个变量来保存当前组的键和聚合状态。
  - 遍历排序后的数据流：
    - 如果当前行的 department 与当前组的键相同，则更新聚合状态。
    - 如果不同，则输出当前组的结果，然后重置聚合状态为新的键。
- 应用场景：当需要有序的输出结果时，或者当哈希表所需内存超过可用内存时（因为排序可以使用磁盘）。
COUNT(DISTINCT) 与 HyperLogLog：
- 朴素算法：使用哈希集（HashSet）。维护一个包含所有不同值的集合，最后返回集合的大小。内存使用为 O(n)，对于海量数据不可行。
- 超级算法：HyperLogLog (HLL)：
  - 原理：一种概率算法，用于估算巨大集合的基数（不同元素的个数）。它基于一个巧妙的观察：在一个随机比特流中，连续出现 0 的最大次数 k 与基数的关系大约是 2^k。
  - 实现简述：
    - 使用一个哈希函数 h(x)，将每个元素 x 映射为一个比特串。
    - 将比特串分桶（例如，前 4 位用于确定桶索引 m，后 60 位用于计算前导 0 的个数 ρ）。
    - 每个桶 m 只记录所有映射到该桶的元素中，最大的前导 0 的个数 max_ρ[m]。
    - 估算所有桶的调和平均数：E = α_m * m^2 / (2^{-max_ρ[0]} + 2^{-max_ρ[1]} + ... + 2^{-max_ρ[m-1]})。
    - 应用一些修正公式来纠正误差。
  - 优势：内存占用极小（通常只需要 KB 级别），就能以约 1% 的误差估算十亿级别数据的基数。

def hash_aggregate(data_iterator, group_by_keys, aggregate_funcs):
    """哈希聚合实现 GROUP BY"""
    hash_table = {}
    # Key: tuple of group_by values, Value: list of aggregate states
    for row in data_iterator:
        # 提取分组键
        key = tuple(getattr(row, k) for k in group_by_keys)
        # 查找或初始化聚合状态
        if key not in hash_table:
            # 初始化每个聚合函数的初始状态
            # 例如：COUNT->0, SUM->0, AVG->(sum, count)
            states = [func.init() for func in aggregate_funcs]
            hash_table[key] = states
        else:
            states = hash_table[key]
        # 更新每个聚合函数的状态
        for i, func in enumerate(aggregate_funcs):
            states[i] = func.accumulate(states[i], row)
    
    # 计算最终结果并产出
    for key, states in hash_table.items():
        result = list(key)
        for state, func in zip(states, aggregate_funcs):
            result.append(func.finalize(state))
        yield result

# 定义聚合函数接口
class Count:
    def init(self): return 0
    def accumulate(self, state, row): return state + 1
    def finalize(self, state): return state

class Avg:
    def init(self): return (0, 0)  # (sum, count)
    def accumulate(self, state, row):
        s, c = state
        return (s + row.salary, c + 1)
    def finalize(self, state):
        s, c = state
        return s / c if c != 0 else 0

for outer_row in outer_table:
    for inner_row in inner_table:
        if join_condition(outer_row, inner_row):
            yield combine(outer_row, inner_row)

def hash_join(outer_table, inner_table, outer_key, inner_key):
    """哈希连接实现"""
    # 构建阶段：假设 inner_table 可以放入内存
    hash_map = {}
    for inner_row in inner_table:
        key = getattr(inner_row, inner_key)
        if key not in hash_map:
            hash_map[key] = []
        hash_map[key].append(inner_row)
    # 处理重复键的情况
    # 探测阶段
    for outer_row in outer_table:
        key = getattr(outer_row, outer_key)
        if key in hash_map:
            for inner_row in hash_map[key]:
                yield combine_rows(outer_row, inner_row)

def calculate_rank(data, partition_by, order_by):
    """计算 RANK() 窗口函数"""
    # 1. 分区：使用哈希表进行分区
    partitions = {}
    for row in data:
        key = tuple(getattr(row, col) for col in partition_by)
        if key not in partitions:
            partitions[key] = []
        partitions[key].append(row)
    
    # 2. 对每个分区排序
    for key, rows in partitions.items():
        rows.sort(key=lambda x: [getattr(x, col) for col in order_by], reverse=True)
    
    # 3. 计算排名
    current_rank = 1
    prev_value = None
    for i, row in enumerate(rows):
        current_value = tuple(getattr(row, col) for col in order_by)
        if prev_value is None or current_value != prev_value:
            current_rank = i + 1  # 排名等于行号
        setattr(row, 'dept_rank', current_rank)  # 将排名赋给 row 的新属性
        prev_value = current_value
    
    # 4. 将数据重新拼装回原始顺序（如果需要的话）并返回
    return data

class BPlusTreeNode:
    def __init__(self, is_leaf=False):
        self.keys = []
        self.children = []  # 对于非叶子节点，是子节点指针；对于叶子节点，是数据指针或数据本身
        self.is_leaf = is_leaf
        self.next = None  # 用于叶子节点之间的链表

def bplus_tree_search(node, key):
    """在 B+Tree 中查找一个键"""
    while node is not None:
        # 在当前节点的 keys 中找到第一个 >= key 的索引
        idx = bisect.bisect_left(node.keys, key)
        if node.is_leaf:
            # 如果是叶子节点，检查找到的索引对应的 key 是否就是要找的 key
            if idx < len(node.keys) and node.keys[idx] == key:
                return node.children[idx]  # 返回对应的数据
            else:
                return None  # 未找到
        else:
            # 如果不是叶子节点，则递归搜索相应的子节点
            node = node.children[idx]

SQL 内置高级算法原理与实现

引言：SQL 是算法的宝库

第一章：排序算法（ORDER BY）

原理与实现

更多推荐文章

相关免费在线工具

扩展应用

第二章：聚合与哈希算法（GROUP BY, COUNT(DISTINCT)）

原理与实现

扩展应用

第三章：连接算法（JOIN）

原理与实现

扩展应用

第四章：窗口函数（OVER, RANK, ROW_NUMBER）

原理与实现

扩展应用

第五章：索引与搜索算法（WHERE，B-Tree）

原理与实现

扩展应用

总结

更多推荐文章

相关免费在线工具

SQL 内置高级算法原理与实现

引言：SQL 是算法的宝库

第一章：排序算法（ORDER BY）

原理与实现

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

扩展应用

第二章：聚合与哈希算法（GROUP BY, COUNT(DISTINCT)）

原理与实现

扩展应用

第三章：连接算法（JOIN）

原理与实现

扩展应用

第四章：窗口函数（OVER, RANK, ROW_NUMBER）

原理与实现

扩展应用

第五章：索引与搜索算法（WHERE，B-Tree）

原理与实现

扩展应用

总结

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具