数据流的中位数：双堆法实现方案 | 极客日志

Javajava算法

数据流的中位数：双堆法实现方案

综述由AI生成在动态数据流中实时计算中位数的解决方案。核心思路是使用双堆法，通过大顶堆存储较小的一半元素，小顶堆存储较大的一半元素。维护两个堆的大小平衡及元素大小关系，即可在 O(log n) 时间内添加元素，O(1) 时间内获取中位数。文章提供了完整的 Java 代码实现、步骤详解、复杂度分析及扩展思考，适用于实时统计和日志分析场景。

星星泡饭发布于 2026/3/29更新于 2026/6/1232 浏览

数据流的中位数

一、问题背景与核心挑战

在实时统计、日志分析等场景中，我们经常需要处理动态数据流，并实时计算其中位数。中位数的定义是：

若序列长度为奇数，中位数是有序序列的中间值；
若序列长度为偶数，中位数是中间两个值的平均值。

如果每次添加元素后都重新排序，时间复杂度为 O(n log n)，当数据流规模很大时，这种方法无法满足实时性要求。因此，我们需要一种更高效的方式来动态维护中位数。

二、核心思路：双堆法（大顶堆 + 小顶堆）

为了高效维护中位数，我们可以用两个堆分别存储数据流的前半部分和后半部分：

堆类型	存储内容	堆顶含义
大顶堆（max-heap）	数据流中较小的一半元素	较小一半的最大值
小顶堆（min-heap）	数据流中较大的一半元素	较大一半的最小值

通过这两个堆的堆顶，我们可以快速计算中位数：

若元素总数为奇数：大顶堆的堆顶就是中位数（大顶堆比小顶堆多 1 个元素）；
若元素总数为偶数：中位数是大顶堆堆顶与小顶堆堆顶的平均值。

关键性质（必须满足）

大小关系：大顶堆的大小要么等于小顶堆，要么比小顶堆大 1；
元素关系：大顶堆中所有元素 ≤ 小顶堆中所有元素。

这两个性质保证了中位数的位置正确，且计算高效。

三、操作步骤详解

1. 初始化两个堆

大顶堆：用 PriorityQueue 实现，通过 Collections.reverseOrder() 反转比较器，使其成为大顶堆；
小顶堆：用默认的 PriorityQueue（Java 中默认是小顶堆）。

private PriorityQueue<Integer> maxHeap; // 大顶堆，存较小的一半
private PriorityQueue<Integer> minHeap; // 小顶堆，存较大的一半

public MedianFinder() {
    maxHeap = new PriorityQueue<>(Collections.reverseOrder());
    minHeap = new PriorityQueue<>();
}

2. 添加元素（addNum）

当新元素 num 到来时：

判断归属：若大顶堆为空，或 num <= maxHeap.peek()，则将 num 加入大顶堆；否则加入小顶堆；

相关免费在线工具

Keycode 信息
查找任何按下的键的javascript键代码、代码、位置和修饰符。在线工具，Keycode 信息在线工具，online
Escape 与 Native 编解码
JavaScript 字符串转义/反转义；Java 风格 \uXXXX（Native2Ascii）编码与解码。在线工具，Escape 与 Native 编解码在线工具，online
JavaScript / HTML 格式化
使用 Prettier 在浏览器内格式化 JavaScript 或 HTML 片段。在线工具，JavaScript / HTML 格式化在线工具，online
JavaScript 压缩与混淆
Terser 压缩、变量名混淆，或 javascript-obfuscator 高强度混淆（体积会增大）。在线工具，JavaScript 压缩与混淆在线工具，online
加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
Gemini 图片去水印
基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印，支持批量处理与下载。在线工具，Gemini 图片去水印在线工具，online

public void addNum(int num) {
    if (maxHeap.isEmpty() || num <= maxHeap.peek()) {
        maxHeap.offer(num);
    } else {
        minHeap.offer(num);
    }
    // 调整大小，满足性质
    if (maxHeap.size() - minHeap.size() > 1) {
        minHeap.offer(maxHeap.poll());
    } else if (minHeap.size() > maxHeap.size()) {
        maxHeap.offer(minHeap.poll());
    }
}

public double findMedian() {
    if (maxHeap.size() == minHeap.size()) {
        return (maxHeap.peek() + minHeap.peek()) / 2.0;
    } else {
        return maxHeap.peek();
    }
}

操作步骤	大顶堆状态	小顶堆状态	调整后状态	中位数结果
addNum(1)	[1]	[]	大顶堆大小 1，小顶堆 0（符合条件）	-
addNum(2)	[1]	[2]	两堆大小 1（符合条件）	-
findMedian()	[1]	[2]	-	1.5
addNum(3)	[1]	[2, 3]	小顶堆大小 2 > 大顶堆 1，将 2 移到大顶堆	-
调整后	[2, 1]（堆顶 2）	[3]	大顶堆大小 2，小顶堆 1（符合条件）	-
findMedian()	[2, 1]	[3]	-	2.0

import java.util.Collections;
import java.util.PriorityQueue;

class MedianFinder {
    private PriorityQueue<Integer> maxHeap; // 大顶堆，存储较小的一半元素
    private PriorityQueue<Integer> minHeap; // 小顶堆，存储较大的一半元素

    /** 初始化数据结构 */
    public MedianFinder() {
        maxHeap = new PriorityQueue<>(Collections.reverseOrder());
        minHeap = new PriorityQueue<>();
    }

    /** 添加元素到数据流 */
    public void addNum(int num) {
        if (maxHeap.isEmpty() || num <= maxHeap.peek()) {
            maxHeap.offer(num);
        } else {
            minHeap.offer(num);
        }
        // 调整堆的大小，保证大顶堆大小要么等于小顶堆，要么大 1
        if (maxHeap.size() - minHeap.size() > 1) {
            minHeap.offer(maxHeap.poll());
        } else if (minHeap.size() > maxHeap.size()) {
            maxHeap.offer(minHeap.poll());
        }
    }

    /** 返回当前数据流的中位数 */
    public double findMedian() {
        if (maxHeap.size() == minHeap.size()) {
            return (maxHeap.peek() + minHeap.peek()) / 2.0;
        } else {
            return maxHeap.peek();
        }
    }
}

数据流的中位数：双堆法实现方案

数据流的中位数

一、问题背景与核心挑战

二、核心思路：双堆法（大顶堆 + 小顶堆）

关键性质（必须满足）

三、操作步骤详解

1. 初始化两个堆

2. 添加元素（addNum）

更多推荐文章

相关免费在线工具

3. 查找中位数（findMedian）

四、示例演示（以示例 1 为例）

五、完整代码（Java）

六、复杂度分析

七、思路延伸

1. 其他数据结构的选择

2. 大数据流的处理

3. 扩展问题

八、总结

更多推荐文章

相关免费在线工具

数据流的中位数：双堆法实现方案

数据流的中位数

一、问题背景与核心挑战

二、核心思路：双堆法（大顶堆 + 小顶堆）

关键性质（必须满足）

三、操作步骤详解

1. 初始化两个堆

2. 添加元素（addNum）

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

3. 查找中位数（findMedian）

四、示例演示（以示例 1 为例）

五、完整代码（Java）

六、复杂度分析

七、思路延伸

1. 其他数据结构的选择

2. 大数据流的处理

3. 扩展问题

八、总结

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具