Java ForkJoin 框架详解：分治法与并行编程

Java ForkJoin 框架详解：分治法与并行编程 | 极客日志

// 方式一：使用默认构造器（并行度 = CPU 核心数）
ForkJoinPool pool1 = new ForkJoinPool();

// 方式二：指定并行度
ForkJoinPool pool2 = new ForkJoinPool(4); // 使用 4 个线程

// 方式三：使用公共池（推荐！）
ForkJoinPool commonPool = ForkJoinPool.commonPool();

方法	描述
`execute(ForkJoinTask)`	异步执行任务，无返回值
`submit(ForkJoinTask)`	异步执行任务，返回 `Future` 对象
`invoke(ForkJoinTask)`	同步执行任务，等待任务完成并返回结果
`invokeAll(ForkJoinTask...)`	批量提交多个子任务，等待所有完成

import java.util.concurrent.ForkJoinPool;
import java.util.concurrent.RecursiveTask;

/**
 * 使用 Fork/Join 计算数组求和
 */
public class ArraySumCalculator extends RecursiveTask<Long> {
    private final int[] array;
    private final int start;
    private final int end;
    private static final int THRESHOLD = 10000; // 阈值：当数组长度小于此值时，不再拆分

    public ArraySumCalculator(int[] array) {
        this(array, 0, array.length);
    }

    private ArraySumCalculator(int[] array, int start, int end) {
        this.array = array;
        this.start = start;
        this.end = end;
    }

    @Override
    protected Long compute() {
        int length = end - start;
        // 1. 如果任务足够小，直接计算（不再分解）
        if (length <= THRESHOLD) {
            return computeDirectly();
        }
        // 2. 任务拆分
        int mid = start + length / 2;
        ArraySumCalculator leftTask = new ArraySumCalculator(array, start, mid);
        ArraySumCalculator rightTask = new ArraySumCalculator(array, mid, end);
        // 3. 异步执行左半部分任务（fork）
        leftTask.fork();
        // 4. 当前线程继续执行右半部分（同步执行）
        Long rightResult = rightTask.compute();
        // 5. 等待左半部分结果（join）
        Long leftResult = leftTask.join();
        // 6. 合并结果
        return leftResult + rightResult;
    }

    private long computeDirectly() {
        long sum = 0;
        for (int i = start; i < end; i++) {
            sum += array[i];
        }
        return sum;
    }

    public static void main(String[] args) {
        // 创建测试数组：1 到 10000000
        int[] array = new int[10_000_000];
        for (int i = 0; i < array.length; i++) {
            array[i] = i + 1;
        }
        // 使用 ForkJoin 计算
        ForkJoinPool pool = new ForkJoinPool();
        ArraySumCalculator task = new ArraySumCalculator(array);
        long startTime = System.currentTimeMillis();
        Long result = pool.invoke(task);
        long endTime = System.currentTimeMillis();
        System.out.println("计算结果：" + result);
        System.out.println("耗时：" + (endTime - startTime) + "ms");
        // 验证结果（数学公式：n(n+1)/2）
        long expected = (long) array.length * (array.length + 1) / 2;
        System.out.println("结果正确：" + result.equals(expected));
        pool.shutdown();
    }
}

leftTask.fork(); 
rightTask.fork(); // 这样效率低下！
Long leftResult = leftTask.join();
Long rightResult = rightTask.join();

import java.util.concurrent.ForkJoinPool;
import java.util.concurrent.RecursiveTask;

public class FibonacciTask extends RecursiveTask<Integer> {
    private final int n;

    public FibonacciTask(int n) {
        this.n = n;
    }

    @Override
    protected Integer compute() {
        if (n <= 1) {
            return n;
        }
        // 创建子任务：f(n-1) 和 f(n-2)
        FibonacciTask f1 = new FibonacciTask(n - 1);
        FibonacciTask f2 = new FibonacciTask(n - 2);
        // 异步执行 f1
        f1.fork();
        // 同步执行 f2
        int result2 = f2.compute();
        // 获取 f1 的结果
        int result1 = f1.join();
        return result1 + result2;
    }

    public static void main(String[] args) {
        ForkJoinPool pool = new ForkJoinPool();
        int n = 10; // 计算第 10 个斐波那契数
        int result = pool.invoke(new FibonacciTask(n));
        System.out.println("Fibonacci(" + n + ") = " + result);
        // 输出 55
    }
}

import java.io.File;
import java.util.ArrayList;
import java.util.List;
import java.util.concurrent.ForkJoinPool;
import java.util.concurrent.RecursiveAction;

public class FileCounter extends RecursiveAction {
    private final File directory;
    private final String extension;
    private int count = 0; // 统计结果

    public FileCounter(File directory, String extension) {
        this.directory = directory;
        this.extension = extension;
    }

    public int getCount() {
        return count;
    }

    @Override
    protected void compute() {
        File[] files = directory.listFiles();
        if (files == null) return;
        List<FileCounter> subTasks = new ArrayList<>();
        for (File file : files) {
            if (file.isDirectory()) {
                // 创建子任务处理子目录
                FileCounter subTask = new FileCounter(file, extension);
                subTask.fork(); // 异步执行
                subTasks.add(subTask);
            } else if (file.getName().endsWith(extension)) {
                count++;
            }
        }
        // 等待所有子任务完成，并累加结果
        for (FileCounter subTask : subTasks) {
            subTask.join();
            count += subTask.getCount();
        }
    }

    public static void main(String[] args) {
        ForkJoinPool pool = new ForkJoinPool();
        FileCounter task = new FileCounter(new File("/path/to/your/project"), ".java");
        pool.invoke(task); // 同步等待
        System.out.println("找到 " + task.getCount() + " 个 .java 文件");
    }
}

场景类型	示例	说明
计算密集型任务	大数组数学运算、矩阵乘法	任务需要大量 CPU 计算，分解后可以并行加速
可递归分解的任务	归并排序、快速排序、文件遍历	天然的分治结构
任务之间相互独立	图像处理（每个像素独立）	无需同步，没有数据竞争
任务粒度适中	每个子任务计算量在数万到数百万次操作	太细则调度开销大，太粗则并行度不足

场景类型	原因
I/O 密集型任务	线程会在 I/O 操作时阻塞，浪费 CPU，且工作窃取无法发挥作用
需要频繁同步的任务	锁竞争会抵消并行带来的好处
任务粒度太细	创建任务、调度、合并的开销超过计算本身
无法分解的串行任务	分治思想的前提就是可以分解

// 错误的做法：fork 了子任务却没有 join
leftTask.fork(); 
rightTask.fork(); // 这里应该 join，但没有

// 正确用法
invokeAll(leftTask, rightTask); // 然后通过 leftTask.join() 获取结果

if (task.isCompletedAbnormally()) {
    Throwable ex = task.getException();
    ex.printStackTrace();
}

// 使用并行流计算数组和
long sum = Arrays.stream(array).parallel().sum();

框架	适用场景	优点	缺点
ForkJoin	可分解的计算密集型任务	高效利用 CPU，自动负载均衡	不适合 I/O 任务
ThreadPoolExecutor	通用任务处理	灵活，可定制	处理依赖任务复杂
CompletableFuture	异步任务编排	功能强大，支持链式调用	学习曲线较陡
Parallel Stream	集合数据处理	声明式，简洁	控制粒度较粗

Java ForkJoin 框架详解：分治法与并行编程

Java ForkJoin 框架详解：分治法与并行编程

引言

适用人群

学习目标

为什么需要 ForkJoin？

第一部分：核心思想——分治法 + 工作窃取

1.1 分治法：从大化小，逐个击破

1.2 工作窃取：自动负载均衡的灵魂

为什么需要工作窃取？

工作窃取的实现原理

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

第二部分：ForkJoin 框架核心组件

2.1 ForkJoinPool —— 任务调度器

创建 ForkJoinPool

核心方法

2.2 ForkJoinTask —— 任务的抽象

RecursiveTask —— 有返回值的任务

RecursiveAction —— 无返回值的任务

fork() 与 join() 的奥秘

2.3 ForkJoinWorkerThread —— 执行任务的工作线程

第三部分：实战案例——从入门到精通

3.1 案例一：数组求和（RecursiveTask 入门）

代码实现

代码详解

为什么不是先 fork 两个任务再 join？

3.2 案例二：斐波那契数列（递归任务）

3.3 案例三：遍历目录统计文件（RecursiveAction 实战）

第四部分：适用场景与注意事项

4.1 适用场景

4.2 不适用场景

4.3 如何选择合适的阈值？

4.4 常见陷阱与注意事项

陷阱 1：在任务中执行阻塞操作

陷阱 2：忘记合并结果

陷阱 3：任务拆分过深导致栈溢出

陷阱 4：错误使用 invokeAll

陷阱 5：忘记处理异常

陷阱 6：死锁风险

4.5 性能优化策略

第五部分：ForkJoin 与现代 Java 并发生态

5.1 Parallel Stream（并行流）

5.2 CompletableFuture

5.3 与其他并发框架的对比

第六部分：深入源码（选读）

6.1 ForkJoinPool 的核心数据结构

6.2 工作窃取的实现细节

6.3 提交任务的流程

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具