Flink 运行时架构与核心概念解析 | 极客日志

Javajava

Flink 运行时架构与核心概念解析

Flink 运行时架构包含 JobManager（负责调度与协调）、TaskManager（负责计算执行）及 ResourceManager（资源管理）。核心概念涉及并行度（控制任务并发数）、算子链（优化相邻算子间数据传输）及任务槽（Slot，资源分配单位）。作业提交流程涵盖逻辑流图至物理图的转换，支持 Standalone 及 YARN 模式。通过合理配置并行度与 Slot 共享策略，可提升集群资源利用率与任务执行效率。

t ag发布于 2026/3/22更新于 2026/7/518K 浏览

一、系统架构

1. 会话模式

文章配图

作业管理器（JobManager）

JobManager 是 Flink 集群中任务管理和调度的核心，是控制应用执行的主进程。每个应用由唯一的 JobManager 控制。

JobMaster

JobMaster 是 JobManager 中最核心的组件，负责处理单独的作业（Job）。JobMaster 和具体的 Job 是一一对应的。在早期版本中，JobManager 的概念范围较小，实际指的就是现在的 JobMaster。

作业提交时，JobMaster 接收应用，将 JobGraph 转换为物理层面的数据流图（执行图 ExecutionGraph），包含所有可并发执行的任务。JobMaster 向资源管理器请求必要资源，获取后分发到 TaskManager 执行。运行过程中，JobMaster 负责中央协调操作，如检查点（checkpoints）协调。

资源管理器（ResourceManager）

ResourceManager 主要负责资源的分配和管理，Flink 集群中只有一个。资源主要指 TaskManager 的任务槽（task slots）。任务槽是资源调配单元，包含 CPU 和内存资源。每个任务需分配到 slot 上执行。

注意区分 Flink 内置的 ResourceManager 和其他资源管理平台（如 YARN）的 ResourceManager。

分发器（Dispatcher）

Dispatcher 提供 REST 接口用于提交应用，并为新作业启动新的 JobMaster 组件。它也会启动 Web UI 展示监控信息。Dispatcher 并非必需，不同部署模式下可能被忽略。

任务管理器（TaskManager）

TaskManager 是 Flink 中的工作进程，负责具体计算。集群中至少有一个 TaskManager。每个 TaskManager 包含一定数量的任务槽（task slots）。Slot 是资源调度最小单位，限制了 TaskManager 能并行处理的任务数量。

启动后，TaskManager 向资源管理器注册 slots；收到指令后，将槽位提供给 JobMaster 调用以分配任务。执行过程中，TaskManager 可缓冲数据并与其他 TaskManager 交换数据。

二、核心概念

1. 并行度

1. 并行度概念

代码示例：

package com.dashu.day02;
import org.apache.flink.api.common.functions.FlatMapFunction;
import org.apache.flink.api.common.functions.MapFunction;
import org.apache.flink.api.java.tuple.Tuple;
import org.apache.flink.api.java.tuple.Tuple2;
import org.apache.flink.streaming.api.datastream.DataStreamSink;
import org.apache.flink.streaming.api.datastream.DataStreamSource;
import org.apache.flink.streaming.api.datastream.KeyedStream;
import org.apache.flink.streaming.api.datastream.SingleOutputStreamOperator;
import org.apache.flink.streaming.api.environment.StreamExecutionEnvironment;
 org.apache.flink.util.Collector;

   {
         Exception {
           StreamExecutionEnvironment.getExecutionEnvironment();
        DataStreamSource<String> socketDS = evn.socketTextStream(, );
        SingleOutputStreamOperator<String> flatMapDS = socketDS.flatMap( <String, String>() {
            
                Exception {
                String[] s1 = s.split();
                 (String string : s1) {
                    out.collect(string);
                }
            }
        });
        SingleOutputStreamOperator<Tuple2<String, Long>> mapDS = flatMapDS.map( <String, Tuple2<String, Long>>() {
            
             Tuple2<String, Long>   Exception {
                 Tuple2.of(s, );
            }
        });
        KeyedStream<Tuple2<String, Long>, Tuple> keyDS = mapDS.keyBy();
        SingleOutputStreamOperator<Tuple2<String, Long>> sumDS = keyDS.sum();
        sumDS.print();
        evn.execute();
    }
}

相关免费在线工具

Keycode 信息
查找任何按下的键的javascript键代码、代码、位置和修饰符。在线工具，Keycode 信息在线工具，online
Escape 与 Native 编解码
JavaScript 字符串转义/反转义；Java 风格 \uXXXX（Native2Ascii）编码与解码。在线工具，Escape 与 Native 编解码在线工具，online
JavaScript / HTML 格式化
使用 Prettier 在浏览器内格式化 JavaScript 或 HTML 片段。在线工具，JavaScript / HTML 格式化在线工具，online
JavaScript 压缩与混淆
Terser 压缩、变量名混淆，或 javascript-obfuscator 高强度混淆（体积会增大）。在线工具，JavaScript 压缩与混淆在线工具，online
Base64 字符串编码/解码
将字符串编码和解码为其 Base64 格式表示形式即可。在线工具，Base64 字符串编码/解码在线工具，online
Base64 文件转换器
将字符串、文件或图像转换为其 Base64 表示形式。在线工具，Base64 文件转换器在线工具，online

11> (tree,1) 3> (big,1)

package com.dashu.day02;
import org.apache.flink.api.common.functions.FlatMapFunction;
import org.apache.flink.api.common.functions.MapFunction;
import org.apache.flink.api.java.tuple.Tuple;
import org.apache.flink.api.java.tuple.Tuple2;
import org.apache.flink.configuration.Configuration;
import org.apache.flink.configuration.RestOptions;
import org.apache.flink.streaming.api.datastream.DataStreamSink;
import org.apache.flink.streaming.api.datastream.DataStreamSource;
import org.apache.flink.streaming.api.datastream.KeyedStream;
import org.apache.flink.streaming.api.datastream.SingleOutputStreamOperator;
import org.apache.flink.streaming.api.environment.StreamExecutionEnvironment;
import org.apache.flink.util.Collector;

public class Flink01_par {
    public static void main(String[] args) throws Exception {
        Configuration configuration = new Configuration();
        configuration.set(RestOptions.PORT, 8888);
        StreamExecutionEnvironment evn = StreamExecutionEnvironment.createLocalEnvironmentWithWebUI(configuration);
        evn.setParallelism(3);
        DataStreamSource<String> socketDS = evn.socketTextStream("192.168.67.137", 8888);
        SingleOutputStreamOperator<String> flatMapDS = socketDS.flatMap(new FlatMapFunction<String, String>() {
            @Override
            public void flatMap(String s, Collector<String> out) throws Exception {
                String[] s1 = s.split(" ");
                for (String string : s1) {
                    out.collect(string);
                }
            }
        });
        SingleOutputStreamOperator<Tuple2<String, Long>> mapDS = flatMapDS.map(new MapFunction<String, Tuple2<String, Long>>() {
            @Override
            public Tuple2<String, Long> map(String s) throws Exception {
                return Tuple2.of(s, 1L);
            }
        }).setParallelism(4);
        KeyedStream<Tuple2<String, Long>, Tuple> keyDS = mapDS.keyBy(0);
        SingleOutputStreamOperator<Tuple2<String, Long>> sumDS = keyDS.sum(1);
        sumDS.print();
        evn.execute();
    }
}

// 禁用算子链
.flatMap(word -> Tuple2.of(word, 1L)).disableChaining();

// 从当前算子开始新链
.flatMap(word -> Tuple2.of(word, 1L)).startNewChain();

// 全局禁用算子链
evn.disableOperatorChaining();

public class Flink02_operatorchain {
    public static void main(String[] args) throws Exception {
        Configuration configuration = new Configuration();
        configuration.set(RestOptions.PORT, 8888);
        StreamExecutionEnvironment evn = StreamExecutionEnvironment.createLocalEnvironmentWithWebUI(configuration);
        evn.setParallelism(3);
        DataStreamSource<String> socketDS = evn.socketTextStream("192.168.67.137", 8888);
        SingleOutputStreamOperator<String> flatMapDS = socketDS.flatMap(new FlatMapFunction<String, String>() {
            @Override
            public void flatMap(String s, Collector<String> out) throws Exception {
                String[] s1 = s.split(" ");
                for (String string : s1) {
                    out.collect(string);
                }
            }
        }).disableChaining();
        SingleOutputStreamOperator<Tuple2<String, Long>> mapDS = flatMapDS.map(new MapFunction<String, Tuple2<String, Long>>() {
            @Override
            public Tuple2<String, Long> map(String s) throws Exception {
                return Tuple2.of(s, 1L);
            }
        });
        KeyedStream<Tuple2<String, Long>, Tuple> keyDS = mapDS.keyBy(0);
        SingleOutputStreamOperator<Tuple2<String, Long>> sumDS = keyDS.sum(1);
        sumDS.print();
        evn.execute();
    }
}

.map(word -> Tuple2.of(word, 1L)).slotSharingGroup("1");

Flink 运行时架构与核心概念解析

一、系统架构

1. 会话模式

二、核心概念

1. 并行度

1. 并行度概念

更多推荐文章

相关免费在线工具

2. 并行度设置方式

2. 算子链

1. 算子链概念

2. 合并算子链

3. 算子链引用与禁用

3. 任务槽

4. 任务槽和并行度的关系

三、作业提交流程

1. Standalone 会话模式作业提交流程

2. 逻辑流图/作业图/执行图/物理流图

3. Yarn 应用模式作业提交流程

更多推荐文章

相关免费在线工具

Flink 运行时架构与核心概念解析

一、系统架构

1. 会话模式

二、核心概念

1. 并行度

1. 并行度概念

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

2. 并行度设置方式

2. 算子链

1. 算子链概念

2. 合并算子链

3. 算子链引用与禁用

3. 任务槽

4. 任务槽和并行度的关系

三、作业提交流程

1. Standalone 会话模式作业提交流程

2. 逻辑流图/作业图/执行图/物理流图

3. Yarn 应用模式作业提交流程

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具