概述
在流计算实现单词统计的基础上,Flink 同样支持批计算功能。本文将演示如何通过批计算模式实现单词统计。
环境准备
Maven 依赖配置略过,核心逻辑如下。
源数据
输入文本数据示例:
text
aaa bbb ccc
bbb ddd ee
ccc fff fff gggg
hhh a h gg
Java 实现
package com.hy.flinktest;
import org.apache.commons.lang3.StringUtils;
import org.apache.flink.api.common.functions.FlatMapFunction;
import org.apache.flink.api.java.ExecutionEnvironment;
import org.apache.flink.api.java.operators.AggregateOperator;
import org.apache.flink.api.java.operators.DataSource;
import org.apache.flink.api.java.tuple.Tuple2;
import org.apache.flink.core.fs.FileSystem;
import org.apache.flink.util.Collector;
/**
* ClassName: BatchWordCountJava
* Description:
*/


