Flink History Server 查看已完成作业 Web UI 与 REST 数据

1. History Server 能解决什么问题

典型痛点

集群关闭后，Web UI 上的作业页面消失，无法回看 DAG、算子指标、异常栈、配置
需要统一的'历史作业'入口做复盘对比（上线前后、参数变更前后）
需要对接外部系统（监控、运维平台、审计平台）通过 API 拉取作业归档数据

History Server 提供能力

展示 JobManager 归档下来的已完成作业状态与统计信息
提供 REST API（返回 JSON）便于系统集成
支持跳转到你们已有的日志平台（Log Integration）

2. 工作机制：JM 负责'归档'，History Server 负责'展示'

整体链路很清晰：

JobManager 在作业结束时，把'作业归档信息'写到一个文件系统目录
History Server 定期轮询这个目录，发现新归档就下载到本地缓存
History Server 对外提供 Web UI 与 REST API 查询这些已归档作业

这里的关键点是：归档目录是'文件系统目录'，可以是 HDFS，也可以是对象存储（前提是你已安装对应的 Flink filesystem 插件，比如 S3/OSS/GCS/Azure 等）。

3. 启停方式与默认端口

History Server 是独立进程（目前只能 standalone 方式运行），用脚本管理：

# Start or stop the HistoryServer bin/historyserver.sh (start|start-foreground|stop)

默认绑定 localhost，端口 8082。

4. 核心配置：两端都要配

4.1 JobManager 侧：把归档写到哪里

在 Flink 配置文件里指定归档目录：

# Directory to upload completed job information
jobmanager.archive.fs.dir: hdfs:///completed-jobs

这一步只发生在 JobManager：作业结束后把归档信息上传到该目录。

4.2 History Server 侧：监控哪些目录、多久刷新一次、缓存放哪

# Monitor the following directories for completed jobs
historyserver.archive.fs.dir: hdfs:///completed-jobs
# Refresh every 10 seconds
historyserver.archive.fs.refresh-interval: 10000
# Local cache directory for downloaded archives
historyserver.web.tmpdir: /path/to/local/tmpdir

要点

historyserver.archive.fs.dir 支持逗号分隔多个目录：适合多集群、多环境汇总
refresh-interval 太小会增加 FS 压力，太大则'历史作业出现得慢'，一般 10s~60s 根据规模调整
web.tmpdir 是本地缓存目录，注意磁盘空间与清理策略（归档多时容易膨胀）

5. 日志集成：把'历史作业页'连到你们的日志平台

Flink 不负责归档日志，但 History Server 可以把日志 URL 模板拼出来，点击就跳到你们已有的日志系统：

# HistoryServer will replace <jobid> with the relevant job id
historyserver.log.jobmanager.url-pattern: http://my.log-browsing.url/<jobid>
# HistoryServer will replace <jobid> and <tmid> with the relevant job id and taskmanager id
historyserver.log.taskmanager.url-pattern: http://my.log-browsing.url/<jobid>/<tmid>

Flink History Server 查看已完成作业 Web UI 与 REST 数据

1. History Server 能解决什么问题

2. 工作机制：JM 负责'归档'，History Server 负责'展示'

3. 启停方式与默认端口

4. 核心配置：两端都要配

4.1 JobManager 侧：把归档写到哪里

4.2 History Server 侧：监控哪些目录、多久刷新一次、缓存放哪

5. 日志集成：把'历史作业页'连到你们的日志平台

更多推荐文章

相关免费在线工具

6. REST API：用 JSON 把历史作业数据接入平台

7. 生产最佳实践与常见坑

更多推荐文章

相关免费在线工具

Flink History Server 查看已完成作业 Web UI 与 REST 数据

1. History Server 能解决什么问题

2. 工作机制：JM 负责'归档'，History Server 负责'展示'

3. 启停方式与默认端口

4. 核心配置：两端都要配

4.1 JobManager 侧：把归档写到哪里

4.2 History Server 侧：监控哪些目录、多久刷新一次、缓存放哪

5. 日志集成：把'历史作业页'连到你们的日志平台

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

6. REST API：用 JSON 把历史作业数据接入平台

7. 生产最佳实践与常见坑

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具