JDK 21 G1 vs ZGC 垃圾收集器对比分析

Ne0inhk

23 Mar 2026 — 6 min read

引言

在 JDK 21 中，Java 虚拟机 (JVM) 提供了多种垃圾收集器 (GC) 选项，其中 G1 (Garbage-First) 和 ZGC (Z Garbage Collector) 是两种备受关注的低延迟垃圾收集器。本文将深入对比这两种垃圾收集器，从原理、性能特性、适用场景、配置参数以及实际应用等方面进行详细分析，帮助开发者根据应用需求选择合适的垃圾收集器。

G1 垃圾收集器概述

基本原理

G1 是 Oracle JDK 中的一种分代垃圾收集器，自 JDK 7u4 引入，JDK 9 起成为默认 GC。它将堆内存划分为多个大小相等的 Region (区域)，每个 Region 可以是 Eden、Survivor、Old 或 Humongous 类型。G1 使用 Remembered Set 避免全堆扫描，并通过 Pause Prediction Model 预测停顿时间。

主要特性

可预测的停顿时间: 目标停顿时间通常在 200ms 以内
高吞吐量: 在保持低延迟的同时提供良好的吞吐量
分代收集: 区分年轻代和老年代，优化不同生命周期对象的收集
并发标记: 部分收集过程与应用线程并发执行

JDK 21 中的改进

JDK 21 引入了 Generational G1 (代际 G1)，通过 -XX:+UseGenerationalG1 启用，进一步优化代际内存布局和收集效率。

ZGC 垃圾收集器概述

基本原理

ZGC 是 Oracle JDK 11 引入的一种可扩展、低延迟的垃圾收集器，专为大堆内存设计。它使用 Colored Pointers (着色指针) 技术，将对象引用分为三类：强引用、弱引用和最终引用。ZGC 采用并发收集策略，将垃圾收集工作分散到多个阶段，大大减少停顿时间。

主要特性

极低延迟: 停顿时间通常小于 10ms
可扩展性: 支持 TB 级堆内存
并发收集: 几乎所有收集工作都与应用线程并发执行
NUMA 友好: 优化多处理器系统上的内存访问

JDK 21 中的改进

JDK 21 对 ZGC 进行了多项优化，包括更好的并发处理、更高效的内存分配以及改进的 NUMA 支持。

性能对比

停顿时间

G1: 提供可预测的停顿时间，默认目标 200ms，可通过参数调整到更低。但在高负载下可能出现较长的停顿。
ZGC: 停顿时间极短，通常在 1-10ms 范围内，几乎不受堆大小影响。

吞吐量

G1: 吞吐量较高，在大多数场景下可达到 90% 以上。
ZGC: 吞吐量稍低，通常在 80-95% 之间，但随着 JDK 版本改进而提升。

CPU 使用率

G1: CPU 使用率适中，年轻代收集较为高效。
ZGC: CPU 使用率较高，因为并发收集需要更多计算资源。

内存开销

G1: Remembered Set 和其他数据结构会带来额外内存开销，通常在 5-10%。
ZGC: 使用 Colored Pointers，需要额外的内存位来存储对象状态，开销相对较低。

适用场景

G1 适用场景

堆内存 4GB 到 64GB 的应用
对停顿时间有一定要求但不极致苛刻的应用
需要平衡吞吐量和延迟的服务器应用
大多数传统企业级 Java 应用

ZGC 适用场景

堆内存超过 64GB 的超大内存应用
对停顿时间极为敏感的应用，如实时系统、金融交易系统
云原生应用和微服务
需要高可扩展性的分布式系统

配置参数对比

G1 配置参数

-XX:+UseG1GC # 启用 G1 -XX:MaxGCPauseMillis=200 # 最大停顿时间目标 -XX:G1HeapRegionSize=16m # Region 大小 -XX:G1NewSizePercent=5 # 年轻代最小百分比 -XX:G1MaxNewSizePercent=60 # 年轻代最大百分比

ZGC 配置参数

-XX:+UseZGC # 启用 ZGC -XX:ZAllocationSpikeTolerance=2 # 分配峰值容忍度 -XX:ZCollectionInterval=5 # 收集间隔 (秒) -XX:ZFragmentationLimit=25 # 碎片限制百分比 -XX:ZMarkStackSpaceLimit=8g # 标记栈空间限制

监控和调优

G1 监控

使用 jstat -gc 查看 GC 统计，关注年轻代/老年代收集频率和停顿时间。启用 GC 日志：-Xlog:gc*。

ZGC 监控

ZGC 提供详细的日志输出，关注 "Pause" 事件和 "Concurrent" 阶段。使用 jcmd <pid> VM.info 查看 ZGC 状态。

调优建议

G1: 调整 Region 大小和停顿目标，根据应用特点优化年轻代比例。
ZGC: 主要关注堆大小设置，必要时调整并发线程数 -XX:ConcGCThreads。

实际性能测试结果

基于典型基准测试 (如 SPECjbb2015) 的对比：

G1: 在 16GB 堆上，平均停顿时间 150ms，吞吐量 92%
ZGC: 在 64GB 堆上，平均停顿时间 5ms，吞吐量 88%

实际结果因应用特性而异，建议在目标环境中进行测试。

优缺点总结

G1 优缺点

优点:

成熟稳定，广泛使用
良好的吞吐量和可预测性
适合大多数应用场景

缺点:

停顿时间不如 ZGC 短
大堆内存下性能可能下降

ZGC 优缺点

优点:

极短停顿时间
优秀的可扩展性
简化了 GC 调优

缺点:

吞吐量稍低
CPU 使用率较高
相对较新，可能存在未知问题

选择建议

选择 G1: 如果应用堆内存适中，对停顿时间要求不高，追求稳定性和吞吐量。
选择 ZGC: 如果应用堆内存巨大，对停顿时间极为敏感，或运行在云环境中。
迁移建议: 从 G1 迁移到 ZGC 时，先在测试环境中验证，确保应用兼容性。

结论

G1 和 ZGC 都是优秀的垃圾收集器，各有优势。G1 提供了更好的平衡性，适合大多数传统应用；而 ZGC 则在极低延迟和大堆内存场景中表现出色。随着 JDK 21 的发布，这两种收集器都得到了进一步优化，为 Java 开发者提供了更多选择。

在选择时，应根据具体应用需求、硬件环境和性能目标进行评估。建议通过性能测试来确定最适合的垃圾收集器，并定期监控和调优以获得最佳性能。

参考资料

Oracle JDK 21 官方文档
OpenJDK G1 和 ZGC 源码
JVM 垃圾收集器性能对比研究
Java 内存管理最佳实践指南

从零到一：Ubuntu20.04下C++与LibTorch的深度学习部署实战

从零到一：Ubuntu20.04下C++与LibTorch的深度学习部署实战深度学习模型部署是AI工程化的重要环节，而C++凭借其高性能和跨平台特性成为生产环境的首选语言。本文将手把手带你在Ubuntu 20.04系统上搭建完整的LibTorch开发环境，从环境配置到模型部署，避开常见陷阱，实现从Python训练到C++推理的完整链路。 1. 环境准备与基础配置在开始之前，我们需要确保系统具备必要的开发工具链。打开终端执行以下命令安装基础依赖： sudo apt update sudo apt install -y build-essential cmake git libopencv-dev CUDA工具链是GPU加速的关键组件。建议使用CUDA 11.x系列以获得最佳兼容性： # 检查NVIDIA驱动状态 nvidia-smi # 验证CUDA编译器 nvcc --version 若未安装CUDA，可参考NVIDIA官方文档进行安装。完成后，设置环境变量： echo 'export PATH=/usr/local/cuda/

ONNX Runtime C++ 库

ONNX Runtime 为 C++ 提供了完整的推理 API，你可以通过集成它来在 C++ 项目中高效地运行 ONNX 模型。一、如何获取 ONNX Runtime C++ 库在你的 C++ 项目中使用 ONNX Runtime，主要有两种方式： * 使用预编译库（推荐）：这是最简单的入门方式。你可以从 ONNX Runtime 官方网站的 Releases 页面下载适用于你平台（如 Windows、Linux、macOS）的 C/C++ 预编译库。这些库通常包含了核心的推理功能。 * 从源码编译：如果你有特殊需求，比如需要支持特定的硬件（如 GPU、OpenVINO、NNAPI），或希望定制库的大小（例如为移动端进行精简）

PLI接口与VCS调试生态：连接Verilog与C/C++的魔法桥梁

PLI接口与VCS调试生态：连接Verilog与C/C++的魔法桥梁在芯片验证的世界里，效率就是生命线。当传统的Verilog验证遇到性能瓶颈时，PLI（Programming Language Interface）技术就像一把瑞士军刀，为验证工程师打开了通往高性能验证的新天地。想象一下，你正在验证一个AI加速器设计，需要在仿真中实时处理数百万个神经元的数据交互——纯Verilog可能让你陷入性能泥潭，而PLI与VCS的结合却能让你游刃有余。 1. PLI技术核心：跨越语言边界的桥梁 PLI的本质是让Verilog具备调用外部C/C++函数的能力，就像在Python中调用NumPy一样自然。这种能力不是简单的接口对接，而是深度的语言级融合。通过三个关键机制实现： * TF（Task/Function）例程：处理$display等系统任务 * ACC（Access）例程：直接访问Verilog内部数据结构 * VPI（Verilog Procedural Interface）：新一代更强大的接口标准实际开发中，一个典型的PLI函数生命周期是这样的： #includ

【C++】—— 多态（下）

【C++】—— 多态（下） * 4 多态的原理 * 4.1 虚函数表指针 * 4.2 多态的原理 * 4.3 动态绑定和静态绑定 * 4.4 虚函数表 4 多态的原理 4.1 虚函数表指针我们以一道题来引入多态的原理下面编译为 32 位程序的运行结果是什么（） A、编译报错 B、运行报错 C、8 D、12 classBase{public:virtualvoidFunc1(){ cout <<"Func1()"<< endl;}protected:int _b =1;

引言

G1 垃圾收集器概述

基本原理

主要特性

JDK 21 中的改进

ZGC 垃圾收集器概述

基本原理

主要特性

JDK 21 中的改进

性能对比

停顿时间

吞吐量

CPU 使用率

内存开销

适用场景

G1 适用场景

ZGC 适用场景

配置参数对比

G1 配置参数

ZGC 配置参数

监控和调优

G1 监控

ZGC 监控

调优建议

实际性能测试结果

优缺点总结

G1 优缺点

ZGC 优缺点

选择建议

结论

参考资料

Read more

从零到一：Ubuntu20.04下C++与LibTorch的深度学习部署实战

ONNX Runtime C++ 库

PLI接口与VCS调试生态：连接Verilog与C/C++的魔法桥梁

【C++】—— 多态（下）