【Java 开发日记】我们来说一说 JVM 的内存模型

【Java 开发日记】我们来说一说 JVM 的内存模型

目录

前言

JVM 内存结构(运行时数据区)

1. 程序计数器

2. Java 虚拟机栈

3. Java 堆

4. 方法区

5. 运行时常量池

直接内存

总结与对比


前言

JVM 内存结构(JVM Memory Structure) 和 Java 内存模型(Java Memory Model, JMM) 是两个不同的概念,但经常被混淆。

  1. JVM 内存结构:指的是 JVM 在运行时,其内部的数据存储区域是如何划分的(如堆、栈、方法区等)。这是我们接下来要讲解的重点。
  2. Java 内存模型:是一个概念和规范,它定义了多线程环境下,线程如何通过内存进行交互,以及线程如何看到共享变量的值。它解决的是并发编程中的可见性、原子性、有序性问题。

JVM 内存结构(运行时数据区)

JVM 在执行 Java 程序的过程中会把它所管理的内存划分为若干个不同的数据区域。这些区域各有用途,创建和销毁的时间也不同。根据《Java虚拟机规范》,JVM 内存结构(运行时数据区)如下图所示:

下面我们逐一详细讲解每个部分。

1. 程序计数器
  • 定义:一块较小的内存空间,可以看作是当前线程所执行的字节码的行号指示器
  • 作用
    • 字节码解释器通过改变程序计数器来依次读取指令,从而实现代码的流程控制(如顺序执行、循环、跳转、异常处理等)。
    • 在多线程环境下,当一个线程的时间片用完,CPU 会切换到另一个线程。为了之后能切回来并正确恢复到上次执行的位置,每个线程都需要一个独立的程序计数器。
  • 特点
    • 线程私有:每个线程都有自己的程序计数器。
    • 此区域是 唯一一个 在《Java虚拟机规范》中没有规定任何 OutOfMemoryError 情况的区域。
2. Java 虚拟机栈
  • 定义:描述的是 Java 方法执行的内存模型。每个方法在执行的同时都会创建一个栈帧
  • 作用:用于存储局部变量表、操作数栈、动态链接、方法出口等信息。
  • 栈帧:每个方法从调用到执行完成的过程,就对应着一个栈帧在虚拟机栈中从入栈到出栈的过程。
    • 局部变量表:存放了编译期可知的各种基本数据类型(booleanbytecharshortintfloatlongdouble)、对象引用(reference 类型,它不等同于对象本身,可能是一个指向对象起始地址的引用指针,也可能是指向一个代表对象的句柄或其他与此对象相关的位置)和 returnAddress 类型(指向了一条字节码指令的地址)。
    • 操作数栈:方法执行过程中,用于计算的工作区(类似于CPU的寄存器)。
    • 动态链接:指向运行时常量池中该栈帧所属方法的引用。
    • 方法出口:记录方法返回时,需要返回到哪个位置继续执行。
  • 特点
    • 线程私有,生命周期与线程相同。
    • 会抛出两种错误:
      • StackOverflowError:如果线程请求的栈深度大于虚拟机所允许的深度(例如无限递归)。
      • OutOfMemoryError:如果虚拟机栈可以动态扩展,但在扩展时无法申请到足够的内存。
补充:本地方法栈
它与 Java 虚拟机栈的作用非常相似。区别在于:Java 虚拟机栈为虚拟机执行 Java 方法(也就是字节码)服务,而本地方法栈则为虚拟机使用到的 Native 方法服务。 在 HotSpot 虚拟机中,本地方法栈和 Java 虚拟机栈合二为一。
3. Java 堆
  • 定义:这是 JVM 所管理的内存中最大的一块,是被所有线程共享的一块内存区域,在虚拟机启动时创建。
  • 作用此内存区域的唯一目的就是存放对象实例。 几乎所有的对象实例以及数组都在这里分配内存。
  • 特点
    • 线程共享,因此是垃圾收集器管理的主要区域,因此很多时候也被称作 “GC堆”
    • 从内存回收的角度看,由于现代垃圾收集器大部分都基于分代收集理论,所以 Java 堆中经常被细分为:
      • 新生代:新创建的对象首先在这里分配。它又分为:
        • Eden 区
        • Survivor 0 区(From Survivor)
        • Survivor 1 区(To Survivor)
      • 老年代:在新生代中经历多次垃圾回收后仍然存活的对象,会被移动到老年代。
      • 永久代/元空间:注意,这是方法区的实现,逻辑上属于堆的一部分,但物理上可以不连续。
    • 会抛出 OutOfMemoryError:如果在堆中没有内存完成实例分配,并且堆也无法再扩展时。
4. 方法区
  • 定义:用于存储已被虚拟机加载的类型信息、常量、静态变量、即时编译器编译后的代码缓存等数据。
  • 作用:可以看作是“类”的仓库。
  • 特点
    • 线程共享
    • 它有一个非常别名的名字——“非堆”,目的是与 Java 堆区分开来。
    • 会抛出 OutOfMemoryError:当方法区无法满足内存分配需求时。

重要演进:方法区的实现

  • 永久代:在 JDK 7 及之前,HotSpot 虚拟机使用 永久代 来实现方法区。这个区域在逻辑上属于堆的一部分,但有其特殊的垃圾回收机制。
  • 元空间:从 JDK 8 开始,HotSpot 虚拟机彻底移除了永久代,改用 元空间 来实现方法区。元空间不再使用 JVM 内存,而是使用本地内存。这带来的好处是:
    • 避免了永久代的内存溢出问题。
    • 类元信息的生命周期与类加载器一致,简化了垃圾回收。
    • 可以动态调整大小,减少了调优的复杂性。
5. 运行时常量池
  • 定义:它是方法区的一部分,用于存放编译期生成的各种字面量符号引用
  • 内容
    • 字面量:如文本字符串、被声明为 final 的常量值等。
    • 符号引用:类和接口的全限定名、字段的名称和描述符、方法的名称和描述符。
  • 特点
    • 具备动态性,并非只有编译期才能产生常量,运行期间也可以将新的常量放入池中,例如 String 类的 intern() 方法。

直接内存

虽然不是 JVM 运行时数据区的一部分,也不是《Java虚拟机规范》中定义的内存区域,但它经常被使用,并且也可能导致 OutOfMemoryError

  • 定义:直接内存并不是虚拟机运行时数据区的一部分,也不是《Java虚拟机规范》中定义的内存区域。它是由 java.nio 包引入的,通过 Native 函数库直接分配的堆外内存。
  • 作用:在 NIO 中,引入了 Channel 与 Buffer 的 I/O 方式,它可以使用 Native 函数库直接分配堆外内存,然后通过一个存储在 Java 堆中的 DirectByteBuffer 对象作为这块内存的引用进行操作。这样能在一些场景中显著提高性能,因为它避免了在 Java 堆和 Native 堆中来回复制数据。
  • 特点
    • 其大小不受 Java 堆大小的限制,但会受到本机总内存大小及处理器寻址空间的限制。
    • 同样会抛出 OutOfMemoryError

总结与对比

内存区域线程共享?存储内容是否可能 OOM / SOF
程序计数器私有当前线程执行的字节码行号不会
Java 虚拟机栈私有栈帧(局部变量表、操作数栈等)SOF 和 OOM
本地方法栈私有Native 方法服务SOF 和 OOM
Java 堆共享对象实例、数组OOM
方法区共享类信息、常量、静态变量、JIT代码OOM
运行时常量池共享字面量、符号引用(是方法区的一部分)OOM
直接内存N/ANIO 使用的堆外缓冲区OOM

理解 JVM 内存模型是理解 Java 程序运行机制、进行性能调优(尤其是 GC 调优)和故障诊断(如内存溢出)的基础。

如果小假的内容对你有帮助,请点赞评论收藏。创作不易,大家的支持就是我坚持下去的动力!

Read more

C++ STL set 系列完全指南:从底层原理、核心接口到实战场景

C++ STL set 系列完全指南:从底层原理、核心接口到实战场景

🔥草莓熊Lotso:个人主页 ❄️个人专栏: 《C++知识分享》《Linux 入门到实践:零基础也能懂》 ✨生活是默默的坚持,毅力是永久的享受! 🎬 博主简介: 文章目录 * 前言: * 一. 容器分类:序列式容器与关联式容器的本质区别 * 二. set 系列核心原理:红黑树赋能的高效特性 * 三. set 核心接口实战:基于实操代码详解 * 3.1 初始化与插入:去重 + 自动排序 * 3.2 查找与删除:精准操作单个元素 * 3.3 区间操作:lower_bound 与 upper_bound * 四. multiset:支持重复 key 的关联式容器 * 五. set 系列的实战价值:解决实际开发问题

By Ne0inhk
如何解决IDEA/Datagrip无法连接数据库的问题:解决方法为添加参数-Djava.net.preferIPv4Stack=true

如何解决IDEA/Datagrip无法连接数据库的问题:解决方法为添加参数-Djava.net.preferIPv4Stack=true

如何解决IDEA/Datagrip无法连接数据库的问题:解决方法为添加参数-Djava.net.preferIPv4Stack=true 引言 在开发过程中,我们常常使用集成开发环境(IDE)如 IntelliJ IDEA 或 JetBrains DataGrip 来与数据库进行交互。然而,有时可能会遇到无法连接数据库的情况,尤其是当使用新版的 IDEA 或 DataGrip 时。这种问题通常是由于网络配置或者 IDE 与数据库之间的兼容性问题引起的。 一种常见的解决办法是添加 JVM 参数 -Djava.net.preferIPv4Stack=true,以优先使用 IPv4 协议栈。这种方式能够有效解决因 IPv6 配置问题导致的数据库连接失败问题。本文将详细介绍如何通过修改 IDEA 或 DataGrip 的启动参数来解决这个问题。 文章目录 * 如何解决IDEA/Datagrip无法连接数据库的问题:解决方法为添加参数-Djava.net.

By Ne0inhk
Java 大视界 -- Java+Flink CDC 构建实时数据同步系统:从 MySQL 到 Hive 全增量同步(443)

Java 大视界 -- Java+Flink CDC 构建实时数据同步系统:从 MySQL 到 Hive 全增量同步(443)

Java 大视界 -- Java+Flink CDC 构建实时数据同步系统:从 MySQL 到 Hive 全增量同步(443) * 引言: * 正文: * 一、 核心认知:Flink CDC 与全增量同步逻辑 * 1.1 Flink CDC 核心原理 * 1.1.1 与传统数据同步方案的对比(实战选型参考) * 1.2 全增量同步核心逻辑(MySQL→Hive) * 1.2.1 关键技术点(实战必关注,每个点都踩过坑) * 二、 环境准备:生产级环境配置(可直接复用) * 2.1 核心依赖配置(pom.xml)

By Ne0inhk