Java 面试必问:JVM 运行时数据区域详解(附内存结构图)

Java 面试必问:JVM 运行时数据区域详解(附内存结构图)

文章目录

在 Java 面试中,JVM 内存结构几乎是必问知识点。很多人可以背出程序计数器、虚拟机栈、本地方法栈、堆和方法区这五个区域,但当面试官继续追问它们的作用、线程共享关系以及对象为什么在堆上时,往往就难以解释清楚。本文主要面对面试八股文速成选手,将从 JVM 的整体内存布局出发,带你系统梳理五大运行时数据区域的作用与常见面试考点。

JVM 运⾏时数据区域也叫内存布局,但需要注意的是它和 Java 内存模型((Java Memory Model,简称 JMM)完全不同,属于完全不同的两个概念,它由以下 5 ⼤部分组成:

在这里插入图片描述

1. 程序计数器(线程私有)

程序计数器的作⽤:⽤来记录当前线程执⾏的⾏号的。 程序计数器是⼀块⽐较⼩的内存空间,可以看做是当前线程所执⾏的字节码的⾏号指⽰器。如果当前线程正在执⾏的是⼀个 Java ⽅法,这个计数器记录的是正在执⾏的虚拟机字节码指令的地址;如果正在执⾏的是⼀个 Native ⽅法,这个计数器值为 undefined。程序计数器内存区域是唯⼀⼀个在 JVM 规范中没有规定任何 OOM 情况的区域!

在 JVM 中,多线程是通过线程轮流切换来获得 CPU 执行时间的,因此,在任一具体时刻,一个 CPU 的内核只会执行一条线程中的指令,因此,为了线程切换后能恢复到正确的执行位置,每个线程都需要有一个独立的程序计数器,并且不能互相干扰,否则就会影响到程序的正常执行次序。也就是说,我们要求程序计数器是线程私有的。

接下来我们一个通过一段非常简单的小代码以及字节码指令来看看程序计数器的作用。

publicclassPcDemo{publicstaticintadd(int a,int b){return a + b;}}

字节码指令大致如下:

0: iload_0 // 从局部变量表中加载变量 a 到操作数栈1: iload_1 // 从局部变量表中加载变量 b 到操作数栈2: iadd // 两数相加3: ireturn // 返回
  1. 初始状态:当方法开始执行时,PC 计数器设置为 0,指向第一条指令 0: iload_0。
  2. 执行第一条指令:执行 iload_0 指令,将局部变量表中索引为 0 的整数(即方法的第一个参数 a)加载到操作数栈顶。执行完成后,PC 计数器更新为 1,指向下一条指令 1: iload_1。
  3. 执行第二条指令:执行 iload_1 指令,将局部变量表中索引为 1 的整数(即方法的第二个参数 b)加载到操作数栈顶。执行完成后,PC 计数器更新为 2,指向下一条指令 2: iadd。
  4. 执行第三条指令:执行 iadd 指令,弹出操作数栈顶的两个整数(即 a 和 b),将它们相加,然后将结果压入操作数栈顶。执行完成后,PC 计数器更新为 3,指向下一条指令 3: ireturn。
  5. 执行最后一条指令:执行 ireturn 指令,弹出操作数栈顶的整数(即 a + b 的结果),并将这个值作为方法的返回值。方法执行完成,控制权返回到方法调用者。

如果 JVM 线程发生切换:

线程APC=2// 线程A下一条指令应该执行 iadd 线程BPC=4// 线程B下一条指令应该执行 ireturn

2. Java 虚拟机栈(线程私有)

Java 虚拟机栈(JVM Stack) 是线程私有的运行时数据区,它的生命周期与线程相同。虚拟机栈用于描述 Java 方法执行时的内存模型:当一个方法被调用时,JVM 会为该方法创建一个 栈帧(Stack Frame) 并压入虚拟机栈中。栈帧中主要包含 局部变量表、操作数栈、动态链接和方法返回地址等信息。当方法执行结束时,对应的栈帧会被弹出。通常我们所说的 “栈内存”,指的就是 Java 虚拟机栈。

在这里插入图片描述
  1. 局部变量表(Local Variable Table):用于存储方法执行过程中使用的方法参数和方法内部定义的局部变量(包括基本数据类型变量和对象引用)。其中对象引用存储的是对象在堆中的引用地址而不是对象本身。局部变量表的大小在编译期就已确定,在方法执行期间不会改变,并以 slot(槽位) 的形式按顺序存放在栈帧中。
  2. 操作数栈:操作数栈是 JVM 在执行字节码指令时,用于临时存放参与运算的数据和保存计算结果的栈结构。字节码指令会通过入栈(push)和出栈(pop)的方式在操作数栈上完成计算,可以理解为 JVM 执行计算时临时使用的“工作台”。
  3. 动态链接:指在方法执行过程中,把常量池中的符号引用解析为实际方法或字段引用的过程。(例如我们想给张三打电话,需要先在通讯录中通过“张三”这个名字查找他的真实电话号码,然后再拨打电话。其中,“张三”这个名字相当于符号引用,张三的电话号码相当于真实引用,而通过名字查找电话号码的过程就类似于动态链接。)
  4. 方法返回地址:指当前方法执行结束后,程序需要返回到调用者方法继续执行的位置。(换个更直白的说法:方法返回地址就是“这个方法执行完之后,下一条要执行的字节码在哪里”)

3. 本地方法栈(线程私有)

本地方法栈(Native Method Stack)与 Java 虚拟机栈类似,只不过 Java 虚拟机栈为虚拟机执行 Java 方法服务,而本地方法栈则为虚拟机使用到的 Native 方法服务。故在此不再赘述。

4. 堆(线程共享)

堆(Heap)是 JVM 中用于存放对象实例和数组(数组也是一种对象)的运行时内存区域,并且是所有线程共享的。在 Java Virtual Machine 中,当代码创建对象时,本质上就是在堆里申请一块内存。如下所示:

User user =newUser(); 线程栈 堆 ------------------ user (引用地址)------->User对象实例 栈里只保存 引用(reference),真正的数据在堆里。这也是为什么 Java 对象通常说是 “在堆上分配”。 

堆为什么必须共享?设想这样一个程序:

User user =newUser();ThreadA 修改 user.name ThreadB 读取 user.name 如果堆不是共享的,每个线程都有自己的对象副本,那数据就会完全不同步。 所以 JVM 的设计非常明确:对象数据在堆里共享,执行过程在栈里隔离。 

我们常⻅的 JVM 参数设置 -Xms10m 最⼩启动内存是针对堆的,-Xmx10m 最⼤运⾏内存也是针对堆的。

堆除了是对象的聚集地,也是 Java 垃圾收集器管理的主要区域,因此也被称作 GC 堆(Garbage Collected Heap)。从垃圾回收的角度来看,由于垃圾收集器基本都采用了分代垃圾收集的算法,所以堆还可以细分为:新生代和老年代。新生代还可以细分为:Eden 空间、From Survivor、To Survivor 空间等。进一步划分的目的是更好地回收内存,或者更快地分配内存。

堆这最容易出现的就是 OutOfMemoryError 错误,分为以下几种表现形式:

  • OutOfMemoryError: GC Overhead Limit Exceeded:当 JVM 花太多时间执行垃圾回收并且只能回收很少的堆空间时,就会发生该错误。
  • java.lang.OutOfMemoryError: Java heap space:假如在创建新的对象时,堆内存中的空间不足以存放新创建的对象, 就会引发该错误。和本机的物理内存无关,和我们配置的虚拟机内存大小有关!

5. 方法区(线程共享)

方法区是 Java 虚拟机规范上的一个逻辑区域,在不同的 JDK 版本上有着不同的实现。在 JDK 7 的时候,方法区被称为永久代(PermGen),而在 JDK 8 的时候,永久代被彻底移除,取而代之的是元空间。

方法区 ≠ 元空间 方法区 是规范里的概念 元空间 是一种实现方式 

方法区主要存什么?

  1. 类的结构信息
当 JVM 加载一个类,比如: classUser{privateString name;publicvoidrun(){}}JVM 会把这些信息解析后存到方法区:类名 父类信息 实现的接口 字段信息 方法信息 访问修饰符 例如: Class:UserFields: name Methods:run()Superclass:Object 这些都是类的元数据(metadata)。 
  1. 运行时常量池
每个 class 文件都有一个 常量池(ConstantPool),里面存着: 字符串常量 类名 方法名 字段名 符号引用 例如代码:String s ="hello"; 这里 "hello" 就会进入运行时常量池(现代 JVM 中字符串对象在堆,但常量池引用在方法区)。 
  1. 静态变量(static 变量)
例如: classUser{staticint count =0;} count 是类级别变量,不是对象变量。所以它不会放在堆里的对象中,而是放在方法区中。 
  1. JIT 编译后的代码

JVM 有 即时编译器(JIT)。热点方法会被编译成本地机器码,提高执行效率。这些编译后的机器码 也会存储在方法区相关区域。

读到这里,相信大家对 JVM 运行时数据区域的结构与作用 已经有了更加系统的理解。如果文中有不清晰或想进一步探讨的地方,欢迎在评论区交流,也可以私信博主一起讨论。

Read more

【Java 开发日记】有了解过 SpringBoot 的参数配置吗?

【Java 开发日记】有了解过 SpringBoot 的参数配置吗?

目录 核心概念:application.properties 与 application.yml 配置的加载位置与优先级 外部化配置(非常强大) 如何在代码中获取配置值? 常用配置示例 总结 当然了解,Spring Boot 的参数配置是其核心特性之一,也是它实现“约定大于配置”理念的关键。它极大地简化了传统 Spring 应用中繁琐的 XML 配置。 一、核心概念:application.properties 与 application.yml Spring Boot 默认使用这两种文件进行配置(二者选其一即可,.yml 更常用)。 application.properties (传统键值对格式) server.port=8081 spring.datasource.url=jdbc:mysql://localhost:

By Ne0inhk
亲测可用的JAVA大型ERP进销存财务一体化源码分享

亲测可用的JAVA大型ERP进销存财务一体化源码分享

JAVA大型ERP源码 进销存财务一体化源码 本源码亲测可用!若有问题不能成功搭建包退! 您自己搭建的过程中遇见技术问题可以免费咨询。 已经修补好了几个出现的代码bug。 1.开发环境:Eclipse4.4(javaee版)+jdk8+tomcat8+postgreSQL9.2 2.导入database目录下的数据到postgresql中。 3.导入MyERP到eclipse中 4.启动tomcat,直接访问http://localhost:8080/,切记不要包含项目路径 最近在研究ERP相关项目,发现了一套超棒的JAVA大型ERP源码,实现了进销存财务一体化,今天就来给大家分享分享。 一、源码亮点 这套源码亲测可用,而且作者很良心地承诺,如果有问题不能成功搭建包退。同时,在搭建过程中要是遇见技术问题,还能免费咨询,不得不说这服务很贴心。并且,已经提前修补好了几个出现的代码bug,大大节省了我们排查问题的时间。 二、开发环境配置 1. 开发工具:使用Eclipse4.4(javaee版),它是一款非常经典且功能强大的Java开发工具,在企业级开发中应用广泛。

By Ne0inhk
基于飞算JavaAI的在线图书借阅平台设计与实现(深度实践版)

基于飞算JavaAI的在线图书借阅平台设计与实现(深度实践版)

摘要: 本文以从概念到落地,完整构建一个“在线图书借阅平台”的全过程。文章不仅覆盖了环境配置、需求分析、接口设计、数据库建模等基础流程,更着重于展示AI自动生成的项目核心代码,并在此基础上进行了详尽的功能扩展和代码优化。通过对用户管理、图书管理、借阅与归还等关键业务模块的详细代码实现与注释,本文旨在全面、深入地展现飞算JavaAI在真实项目开发中的强大能力,探讨其如何重塑传统Java开发范式,显著提升开发效率与代码质量。 一、引言 在软件工程领域,随着业务逻辑的日益复杂化和市场对产品迭代速度的严苛要求,传统的纯手动编码模式正面临前所未有的挑战。开发周期长、人力成本高、代码质量参差不齐、技术债累积等问题,成为制约项目成功的重要因素。正是在这样的背景下,人工智能辅助编程(AI-Assisted Programming)应运而生,它通过将大型语言模型与软件工程知识深度融合,旨在自动化处理开发流程中的重复性、模式化任务,使开发者能够聚焦于更具创造性的核心业务逻辑。 飞算科技推出的飞算JavaAI,正是这一变革浪潮中的杰出代表。它作为一款深度集成于IntelliJ IDEA的智能插件,能够

By Ne0inhk
Java高性能开发实战(1)——Redis 7 持久化机制

Java高性能开发实战(1)——Redis 7 持久化机制

Redis版本:7.0.15 1.概述 Redis是一个基于内存的数据库,这意味着其主要数据存储和操作均在内存中进行。这种设计使得Redis能够提供极快的读写速度(通常达到微秒级别),适用于高性能场景,如缓存 * 然而,由于内存的易失性(断电后数据会丢失),Redis提供了持久化机制:将内存中的数据保存到磁盘中,确保数据在Redis服务重启或崩溃后能够恢复。通过持久化,可以避免数据丢失,提高数据的可靠性 * Redis提供两种持久化方式 * RDB(Redis Database):生成数据集的快照实现持久化 * AOF(Append Only File):记录所有写操作命令,以追加方式写入文件 2.RDB RDB指的是Redis的一种持久化机制,其核心是生成Redis数据在某个时间点的快照 2.1 快照原理 由于Redis是单线程应用程序,在线上环境时,不仅要处理来自客户端的请求,还要执行内存快照操作(进行文件IO)。单线程同时处理客户端请求和文件IO时会严重降低服务器性能,甚至阻塞客户端请求。因此,Redis使用 fork 和

By Ne0inhk