Java 面试必问:JVM 运行时数据区域详解(附内存结构图)

Java 面试必问:JVM 运行时数据区域详解(附内存结构图)

文章目录

在 Java 面试中,JVM 内存结构几乎是必问知识点。很多人可以背出程序计数器、虚拟机栈、本地方法栈、堆和方法区这五个区域,但当面试官继续追问它们的作用、线程共享关系以及对象为什么在堆上时,往往就难以解释清楚。本文主要面对面试八股文速成选手,将从 JVM 的整体内存布局出发,带你系统梳理五大运行时数据区域的作用与常见面试考点。

JVM 运⾏时数据区域也叫内存布局,但需要注意的是它和 Java 内存模型((Java Memory Model,简称 JMM)完全不同,属于完全不同的两个概念,它由以下 5 ⼤部分组成:

在这里插入图片描述

1. 程序计数器(线程私有)

程序计数器的作⽤:⽤来记录当前线程执⾏的⾏号的。 程序计数器是⼀块⽐较⼩的内存空间,可以看做是当前线程所执⾏的字节码的⾏号指⽰器。如果当前线程正在执⾏的是⼀个 Java ⽅法,这个计数器记录的是正在执⾏的虚拟机字节码指令的地址;如果正在执⾏的是⼀个 Native ⽅法,这个计数器值为 undefined。程序计数器内存区域是唯⼀⼀个在 JVM 规范中没有规定任何 OOM 情况的区域!

在 JVM 中,多线程是通过线程轮流切换来获得 CPU 执行时间的,因此,在任一具体时刻,一个 CPU 的内核只会执行一条线程中的指令,因此,为了线程切换后能恢复到正确的执行位置,每个线程都需要有一个独立的程序计数器,并且不能互相干扰,否则就会影响到程序的正常执行次序。也就是说,我们要求程序计数器是线程私有的。

接下来我们一个通过一段非常简单的小代码以及字节码指令来看看程序计数器的作用。

publicclassPcDemo{publicstaticintadd(int a,int b){return a + b;}}

字节码指令大致如下:

0: iload_0 // 从局部变量表中加载变量 a 到操作数栈1: iload_1 // 从局部变量表中加载变量 b 到操作数栈2: iadd // 两数相加3: ireturn // 返回
  1. 初始状态:当方法开始执行时,PC 计数器设置为 0,指向第一条指令 0: iload_0。
  2. 执行第一条指令:执行 iload_0 指令,将局部变量表中索引为 0 的整数(即方法的第一个参数 a)加载到操作数栈顶。执行完成后,PC 计数器更新为 1,指向下一条指令 1: iload_1。
  3. 执行第二条指令:执行 iload_1 指令,将局部变量表中索引为 1 的整数(即方法的第二个参数 b)加载到操作数栈顶。执行完成后,PC 计数器更新为 2,指向下一条指令 2: iadd。
  4. 执行第三条指令:执行 iadd 指令,弹出操作数栈顶的两个整数(即 a 和 b),将它们相加,然后将结果压入操作数栈顶。执行完成后,PC 计数器更新为 3,指向下一条指令 3: ireturn。
  5. 执行最后一条指令:执行 ireturn 指令,弹出操作数栈顶的整数(即 a + b 的结果),并将这个值作为方法的返回值。方法执行完成,控制权返回到方法调用者。

如果 JVM 线程发生切换:

线程APC=2// 线程A下一条指令应该执行 iadd 线程BPC=4// 线程B下一条指令应该执行 ireturn

2. Java 虚拟机栈(线程私有)

Java 虚拟机栈(JVM Stack) 是线程私有的运行时数据区,它的生命周期与线程相同。虚拟机栈用于描述 Java 方法执行时的内存模型:当一个方法被调用时,JVM 会为该方法创建一个 栈帧(Stack Frame) 并压入虚拟机栈中。栈帧中主要包含 局部变量表、操作数栈、动态链接和方法返回地址等信息。当方法执行结束时,对应的栈帧会被弹出。通常我们所说的 “栈内存”,指的就是 Java 虚拟机栈。

在这里插入图片描述
  1. 局部变量表(Local Variable Table):用于存储方法执行过程中使用的方法参数和方法内部定义的局部变量(包括基本数据类型变量和对象引用)。其中对象引用存储的是对象在堆中的引用地址而不是对象本身。局部变量表的大小在编译期就已确定,在方法执行期间不会改变,并以 slot(槽位) 的形式按顺序存放在栈帧中。
  2. 操作数栈:操作数栈是 JVM 在执行字节码指令时,用于临时存放参与运算的数据和保存计算结果的栈结构。字节码指令会通过入栈(push)和出栈(pop)的方式在操作数栈上完成计算,可以理解为 JVM 执行计算时临时使用的“工作台”。
  3. 动态链接:指在方法执行过程中,把常量池中的符号引用解析为实际方法或字段引用的过程。(例如我们想给张三打电话,需要先在通讯录中通过“张三”这个名字查找他的真实电话号码,然后再拨打电话。其中,“张三”这个名字相当于符号引用,张三的电话号码相当于真实引用,而通过名字查找电话号码的过程就类似于动态链接。)
  4. 方法返回地址:指当前方法执行结束后,程序需要返回到调用者方法继续执行的位置。(换个更直白的说法:方法返回地址就是“这个方法执行完之后,下一条要执行的字节码在哪里”)

3. 本地方法栈(线程私有)

本地方法栈(Native Method Stack)与 Java 虚拟机栈类似,只不过 Java 虚拟机栈为虚拟机执行 Java 方法服务,而本地方法栈则为虚拟机使用到的 Native 方法服务。故在此不再赘述。

4. 堆(线程共享)

堆(Heap)是 JVM 中用于存放对象实例和数组(数组也是一种对象)的运行时内存区域,并且是所有线程共享的。在 Java Virtual Machine 中,当代码创建对象时,本质上就是在堆里申请一块内存。如下所示:

User user =newUser(); 线程栈 堆 ------------------ user (引用地址)------->User对象实例 栈里只保存 引用(reference),真正的数据在堆里。这也是为什么 Java 对象通常说是 “在堆上分配”。 

堆为什么必须共享?设想这样一个程序:

User user =newUser();ThreadA 修改 user.name ThreadB 读取 user.name 如果堆不是共享的,每个线程都有自己的对象副本,那数据就会完全不同步。 所以 JVM 的设计非常明确:对象数据在堆里共享,执行过程在栈里隔离。 

我们常⻅的 JVM 参数设置 -Xms10m 最⼩启动内存是针对堆的,-Xmx10m 最⼤运⾏内存也是针对堆的。

堆除了是对象的聚集地,也是 Java 垃圾收集器管理的主要区域,因此也被称作 GC 堆(Garbage Collected Heap)。从垃圾回收的角度来看,由于垃圾收集器基本都采用了分代垃圾收集的算法,所以堆还可以细分为:新生代和老年代。新生代还可以细分为:Eden 空间、From Survivor、To Survivor 空间等。进一步划分的目的是更好地回收内存,或者更快地分配内存。

堆这最容易出现的就是 OutOfMemoryError 错误,分为以下几种表现形式:

  • OutOfMemoryError: GC Overhead Limit Exceeded:当 JVM 花太多时间执行垃圾回收并且只能回收很少的堆空间时,就会发生该错误。
  • java.lang.OutOfMemoryError: Java heap space:假如在创建新的对象时,堆内存中的空间不足以存放新创建的对象, 就会引发该错误。和本机的物理内存无关,和我们配置的虚拟机内存大小有关!

5. 方法区(线程共享)

方法区是 Java 虚拟机规范上的一个逻辑区域,在不同的 JDK 版本上有着不同的实现。在 JDK 7 的时候,方法区被称为永久代(PermGen),而在 JDK 8 的时候,永久代被彻底移除,取而代之的是元空间。

方法区 ≠ 元空间 方法区 是规范里的概念 元空间 是一种实现方式 

方法区主要存什么?

  1. 类的结构信息
当 JVM 加载一个类,比如: classUser{privateString name;publicvoidrun(){}}JVM 会把这些信息解析后存到方法区:类名 父类信息 实现的接口 字段信息 方法信息 访问修饰符 例如: Class:UserFields: name Methods:run()Superclass:Object 这些都是类的元数据(metadata)。 
  1. 运行时常量池
每个 class 文件都有一个 常量池(ConstantPool),里面存着: 字符串常量 类名 方法名 字段名 符号引用 例如代码:String s ="hello"; 这里 "hello" 就会进入运行时常量池(现代 JVM 中字符串对象在堆,但常量池引用在方法区)。 
  1. 静态变量(static 变量)
例如: classUser{staticint count =0;} count 是类级别变量,不是对象变量。所以它不会放在堆里的对象中,而是放在方法区中。 
  1. JIT 编译后的代码

JVM 有 即时编译器(JIT)。热点方法会被编译成本地机器码,提高执行效率。这些编译后的机器码 也会存储在方法区相关区域。

读到这里,相信大家对 JVM 运行时数据区域的结构与作用 已经有了更加系统的理解。如果文中有不清晰或想进一步探讨的地方,欢迎在评论区交流,也可以私信博主一起讨论。

Read more

技术雷达:云原生、Serverless、WebAssembly前沿技术深度解析

技术雷达:云原生、Serverless、WebAssembly前沿技术深度解析 目录 1. 技术雷达方法论 2. 云原生技术演进 3. Serverless架构革命 4. WebAssembly技术突破 5. 技术融合趋势 6. 企业落地策略 7. 持续学习体系 1. 技术雷达方法论 1.1 ThoughtWorks技术雷达解读 ┌─────────────────────────────────────────────────────────────┐ │ 技术雷达四象限模型 │ ├─────────────────────────────────────────────────────────────┤ │ │ │ 采用(Adopt) 试验(Trial) │ │ ┌─────────────────┐ ┌─────────────────┐ │ │ │ • 生产标准 │ │ • 非核心系统试点 │ │ │ │ • 团队必备技能 │ │ • 积累实战经验 │ │ │ │ • 成熟稳定 │ │ • 评估生产就绪度 │ │ │ │ │ │ │ │ │ │ 示例

By Ne0inhk

MC.JS WEBMC 1.8.8 PLUS MOBILE在在线教育中的应用案例

快速体验 1. 打开 InsCode(快马)平台 https://www.inscode.net 2. 输入框内输入如下内容: 创建一个基于MC.JS WEBMC 1.8.8 PLUS MOBILE的教育演示项目。要求:1) 实现一个简单的3D编程教学环境;2) 包含5个循序渐进的编程练习任务;3) 添加教学注释和提示系统;4) 支持移动设备访问;5) 提供学生作品展示区。请使用响应式设计,确保在不同设备上都有良好的用户体验。 1. 点击'项目生成'按钮,等待项目生成完整后预览效果 最近在尝试将游戏开发引入编程教学时,发现MC.JS WEBMC 1.8.8 PLUS MOBILE这个工具特别适合做在线教育场景的实践。通过浏览器就能创建3D编程环境的特点,

By Ne0inhk

web前端JS—基本语法

一、引入方式 1、内部脚本:将代码定义在HTML页面里面 * 将JS定义在<script></script>之间 * 可以在html里面的任意位置放置任意数量的<script></script> * 一般放置在<body>元素的底部,改善显示速度 <script> console.log('页面加载时执行'); function localFunction() { return '内部函数'; } </script> 2、外部脚本:额外定义一个.js文件,引入到HTML里面 * 只能包含js文件,不包含&

By Ne0inhk
PCTF2025(web后半部分)

PCTF2025(web后半部分)

神秘商店 打开题目只有一个登录框 登录admin 利用全角来注册登录 后端代码有转换,全角能够绕过后端对admin的检测,然后把全角admin识别成正常的admin,造成覆盖注册,修改admin密码 注册admin,其中n为全角 利用整数溢出4294967246到50,购买flag 可以直接脚本登录 import requests def exploit(): url = "http://challenge2.pctf.top:32735" session = requests.Session() print("[+] 注册管理员账户...") users = { "username": "admin", "password": "123456" } response = session.post(f&

By Ne0inhk