菜鸟笔记
提升您的技术认知

JVM 内存结构之虚拟机栈

jvm 内存结构之虚拟机栈

本篇自己学习记录,如有错误,请各位大佬指正!

JVM 内存模型图

一,虚拟机栈概述

虚拟机栈出现的背景

​ 由于java跨平台的特性 ,java的指令是根据栈来设计的.不同平台的CPU架构不同,所以不能设计为基于寄存器的,基于栈的优点是,跨平台,指令集小,编译器容易实现,缺点是,相比较是性能下降,实现同样的功能需要更多的指令

什么是java虚拟机栈?

​ Java虚拟机栈,早期也叫Java栈,每个线程创建时都会创建一个虚拟机栈(线程私有的),内部保存一个个栈帧(存储单位),每一个栈帧对应着一次次的Java方法调用,生命周期和线程的一致,栈主管Java程序的运行,保存方法的局部变量(8种基本数据类型,对象的引用地址),部分结果,并参与方法的调用和返回(作用后面都会一一介绍 到), 注意要区分局部变量和成员变量的区别。

​ 内存中的栈与堆,栈是运行时的单位,堆是存储是的单位

​ 即栈解决的是程序运行时的问题,程序是如何运行的. 堆解决的是数据存储的问题,数据怎么存储,放哪存的问题

虚拟机栈的特点

  1. 栈是一种快速有效的存储方式,访问速度仅次于PC寄存器

  2. JVM直接对JAVA栈的操作只有两个:每个方法执行,伴随着进栈(入栈,压栈),执行结束的出栈

  3. 栈不存在垃圾回收,但是存在OOM(OutOfMemoryError)、栈溢出(StackOverFlowError) ,可以使用 -Xss 来设置栈的最大内存

    Java栈大小是动态或者固定不变的,动态扩展,无法申请到足够内存OOM,如果是固定,线程请求的栈容量超过固定值,则StackOverflowError

栈的存储单位

​ 每个线程都有自己的虚拟机 栈,栈中的数据以栈帧(Stack Frame)格式存储,线程上正在执行的每个方法都各自对应一个栈帧,方法与栈帧是一一对应的关系,栈帧是一个内存区块,是一个数据集,维系着方法执行过程中的各个数据信息.

栈的运行原理

​ 一条活动的线程中,一个时间点上,只会有一个活动的栈帧(也就是当前线程某一时刻只会有一个方法在运行)。只有当前正在执行的方法的栈顶栈帧是有效的,这个称为当前栈帧,对应栈帧是当前方法,对应方法对应的是当前类…

​ 栈数据结构是一个栈,先进后出,后进先出(对栈的帧操作入栈和出栈).

​ 执行引擎运行的所有字节码指令只针对当前栈帧进行操作,.如果方法中调用了其他方法,对应的新的栈帧会被创建出来,放在顶端,成为新的当前帧.

​ 不同线程中包含的栈帧不允许存在相互引用。

​ 当前方法调用了其他方法,方法返回之际,当前栈帧会传回此方法的执行结果给前一个栈帧,接着虚拟机会丢弃当前栈帧(出栈),使得前一个栈帧重新成为新的当前栈帧。

​ Java方法有两种返回方式:一种是正常的函数返回,使用return指令 另外一种是抛出异常,不管哪种方式,都会导致栈帧被弹出

栈帧的内部结构是什么?

​ 栈帧由 局部变量表(Local variables) ,操作数栈(Oprand Stack),动态链接(Dynamic Linking),方法返回地址(return address),一些附加信息组成

二,局部变量表(Local variables)

什么是局部变量表?

​ 局部变量表也被称之为局部变量数组或者是本地变量表,可知其底层数据结构为数组.是一个数字数组.主要用于存储方法参数,定义在方法体内部的局部变量,数据类型包括各类基本数据类型,对象引用,以及return address类型.

​ 局部变量表建立在线程的栈上,是线程私有的,因此不存在数据安全问题

​ 局部变量表容量个数,容量大小(使用javap -v 字节码文件查看 locals的值)是在编译期确定下来的

​ 局部变量表存放编译期可知的各种基本数据类型(8种),引用类型(reference),return address 类型

​ 最基本的存储单元是slot,32位占用一个slot,64位类型(long和double)占用两个slot

​ 局部变量表中的变量只有在当前方法调用中有效,虚拟机通过使用局部变量表完成参数值到参数变量列表的传递过程

​ 方法调用结束后,随着方法栈帧的销毁,局部变量表也会随之销毁 ,生命周期跟栈帧同步

关于Slot(变量槽)的理解

​ JVM虚拟机会为局部变量表中的每个Slot(变量槽)都分配一个访问索引,通过这个索引即可成功访问到局部变量表中指定的局部变量值,如下图

​ 如果当前栈帧是由构造方法或者实例方法(非静态方法)创建的,那么该对象引用this,会存放在index为0的slot处,其余的参数表顺序继续排列

​ 栈帧中的局部变量表中的槽位是可以重复使用的,如果一个局部变量过了其作用域,那么其作用域之后申明的新的局部变量就有可能会复用过期局部变量的槽位,从而达到节省资源的目的.

补充:

​ 在栈帧中,与性能调优关系最密切的部分,就是局部变量表,方法执行时,虚拟机使用局部变量表完成方法的传递.

​ 局部变量表中的变量也是重要的垃圾回收根节点,只要被局部变量表中直接或间接引用的对象都不会被回收.

三,操作数栈(Oprand Stack)

什么是操作数栈?

​ 在方法执行的过程中,根据字节码指令,往栈中写入数据或提取数据,即入栈/出栈

操作数栈的作用及工作原理是什么?

​ 主要用于保存计算过程的中间结果,同时作为计算过程中变量临时的存储空间

​ 当一个方法刚开始执行的时候,一个新的栈帧也会随之被创建出来,这个方法的操作数栈是空的

​ 每一个操作数栈会拥有一个明确的栈深度,用于存储数值,最大深度在编译期就定义好

​ 操作数栈并非采用访问索引方式进行数据访问,而是只能通过标准的入栈、出栈操作完成一次数据访问

​ 栈中,32bit类型占用一个栈单位深度,64bit(long double)类型占用两个栈单位深度

​ 如果被调用方法带有返回值的话,其返回值将会被压入当前栈帧的操作数栈中,并更新程序计数器中下一条需要执行的字节码指 令

​ Java虚拟机的解释引擎是基于栈的执行引擎,其中栈就是操作数栈

举例说明

对右边的字节码指令信息进行解读: 0: bipush 15 入操作数栈 2: istore_1 将15 出栈并存入局部变量表 下标且为1 (0下标为this),

​ 3: bipush 8 入操作数栈 5:istore_2 将8出栈并存入局部变量表中且下标为2,

​ 6: iload_1 将局部变量表中下标为1的值入栈 7:iload_2 将局部变量表 中下标为2的值入栈

​ 8: iadd 栈中存储中的值相加并出栈,将相加结果 入栈 9:istore_3 出栈并存入局部变量表中且下标为3

​ 10:return 此方法运行结束

栈顶缓存技术

​ 由于操作数栈是存储在内存中,频繁的进行内存读写操作影响执行速度,将栈顶元素全部缓存到物理CPU的寄存器中,依此降低对内存的读写次数,提升执行引擎的执行效率,指令更少,执行速度快

四,动态链接(Dynamic Linking)指向运行时常量池的方法引用

什么是动态链接?

​ 每一个栈帧内部都包含一个指向运行时常量池中该栈帧所属方法的引用,包含这个引用的目的就是为了支持当前方法的代码能够实现动态链接

​ 在java源文件编译到字节码文件中时,所有的变量和方法引用都作为符号引用保存在class文件中常量池里.,动态链接的作用是一个将符号引用解析为直接引用的过程

五,方法返回地址(return address)

​ 方法返回地址:存放调用该方法的pc寄存器的值

说明

​ 方法的结束: 正常执行完成,出现未处理异常,非正常退出…

​ 无论哪种方式退出,方法退出后,都会返回该方法被调用的位置。方法正常退出时,调用者的PC计数器的值作为返回地址,即调用该方法的指令的下一条指令的地址。异常退出的,返回地址是通过异常表来确定,栈帧中一般不会保存这部分信息

​ 执行引擎遇到任意一个方法返回的字节码指令(return),会有返回值传递给上层的方法调用者,简称正常完成出口

​ 返回指令包括:ireturn返回值是boolean,byte,char,short,和int类型时使用,lreturn,dreturn,areturn(引用类型),还有一个return指供声明为 void的方法、实例初始化方法、类和接口的初始化方法使用

​ 本质上,方法的退出就是当前栈帧出栈的过程。此时需要恢复上层方法的局部变量表,操作数栈,将返回值压入调用者栈帧的操作数栈 ,设置PC寄存器值等,让调用者方法继续执行下去。

​ 正常完成出口和异常完成出口的区别在于:通过异常完成出口退出的不会给他的上层调用者产生任何的返回值

六,一些附加信息

​ 允许携带与Java虚拟机实现相关的一些附加信息,例如对程序调试提供支持的信息。不确定有,可选情况
​ 其他没什么好说的

七,方法调用

这里方法调用理解都是一概念性的东西

静态链接:当一个字节码文件被装载进JVM内部时,如果被调用的目标方法在编译期可知,且运行时期间保持不变,这种情况下将调用方的符号引用转为直接引用的过程称为静态链接

动态链接:如果被调用的方法无法再编译期被确定下来,只能在运行期将调用的方法的符号引用转为直接引用,这种引用转换过程具备动态性,因此被称为动态链接

方法的绑定:绑定是一个字段、方法、或者类在符号引用被替换为直接引用的过程。仅仅发生一次。

早期绑定(invokespecial ):被调用的目标方法如果在编译期可知,且运行期保持不变时,即可将这个方法与所属的类型进行绑定,这样一来,由于明确了被调用的目标方法究竟是哪一个,因此也就可以使用静态链接的方式将符号引用转换为直接引用。

晚期绑定(invokevirtual、invokeinterface ):被调用的方法在编译期无法被确定,只能够在程序运行期根据实际的类型绑定相关的方法。

​ Java中任何一个普通方法都具备虚函数的特征(运行期确认,具备晚期绑定的特点),C++中则使用关键字virtual来显式定义

非虚方法:如果方法在编译期就确定了具体的调用版本,则这个版本在运行时是不可变的。这样的方法称为非虚方法

​ 静态方法,私有方法,final方法,实例构造器,父类方法都是非虚方法 其他都是虚方法

​ 非虚方法是早绑定,虚方法晚绑定

虚拟机提供方法 调用的指令:

​ 1: invokestatic 调用静态方法,解析阶段确定唯一方法版本

​ 2: invokespecial 调用方法,私有及父类方法,解析阶段确定唯一方法版本

​ 3: invokevirtual 调用所有虚方法

​ 4: invokeinterface 调用接口方法

其中invokestatic指令和invokespecial指令调用的方法称为非虚方法,其余的(final修饰的除外)称为虚方法

jdk 1.7新增invokedynamic

直到Java8的Lambda表达式的出现,invokedynamic指令的生成,在Java中才有了直接的生成方式

虚方法表(存在方法区):

​ 面向对象的编程中,会很频繁的使用动态分配,如果每次动态分配的过程都要重新在类的方法元数据中搜索合适的目标的话,就可能影响到执行效率,因此为了提高性能,JVM采用在类的方法区建立一个虚方法表,使用索引表来代替查找,每个类都有一个虚方法表,表中存放着各个方法的实际入口,虚方法表会在类加载的链接阶段被创建,并开始初始化,类的变量初始值准备完成之后,JVM会把该类的方法也初始化完毕

静态语言和动态语言:区别在于对类型的检查是编译器还是运行期,满足编译期就是静态类型语言,反之就是动态类型语言。Java是静态类型语言,动态调用指令增加了动态语言的特性.