当前位置: 移动技术网 > IT编程>软件设计>设计模式 > 【Java】JMM内存模型和JVM内存结构

【Java】JMM内存模型和JVM内存结构

2019年06月02日  | 移动技术网IT编程  | 我要评论

jmm内存模型和jvm内存结构

java内存模型(java memory model)

java内存模型,一般指的是jdk 5 开始使用的新的内存模型,主要由 描述。

jmm就是一种符合内存模型规范的,屏蔽了各种硬件和操作系统的访问差异的,保证了java程序在各种平台下对内存的访问都能保证效果一致的机制及规范。

内存模型可以理解为在特定的操作协议下,对特定的内存或者高速缓存进行读写访问的过程抽象,不同架构下的物理机拥有不一样的内存模型,java虚拟机也有自己的内存模型,即java内存模型(java memory model, jmm)。在c/c++语言中直接使用物理硬件和操作系统内存模型,导致不同平台下并发访问出错。而jmm的出现,能够屏蔽掉各种硬件和操作系统的内存访问差异,实现平台一致性,是的java程序能够“一次编写,到处运行”。

jmm主要解决的问题: 解决由于多线程通过共享内存进行通信时,存在的本地内存数据不一致、编译器会对代码指令重排序、处理器会对代码乱序执行等带来的问题

  • 缓存一致性问题其实就是可见性问题。
  • 处理器优化是可以导致原子性问题
  • 指令重排即会导致有序性问题

内存模型解决并发问题主要采用两种方式:限制处理器优化和使用内存屏障

参考:

jvm内存结构

传送门:java 虚拟机规范

hotspot 白皮书: memory management in the java hotspot virtual machine 它描述了垃圾回收(gc)触发的内存自动管理

其实 java 虚拟机的内存结构并不是官方的说法,在《java 虚拟机规范》中用的是「运行时数据区(run-time data areas)」这个术语

下图能很清晰的说明jvm内存结构布局:

jvm内存结构主要有三大块:

  • 堆内存(heap)
  • 方法区/永久代(method area/permgen) 或者别名non-heap(非堆)
  • 栈(thraed...)

在《深入理解java虚拟机(第二版)》中的描述是下面这个样子的:

按照《java 虚拟机规范》的中所述,可以分为公有和私有两部分

  • 公有部分: 堆[heap]、方法区[method area]、常量池[constant pool]

  • 私有部分: pc寄存器、vm虚拟机栈、本地方法栈

各个区域的内存大小

通过一张图了解如何通过参数来控制各个区域的内存大小

参数说明:

-xms:设置堆的最小空间大小。

-xmx:设置堆的最大空间大小。

-xx:newsize设置新生代最小空间大小。

-xx:maxnewsize设置新生代最大空间大小。

-xx:permsize设置永久代最小空间大小。

-xx:maxpermsize设置永久代最大空间大小。

-xss:设置每个线程的堆栈大小。

没有直接设置老年代的参数,但是可以设置堆空间大小和新生代空间大小两个参数来间接控制。

老年代空间大小=堆空间大小-年轻代大空间大小


java堆(heap)

java堆是被所有线程共享的一块内存区域,在虚拟机启动时创建.

这块区域专门用于 java 实例对象和数组的内存分配,几乎所有实例对象都在会这里进行内存的分配

之所以说几乎是因为有特殊情况,有些时候小对象会直接在栈上进行分配,这种现象我们称之为「栈上分配」

java堆的内存划分

java堆是垃圾收集器管理的主要区域,因此很多时候也被称做“gc堆”。

如果从内存回收的角度看,由于现在收集器基本都是采用的分代收集算法,所以java堆中还可以细分

主要被划分为: 新生代「young generation」和老年代「old generation

新生代「young generation」又可分为:edenfrom survivor 0to survivor 1

根据《java 虚拟机规范》的规定,java堆可以处于物理上不连续的内存空间中,只要逻辑上是连续的即可,就像我们的磁盘空间一样。在实现时,既可以实现成固定大小的,也可以是可扩展的,不过当前主流的虚拟机都是按照可扩展来实现的(通过-xmx-xms控制)。

堆可以具有固定大小,或者可以根据计算的需要进行扩展,并且如果不需要更大的堆,则可以收缩。

如果在堆中没有内存完成实例分配,并且堆也无法再扩展时,将会抛出outofmemoryerror异常。

不同区域的生命周期

  • 新建(new)或者短期对象会存放在eden区域
  • 幸存或者中期的对象会从eden拷贝到survivor区域
  • 始终存在的或者长期存在的对象将会从survivor拷贝到old generation

当有对象需要分配时,一个对象永远优先被分配在年轻代的 eden 区,等到 eden 区域内存不够时,java 虚拟机会启动垃圾回收。此时 eden 区中没有被引用的对象的内存就会被回收,而一些存活时间较长的对象则会进入到老年代。

在 jvm 中有一个名为 -xx:maxtenuringthreshold 的参数(默认为7)专门用来设置晋升到老年代所需要经历的 gc 次数,即在年轻代的对象经过了指定次数的 gc 后,将在下次 gc 时进入老年代

为什么 java 堆要进行这样一个区域划分呢

虚拟机中的对象必然有存活时间长的对象,也有存活时间短的对象,这是一个普遍存在的正态分布规律。如果我们将其混在一起,那么因为存活时间短的对象有很多,那么势必导致较为频繁的垃圾回收。而垃圾回收时不得不对所有内存都进行扫描,但其实有一部分对象,它们存活时间很长,对他们进行扫描完全是浪费时间。因此为了提高垃圾回收效率,分区就理所当然了

虚拟机heap space的默认配置为: eden:from :to = 8:1:1

其实这是 ibm 公司根据大量统计得出的结果。根据 ibm 公司对对象存活时间的统计,他们发现 80% 的对象存活时间都很短。于是他们将 eden 区设置为年轻代的 80%,这样可以减少内存空间的浪费,提高内存空间利用率


方法区(method area)

方法区(method area)与java堆一样,是各个线程共享的内存区域,在虚拟机启动时创建。

它用于存储已被虚拟机加载的类结构,如:运行时常量池、静态变量、字段、和方法数据,即时编译器编译后的代码等数据,以及方法和构造函数的代码

java虚拟机规范对这个区域的限制非常宽松,除了和java堆一样不需要连续的内存和可以选择固定大小或者可扩展外,还可以选择不实现垃圾收集。相对而言,垃圾收集行为在这个区域是比较少出现的,但并非数据进入了方法区就如永久代的名字一样“永久”存在了。这个区域的内存回收目标主要是针对常量池的回收和对类型的卸载,一般来说这个区域的回收“成绩”比较难以令人满意,尤其是类型的卸载,条件相当苛刻,但是这部分区域的回收确实是有必要的。

根据《java虚拟机规范的规定》,当方法区无法满足内存分配需求时,将抛出outofmemoryerror异常。

方法区在不同版本的虚拟机有不同的表现形式

例如在 1.7 版本的 hotspot 虚拟机中,方法区被称为永久代(permanent space),而在 jdk 1.8 中则被称之为 metaspace

拓展点

可以看到常量池其实是存放在方法区中的,但《java 虚拟机规范》将常量池和方法区放在同一个等级上

虽然《java虚拟机规范》把方法区描述为堆的一个逻辑部分,但是它却有一个别名叫做non-heap(非堆),目的应该是与java堆区分开来。

对于习惯在hotspot虚拟机上开发和部署程序的开发者来说,很多人愿意把方法区称为“永久代”(permanent generation),本质上两者并不等价,仅仅是因为hotspot虚拟机的设计团队选择把gc分代收集扩展至方法区,或者说使用永久代来实现方法区而已。


程序计数器(program counter register)

每个java虚拟机线程都有自己私有独立的 pc(程序计数器)寄存器。

它的作用可以看做是当前线程所执行的字节码的行号指示器。

在任何时候,每个java虚拟机线程都在执行单个方法的代码,即该线程的当前方法。如果不是该方法 native,则pc寄存器包含当前正在执行的java虚拟机指令的地址。如果线程当前正在执行native方法,则java虚拟机pc 寄存器的值为undefined

此内存区域是唯一一个在java虚拟机规范中没有规定任何outofmemoryerror情况的区域


jvm栈(java virtual machine stacks)

与程序计数器一样,java虚拟机栈(java virtual machine stack)也是线程私有的,它的生命周期与线程相同,与线程同时创建。

jvm stack存储帧(stack frame) [a java virtual machine stack stores frames]

jvm stack类似于传统语言的stack,例如c语言:它保存局部变量和部分结果,并在方法调用和返回中起作用。由于除了推送和弹出帧(frames)之外,永远不会直接操作java虚拟机堆栈(java virtual machine stack),因此帧(frames)可以是堆(heap)分配的。java虚拟机堆栈的内存不需要是连续的。

虚拟机栈(jvm stacks)描述的是java方法执行的内存模型:每个方法被执行的时候都会同时创建一个栈帧(stack frame)用于存储局部变量表、操作数栈、动态链接、方法出口以及一些过程结果等信息。每一个方法被调用直至执行完成的过程,就对应着一个栈帧在虚拟机栈中从入栈到出栈的过程。

局部变量表存放了编译期可知的各种基本数据类型(boolean、byte、char、short、int、float、long、double)、对象引用(reference类型,它不等同于对象本身,根据不同的虚拟机实现,它可能是一个指向对象起始地址的引用指针,也可能指向一个代表对象的句柄或者其他与此对象相关的位置)和returnaddress类型(指向了一条字节码指令的地址)。

其中64位长度的long和double类型的数据会占用2个局部变量空间(slot),其余的数据类型只占用1个。局部变量表所需的内存空间在编译期间完成分配,当进入一个方法时,这个方法需要在帧中分配多大的局部变量空间是完全确定的,在方法运行期间不会改变局部变量表的大小。

在java虚拟机规范中,对这个区域规定了两种异常状况:如果线程请求的栈深度大于虚拟机所允许的深度,将抛出stackoverflowerror异常;如果虚拟机栈可以动态扩展(当前大部分的java虚拟机都可动态扩展,只不过java虚拟机规范中也允许固定长度的虚拟机栈),当扩展时无法申请到足够的内存时会抛出outofmemoryerror异常。


本地方法栈(native method stacks)

本地方法栈(native method stacks)与虚拟机栈所发挥的作用是非常相似的,其区别不过是虚拟机栈为虚拟机执行java方法(也就是字节码)服务,而本地方法栈则是为虚拟机使用到的native方法服务。虚拟机规范中对本地方法栈中的方法使用的语言、使用方式与数据结构并没有强制规定,因此具体的虚拟机可以自由实现它。甚至有的虚拟机(譬如sun hotspot虚拟机)直接就把本地方法栈和虚拟机栈合二为一。与虚拟机栈一样,本地方法栈区域也会抛出stackoverflowerror和outofmemoryerror异常。


参考文档

jvm内存结构

jvm基础系列第6讲:java 虚拟机内存结构

java 虚拟机规范

memory management in the java hotspot virtual machine

如对本文有疑问, 点击进行留言回复!!

相关文章:

验证码:
移动技术网