一文理清Java内存区域

简介:

运行时数据区域

Java虚拟机在执行 Java 程序的过程中会把它管理的内存划分为若干个不同的数据区域。根据《Java 虚拟机规范》将 Java虚拟机所管理的内存分为以下几个运行时数据区域:

● 程序计数器
● Java虚拟机栈
● 本地方法栈
● Java堆
● 方法区

80793714972a6b30761f99502f5732c8fe218915
程序计数器

程序计数器 ,也称作 PC寄存器或者指令地址寄存器。在汇编语言中,它保存的是程序当前执行的指令的地址(或者说是保存一条),当CPU需要执行指令时,需要从程序计数器中得到当前需要执行的指令所在存储单元的地址,然后根据得到的地址获取指令,在得到指令之后,程序计数器便自动加1或者根据转移指针得到下一条指令的地址,如此循环,直至执行完所有的指令。

在JVM中,程序计数器是一块较小的内存空间,它可以看做是当前线程所执行的字节码的行号指示器,字节码解释器工作时就是通过改变这个计数器的值来选取下一跳需要执行的字节码指令

由于Java 虚拟机的多线程是通过线程轮流切换并分配处理器执行时间的方式来实现的,在任何一个确定的时间,一个处理器(对于多核处理器来说是一个内核)都只会执行一条线程中的指令。因此,为了线程切换后能够恢复到正确的执行位置,每条线程都需要有一个独立的程序计数器,各条线程之间计数器互不影响,独立存储,这是 "线程私有的"

如果线程正在执行的是一个 Java方法,这个计数器记录的是正在执行的虚拟机字节码指令的地址;如果正在执行的是 Native方法,计数器值为空,此内存区域是唯一一个在 Java虚拟机规范中没有规定任何 OutOfMemoryError 情况的区域

Java虚拟机栈

Java虚拟机栈也是线程私有的,它的生命周期与线程相同,它描述的是 Java 方法执行的内存模型: 每个方法在执行的同时都会创建一个栈帧( Stack Frame)用于存储局部变量表,操作数栈,动态链接,方法出口等信息。每一个方法从调用直至执行完成的过程,就对应着一个栈帧在虚拟机栈中入栈到出栈的过程。至于关于栈帧的具体介绍后续文章再分析。

因为除了栈帧的出栈和入栈之外,Java虚拟机栈不会再受其他因素的影响,所以 栈帧可以在系统的堆中分配(注意,是系统的Heap而不是Java 堆)

JVM保留了两个内存区:Java 堆和本机(或系统堆)。这个堆具有不同的用途,并使用不同的机制进行维护,Java堆就是我下面要将的包含对象实例的"堆",而系统的堆使用操作系统的底层 malloc 和 free机制进行分配,且用于底层实施特定的Java对象。

Java虚拟机栈所使用的内存不需要保证是连续的。

Java虚拟机栈可能发生如下异常情况:

● 如果线程请求的栈深度大于虚拟机所允许的深度,将抛出   StackOverflowError 异常
● 如果虚拟机栈可以动态扩展(当前大部分的Java虚拟机都可以动态扩展,只不过Java虚拟机规范中也允许固定长度的虚拟机栈),如果扩展时无法申请到足够的内存,就会抛出   OutOfMemoryError   异常。

注意: Java虚拟机栈就是栈,也可以成为"堆栈",只是堆栈这种说法容易让人混淆。关于Java虚拟机的堆,栈,堆栈如何去理解这类问题,JVM专家R大也在知乎上对其进行了详细的解答,传送门: https://www.zhihu.com/question/29833675/answer/82661572。

本地方法栈

本地方法栈(Native Method Stack)与虚拟机栈所发挥的作用是非常相似的,它们之间的区别不过是虚拟机栈为虚拟机执行 Java方法(也就是字节码)服务,而本地方法栈则为虚拟机使用到的是 Native方法服务。在虚拟机规范中对本地方法栈中方法使用的语言,使用方法与数据结构并没有强制规定,因此具体的虚拟机可以自由实现它。

看到这个本地方法栈,总是对本地方法有些疑惑,下面简单说下Native Method

什么是 Native Method?

一个Natvie Method就是一个Java调用非Java代码的接口,它由非Java语言实现,比如C语言。

在定义一个 Native Method时,并不提供实现体(有些像定义一个 Java Interface),因为其实现体是由非Java语言在外面实现的,比如:

public class IHaveNatives
 {
 native public void Native1( int x ) ;
 native static public long Native2() ;
 native synchronized private float Native3( Object o ) ;
 native void Native4( int[] ary ) throws Exception ;
 }
 


native方法可以返回任何 Java类型,也能够实现异常控制。

为什么使用Native Method?

Java对一些层次的任务用 Java实现不容易,对某些程序效率不高:

● Java与Java外的环境交互:

Java与一些底层系统如操作系统或某些硬件交换信息,native方法提供一个非常简洁的接口,无需了解Java应用之外的细节。

● 与操作系统交互

通过使用本地方法让 Java实现 JRE与底层系统的交互

● Sun'Java

Sun的解释器是用 C实现的,JRE 大部分用 Java实现,其通过一些本地方法与外界交互

所以对于本地方法栈来说,它本质是为本地方法服务的,如果某个虚拟机实现的本地方法接口是使用 C连接模型的话,那么它的本地方法栈就是 C栈。下图展示了一个Java栈和本地方法栈之间的跳转,(图片摘自网络):

1442b7d1c81191fdbeace553b1a24c5251b4153b

Java堆

对于大多数应用来说,Java 堆(Java Heap)是Java 虚拟机所管理的内存中最大的一块。Java 堆是被所有线程共享的一块内存区域,在虚拟机启动时创建。此内存区域的唯一目的就是存放对象实例,几乎所有的对象实例都在这里分配内存。

Java堆是垃圾收集器管理的主要区域,因此很多时候也被称作为 "GC堆"。从内存回收的角度看,由于现在收集器基本采用分代收集算法,(关于垃圾算法的介绍后续文章分析),所以 Java 堆中还可以细分为: 新生代和老年代,再细致一点有 Eden空间,From Survivor空间,To Survivor 空间等。

根据 Java 虚拟机规范的规定, Java 堆可以处于物理不连续的内存空间中,只要逻辑是连续的即可,就像我们的磁盘空间一样。在实现时,即可以实现成固定大小的,也可以是可扩展的,不过当前主流的虚拟机都是按照可扩展来实现的 (通过 -Xmx 和 -Xms 控制)。

如果堆上没有内存完成实例分配,并且 堆也无法再扩展时,将会抛出 OutOfMemoryError异常。

JVM中堆和栈的区别

这里简单说说JVM中堆和栈的区别:

● 功能不同
     ● 栈内存用来存储局部变量,操作数栈等信息
      ● 堆内存用来存储Java中的对象
● 共享性不同
      ● 栈内存是线程私有的
      ● 堆内存是所有线程共有的
● 空间大小
      ● 栈的空间大小远远小于堆的
● 异常错误不同
      ● 栈有两种异常情况,如果线程请求的栈深度大于虚拟机所允许的深度,将抛出   StackOverflowError   异常,如果虚拟机栈动态扩展时无法申请到足够的内存,就会抛出   OutOfMemoryError   异常。

     ● 堆一般在堆中没有内存完成实例分配,并且堆也无法进行扩展时,抛出 OutOfMemoryError 异常。

方法区

方法区(Method Area) 与 Java堆一样,是各个线程共享的内存区域,它用于存储已被虚拟机加载的类信息,常量,静态变量,即时编译器编译后的代码等数据。虽然Java虚拟机规范把方法区描述为 堆的一个逻辑部分,但是它有一个别名叫做 "非堆"。

对于HotSpot虚拟机来讲,方法区域又被称为 "永久代",本质上两者并不等价,仅仅是因为HotSpot虚拟机的设计团队选择把 GC 分代收集扩展至方法区,或者说使用 永久代来实现方法区而已,这样的HotSpot的垃圾收集器可以像 管理 Java堆一样管理这部分内存,能够省去专门为方法区编写内存管理代码的工作。对于其他虚拟机(如 BEA JRockit,IBM J9等)来说是不存在永久代的概念的。

在JDK 1.7及以前的HotSpot JVM中,方法区位于永久代(Permanent Generation,PermGen) 中。如下图,是JDK 1.7及以前的 Java堆内存的结构图,里面包含了 Permanent Generation:

4c64f967273f4d59edc331d658b63a6e141c55a6

由于 永久代内可能发生内存泄漏或溢出的问题(永久代有 -XX:MaxPermSize的上限)而导致的 java.lang.OutOfMemoryError: PermGen space,JEP小组从JDK 1.7 开始就筹划移除永久代,并且在 JDK 1.7 中把字符串常量,符号引用等移除了永久代。到了Java 8 ,永久代被彻底地移除了 JVM,取而代之的是元空间 (Metaspace)

912effa5533e217b8b07466ff6d39b6846636cf9

JDK 8开始将类的元数据放到本地堆内存(native heap)中,这一块区域就叫 Metaspace,关于 Metaspace 的介绍请参考:https://link.juejin.im/?target=https%3A%2F%2Fjava-latte.blogspot.com%2F2014%2F03%2Fmetaspace-in-java-8.html

运行时常量池

前面讲 方法区的时候就提到,运行时常量池是方法区的一部分,它是 class文件中每一个类或接口的常量池表的运行时表示形式。它包括了若干种不同的常量,常量池表存放 编译器生成的各种字面量和符号引用,这部分内容将在类加载后进入方法区的运行时常量池中存放。

48d6b5233bc21d4382991b4669840f924230869e

运行时常量池具有动态性,运行期间也可以将新的量放到运行时常量池中,典型的应用是 String 类的 intern方法:

public native String intern()

String类的 intern方法会从字符串常量池中查询当前字符串是否存在,如果存在,就会直接返回当前字符串,若不存在就会将当前字符串放入常量池中,再返回。关于String.intern()更为详尽的分析,请参阅文章:https://tech.meituan.com/in_depth_understanding_string_intern.html

而从JDK 1.7开始,字符串常量和符号引用等被移除永久代:

● 符号引用迁移至系统堆内存 (Native Heap)

● 字符串字面量迁移至 Java堆(Java Heap)

小结

以上的分析参考了《深入理解Java虚拟机》这本书,同时也参考了很多优秀的文章。在此过程中,我们要注意JDK版本变化带来的问题,比如在 JDK 8版本中,永久代被彻底移除了。

当上面提到一个JVM的巨牛级别的人物——R大,R大是国内JVM巨牛级人物,他的回答都是非常权威的,所以学习 JVM的知识可以多参考 R大的分析。目前本人对 JVM也是一枚渣渣级选手,现在输出对JVM的一些学习笔记。如有错误之处,欢迎指出。


原文发布时间为:2018-09-4

本文作者:pjmike_pj

本文来自云栖社区合作伙伴“ Java架构沉思录”,了解相关信息可以关注“Java架构沉思录”。

相关文章
|
6天前
|
存储 Java 编译器
Java内存区域详解
Java内存区域详解
18 0
Java内存区域详解
|
16天前
|
缓存 算法 Java
Java内存管理与调优:释放应用潜能的关键
【4月更文挑战第2天】Java内存管理关乎性能与稳定性。理解JVM内存结构,如堆和栈,是优化基础。内存泄漏是常见问题,需谨慎管理对象生命周期,并使用工具如VisualVM检测。有效字符串处理、选择合适数据结构和算法能提升效率。垃圾回收自动回收内存,但策略调整影响性能,如选择不同类型的垃圾回收器。其他优化包括调整堆大小、使用对象池和缓存。掌握这些技巧,开发者能优化应用,提升系统性能。
|
1月前
|
监控 Java 数据库连接
解析与预防:Java中的内存泄漏问题
解析与预防:Java中的内存泄漏问题
|
2月前
|
存储 缓存 算法
深入剖析Java中JVM的内存模型!!!
对于 Java 程序员来说,在虚拟机自动内存管理机制下,不再需要像C/C++程序开发程序员这样为内一个 new 操作去写对应的 delete/free 操作,不容易出现内存泄漏和内存溢出问题。正是因为 Java 程序员把内存控制权利交给 Java 虚拟机,一旦出现内存泄漏和溢出方面的问题,如果不了解虚拟机是怎样使用内存的,那么排查错误将会是一个非常艰巨的任务。
46 1
|
2月前
|
存储 缓存 Java
面试官:什么是Java内存模型?
面试官:什么是Java内存模型?
108 0
面试官:什么是Java内存模型?
|
2月前
|
存储 Java
java的内存
java的内存需要划分成为5个部分: 1.栈(Stack)存放的都是方法中的局部变量。方法的运行一定要在栈当中运行。 2.堆(Heap)凡是new出来的东西,都是在堆当中 堆内存的东西都有一个地址值:16进制 堆内存的数据,都有默认值。规则: 整数 默认是0 浮点 默认0.0 字符 默认'\u0000' 布尔 默认false 引用类型 默认null 3.方法区(Method Area):存储class相关信息。包含方法的信息 4.本地方法栈(Native Method Stack):与操作系统相关 5.寄存器(pc Register):与cpu相关
29 6
|
12天前
|
缓存 安全 Java
Java并发编程进阶:深入理解Java内存模型
【4月更文挑战第6天】Java内存模型(JMM)是多线程编程的关键,定义了线程间共享变量读写的规则,确保数据一致性和可见性。主要包括原子性、可见性和有序性三大特性。Happens-Before原则规定操作顺序,内存屏障和锁则保障这些原则的实施。理解JMM和相关机制对于编写线程安全、高性能的Java并发程序至关重要。
|
20天前
|
缓存 Java C#
【JVM故障问题排查心得】「Java技术体系方向」Java虚拟机内存优化之虚拟机参数调优原理介绍(一)
【JVM故障问题排查心得】「Java技术体系方向」Java虚拟机内存优化之虚拟机参数调优原理介绍
57 0
|
2月前
|
存储 安全 Java
一文带你读懂深入理解Java内存模型
java内存模型(Java Memory Model,JMM)是java虚拟机规范定义的,用来屏蔽掉java程序在各种不同的硬件和操作系统对内存的访问的差异,这样就可以实现java程序在各种不同的平台上都能达到内存访问的一致性。可以避免像c++等直接使用物理硬件和操作系统的内存模型在不同操作系统和硬件平台下表现不同,比如有些c/c++程序可能在windows平台运行正常,而在linux平台却运行有问题。 物理硬件和内存
20 1
|
2天前
|
存储 缓存 监控
Java内存管理:垃圾回收与内存泄漏
【4月更文挑战第16天】本文探讨了Java的内存管理机制,重点在于垃圾回收和内存泄漏。垃圾回收通过标记-清除过程回收无用对象,Java提供了多种GC类型,如Serial、Parallel、CMS和G1。内存泄漏导致内存无法释放,常见原因包括静态集合、监听器、内部类、未关闭资源和缓存。内存泄漏影响性能,可能导致应用崩溃。避免内存泄漏的策略包括代码审查、使用分析工具、合理设计和及时释放资源。理解这些原理对开发高性能Java应用至关重要。