菜鸟笔记
提升您的技术认知

Java 垃圾回收机制

垃圾回收机制

在进行垃圾回收之前,我们需要先判断一个对象是否存活,判断对象是否存活采用了两种方法:

引用计数法

给对象中添加一个引用计数器,每引用这个对象一次,计数器 +1,当引用失效时,计数器 -1。当引用计数器为 0 时,则表示该对象可被回收。

Java不适用原因:无法解决对象互相循环引用的问题

可达性分析

GC Roots 为起点,从这些节点开始向下搜索,节点所走过的路径称为引用链。若一个对象到 GC Roots 之间没有任何引用链,则说明此对象是不可达的,应该被回收。

可以作为 GC Roots 对象的有

  • 虚拟机栈(栈帧中的局部变量表)中引用的对象

  • 方法区中类静态属性引用的对象

  • 方法区中常量引用的对象

  • 本地方法栈中 JNI(native 方法)引用的对象

在可达性分析过程中,对象引用类型会对对象的生命周期产生影响,Java中有四种引用类型:

  • 强引用:只要该引用还有效,那么 GC不会回收。

  • 软引用:只有当内存空间不足时,软引用才会被回收,用 SoftReference实现。

  • 弱引用:弱引用关联的对象只能存活到下一次 GC收集前,用 WeakReference 实现。

  • 虚引用:虚引用与其他引用不同,虚引用不会决定对象的生命周期,我们无法通过虚引用获取对象实例。虚引用的唯一目的是:当该对象被 GC收集时,收到一个系统通知。用 PhantomReference 来实现。

一个对象真正不可用需要经过两次标记过程:

  • 首先进行可达性分析,筛选出与 GC Roots 之间没有任何引用链的对象,进行第一次标记。

  • 第一次标记后还需要再进行一次筛选,筛选的条件为是否有必要执行 finalize() 方法。

    • 若对象没有重写 finalize() 方法,或者 finalize() 方法已经被 jvm 调用了,则没有必要执行标记,GC 会回收该对象。

    • 若有必要执行,那么会先将对象放入 F-Queue 的队列中,由 JVM 开启一个低优先级的线程去执行(但不一定等待 finalize() 方法执行完)

  • finalize() 是在对象内存被回收前会被再调用一次,如果对象在 finalize() 方法中重新加入到引用链中,那么就会将此对象移出要被回收的集合中。其他的对象则进行第二次标记,进行回收。

Java 中常见的垃圾回收算法

标记-清除算法

分为两个阶段:标记,清除

缺点:两个阶段的效率都不高,容易产生大量的内存碎片

复制算法

将内存空间分为大小相同的两块空间,当一块的内存使用完后,就将存活的对象复制到另一块中,然后将之前使用的空间进行清除。

缺点:浪费了一半的内存

标记-整理算法

标记整理先对内存中的对象进行标记,当标记完后让所有存活的对象向一端移动,然后直接清除掉端边界以外的内存。

分代回收算法

将堆中的对象分为:新生代和老年代

  • 新生代使用复制算法

  • 将新生代内存分为一块大的 Eden区和两个小的 Survivor区域;每次垃圾回收都是扫描 Eden 区和 From区,将存活对象复制到 To区,然后交换 From区和 To区的名称引用,下次垃圾回收是继续将存活对象从 From区复制到 To区。当一个对象经过几次新生代垃圾回收后依然存活,那么就将对象复制到老年代区域中。

  • 老年代可以使用标记-清除或者标记-整理算法

在新生代中,每次收集都会有大量对象死去,所以我们选择复制算法,只需要付出少量对象的复制成本就可以完成每次的垃圾收集。老年代中对象的存活率是很高的,没有额外的空间进行分配,所以使用标记-整理或者标记-清除算法进行垃圾收集。

内存分配机制

  • 对象优先在 Eden区分配,当 Eden区没有足够的空间时就会发起一次 Minor GC

  • 大对象和长期存活的对象进入老年代

    • 典型的大对象是很长的字符串和数组

    • 每个对象都有年龄计数器,每经过一次 GC,年龄计数器 +1,当达到一定程度时(默认为 15)就会进入老年代。

  • 长期存活对象:每次垃圾回收都是扫描 Eden区和 From区,将存活对象复制到 To区,然后交换 From区和 To区的名称引用,下次垃圾回收是继续将存活对象从 From区复制到 To区。当一个对象经过几次新生代垃圾回收后依然存活,那么就将对象复制到老年代区域中。

Minor GC 和 Full GC

新生代 GC(Minor GC):对象在新生代中 Eden 区分配。当 Eden 区没有足够空间进行分配时,虚拟机就会发起一次 Minor GC。是指新生代垃圾收集,Minor GC 收集非常频繁,回收速度也比较快。

老年代 GC(Major GC/ Full GC):指发生在老年代的 GC,出现了 Major GC 经常会伴随至少一次的 Minor GC,Major GC 的速度一般会比 Minor GC 慢 10 倍以上。

垃圾收集器

在新生代工作的垃圾收集器:Serial、ParNew、Parallel Scavenge

在老年代工作的垃圾收集器:CMS、Serial Old、Parallel Old

同时在新老年代工作的垃圾收集器:G1

  • Serial 串行收集器

    • 特性:单线程,stop the world,采用复制算法

    • 应用场景:JVMClient模式下默认的新生代收集器

    • 优点:简单高效

  • ParNew

    • 特点:是 Serial的多线程版本,采用复制算法

    • 应用场景:在 Server模式下常用的新生代收集器,可以和 CMS配合工作

  • Parallel Scavenge

    • 特点:并行的多线程收集器,采用复制算法,吞吐量优先,有自适应调节策略

    • 应用场景:吞吐量大时使用

  • SerialOld

    • 特点:Serial的老年代版本,单线程,使用标记 - 整理算法
  • Parallel Old

    • Parallel Scavenge 的老年代版本,多线成,使用标记 - 整理算法
  • CMS(***)

    • 特点:以最短回收停顿时间为目标,使用标记 - 清除算法

    • 过程:

      • 初始标记:stop the world 标记 GC Roots 能直接关联到的对象

      • 并发标记:进行 GC Roots Tracing

      • 重新标记:stop the world;修正并发标记期间因用户程序继续运作而导致标记产生变动的 那一部分对象的标记记录

      • 并发清除:清除对象

    • 优点:并发收集,低停顿

    • 缺点:

      • CPU资源敏感

      • 无法处理浮动垃圾(并发清除 时,用户线程仍在运行,此时产生的垃圾为浮动垃圾)

      • 产生大量的空间碎片

  • **G1(*****)

    • 特点:面向服务端应用,将整个堆划分为大小相同的 region

      • 并行与并发

      • 分代收集

      • 空间整合:从整体看是基于 “标记 - 整理” 的,从局部(两个 region之间)看是基于 “复制” 的。

      • 可预测的停顿:使用者可明确指定在一个长度为 M 毫秒的时间片段内,消耗在垃圾收集上的时间不得超过 N 毫秒。

    • 执行过程:

      • 初始标记:stop the world 标记 GC Roots 能直接关联到的对象

      • 并发标记:可达性分析

      • 最终标记:修正在并发标记期间因用户程序继续运作而导致标记产生变动的那一部分标记记录

      • 筛选回收:筛选回收阶段首先对各个 Region的回收价值和成本进行排序,根据用户所期望的 GC停顿时间来制定回收计划

CMS 收集器,CMS(Concurrent Mark Sweep)收集器是一种以获取最短回收停顿时间为目标的收集器。它需要消耗额外的 CPU 和内存资源,在 CPU 和内存资源紧张,CPU 较少时,会加重系统负担。CMS 无法处理浮动垃圾。CMS 的 “标记 - 清除” 算法,会导致大量空间碎片的产生

G1 收集器,G1 (Garbage-First) 是一款面向服务器的垃圾收集器,主要针对配备多颗处理器及大容量内存的机器. 以极高概率满足 GC 停顿时间要求的同时,还具备高吞吐量性能特征

GC 自适应调节策略 Parallel Scavenge 收集器有一个参数 - XX:+UseAdaptiveSizePolicy。当这个参数打开之后,就不需要手工指定新生代的大小、Eden 与 Survivor 区的比例、晋升老年代对象年龄等细节参数了,虚拟机会根据当前系统的运行情况收集性能监控信息,动态调整这些参数以提供最合适的停顿时间或者最大的吞吐量,这种调节方式称为 GC自适应的调节策略(GC Ergonomics)。