# Java GC

# 回收区域

程序计数器、虚拟机栈、本地方法栈 3个区域随线程而生 随线程而灭,
在这几个区域内就不需要过多考虑回收的问题,因为方法结束或者线程结束时,内存自然就跟随着回收了。

栈中的栈帧随着方法的进入和退出就有条不紊的执行者出栈和入栈的操作,
每一个栈分配多少个内存基本都是在类结构确定下来的时候就已经确定了。

这几个区域内存分配和回收都具有确定性。

  • 堆和方法区则不同

一个接口的实现是多种多样的,多个实现类需要的内存可能不一样。
一个方法中多个分支需要的内存也不一样。
我们只能在程序运行的期间知道需要创建那些对象,分配多少内存,这部分的内存分配和回收都是动态的。

# 判断对象存活

  • 引用计数器法

给对象添加一个引用计数器,任何时刻计数器为0的对象就是不可能再被使用的。

  • 可达性分析算法

通过一系列的成为“GC Roots”的对象作为起始点,从这些节点开始向下搜索,搜索所走过的路径成为引用链,
当一个对象到GC ROOTS没有任何引用链相连时,则证明此对象时不可用的。

# GC Roots的对象

虚拟机栈(栈帧中的本地变量表)中引用的对象。
方法区中类静态属性引用的对象。
方法区中常量引用的对象。
本地方法栈JNI(Native方法)引用的对象。

# Java中的四种引用及其应用场景是什么?

  • 强引用
    使用new操作符创建一个对象时所返回的引用即为强引用。

  • 软引用
    若一个对象只能通过软引用到达,那么这个对象在内存不足时会被回收,
    可用于图片缓存中,内存不足时系统会自动回收不再使用的Bitmap。

  • 弱引用
    若一个对象只能通过弱引用到达,那么它就会被回收(即使内存充足)。

  • 虚引用
    虚引用是Java中最“弱”的引用,通过它甚至无法获取被引用的对象,它存在的唯一作用就是当它指向的对象回收时。
    它本身会被加入到引用队列中,这样我们可以知道它指向的对象何时被销毁。

# Finalize方法

任何一个对象的finalize()方法都只会被系统自动调用一次,
如果对象面临下一次回收,它的finalize()方法不会被再次执行,因此第二段代码的自救行动失败了。

# 方法区回收

永久代的垃圾收集主要回收两部分内容。

  • 废弃常量

假如一个字符串“abc”已经进入了常量池中,如果当前系统没有任何一个String对象“abc” 也就是没有任何String对象引用常量池的"abc"常量,也没有其他地方引用的这个字面量,这个时候发生内存回收这个常量就会被清理出常量池。

  • 无用的类

该类所有的实例都已经被回收,就是Java堆中不存在该类的任何实例。
加载该类的ClassLoader已经被回收。
该类对用的java.lang.Class对象没有在任何地方被引用,无法再任何地方通过反射访问该类的方法。

# 垃圾收集算法

  • 标记—清除算法(mark-sweep)

    • 两个阶段
  1. 首先标记出所有需要回收的对象
  2. 在标记完成后统一回收所有被标记的对象。
    • 不足
  1. 效率问题
    标记和清除两个过程的效率都不高

  2. 空间问题
    标记清除之后会产生大量不连续的内存碎片,空间碎片太多可能会导致以后再程序运行过程中需要分配较大的对象时,
    无法找到足够的连续内存而不得不提前触发另一次垃圾收集动作。

  • 复制算法(copying)

将可用内存按照容量划分为大小相等的两块,每次只使用其中的一块 就将还存活着的对象复制到另外一块上面,然后再把已使用过的内存空间一次清理掉 这样使得每次都是对整个半区进行内存回收,内存分配时也就不用考虑内存碎片等复杂情况,只要移动堆顶指针,按顺序分配内存即可。

    • 不足

将内存缩小为了原来的一半。

    • 实际

并不需要按照1:1比例来划分内存空间。
将内存分为一块较大的Eden空间和两块较小的Survivor空间,每次使用Eden和其中一块Survivor。
当另一个Survivor空间没有足够空间存放上一次新生代收集下来的存活对象时,这些对象将直接通过分配担保机制进入老年代。

  • 标记整理算法(mark-compact)

让所有存活的对象都向一端移动,然后直接清理掉端边界以外的内存。

  • 分代收集算法

只是根据对象存活周期的不同将内存划分为几块 一般是把java堆分为新生代和老年代,这样就可以根据各个年代的特点采用最适当的收集算法 在 新生代 中,每次垃圾收集时都发现有大批对象死去,只有少量存活,那就选用 复制算法,只需要付出少量存活对象的复制成本就可以完成收集。 而 老年代 中因为对象存活率高、没有额外空间对它进行分配担保,就必须使用 标记清理 或者 标记整理 算法来进行回收。

# 垃圾收集器

  • Serial 收集器

单线程的收集器 但它的单线程的意义不仅仅说明它会只使用一个CPU或一条收集线程去完成垃圾收集工作 更重要的是它在进行垃圾收集时, 必须暂停其他所有的工作线程 ,直到它收集结束。

  • ParNew 收集器

并行 指多条垃圾收集线程并行工作,但此时 用户线程仍然处于等待状态。

并发 指用户线程与垃圾收集线程同时执行(不一定是并行的,可能会交替执行),用户程序在继续执行,而垃圾收集程序运行于另一个CPU上。

  • Parallel Scavenge

是一个新生代收集器,它是使用 复制算法的收集器 ,又是 并行的多线程收集器 。

  • Serial Old 收集器

Serial收集器的老年代版本,是一个单线程收集器,使用 标记整理算法 。

  • Parallel Old 收集器

Parallel Old是Paraller Seavenge收集器的老年代版本,使用 多线程和标记整理算法 。

  • CMS收集器

    • CMS并非没有暂停

而是用两次短暂停来替代串行标记整理算法的长暂停,是基于 标记清除算法 实现的

    • 收集周期

初始标记(CMS-initial-mark) -> 并发标记(CMS-concurrent-mark) -> 重新标记(CMS-remark) ->
并发清除(CMS-concurrent-sweep) ->并发重设状态等待下次CMS的触发(CMS-concurrent-reset)

    • 4个步骤

1.初始标记
2.并发标记
3.重新标记
4.并发清除

    • 优点

并发收集、低停顿。

    • 缺点 CMS收集器对CPU资源非常敏感,CMS默认启动的回收线程数是(CPU数量+3)/4。
      CMS收集器无法处理浮动垃圾,可能会出现“Concurrent Mode Failure(并发模式故障)”失败而导致Full GC产生。
    • G1

一款面向服务器应用的垃圾收集器:
并行与并发:利用多CPU缩短STOP-The-World停顿的时间 分代收集 空间整合:不会产生内存碎片 可预测的停顿

运作方式:初始标记,并发标记,最终标记,筛选回收。

# 内存分配引发回收的处理策略

MinorGC:清理新生代
MajorGC:清理老年代
FullGC:清理整个堆空间

  • 对象优先在Eden分配

大多数情况对象在新生代Eden区分配,当Eden区没有足够空间进行分配时,虚拟机将发起一次Minor GC。

  • 大对象直接进入老年代

大对象 就是指需要大量连续内存空间的Java对象。
最典型的大对象就是那种很长的字符串以及数组。
这样做的目的是避免Eden区及两个Servivor之间发生大量的内存复制。

  • 长期存活的对象将进入老年代

如果对象在Eden区出生并且经历过一次Minor GC后仍然存活,并且能够被Servivor容纳,将被移动到Servivor空间中,并且把对象年龄设置成为1。
对象在Servivor区中每熬过一次Minor GC,年龄就增加1岁,当它的年龄增加到一定程度(默认15岁),就将会被晋级到老年代中。

  • 动态对象年龄判定

为了更好地适应不同程序的内存状况,虚拟机并不是永远地要求对象的年龄必须达到了MaxTenuringThreshold才能晋级到老年代 如果在Servivor空间中相同年龄所有对象的大小总和大于Survivor空间的一半,
年龄大于或等于该年龄的对象就可以直接进入到老年代,无须登到MaxTenuringThreshold中要求的年龄。

  • 空间分配担保

在发生Minor GC之前,虚拟机会检查老年代最大可用的连续空间是否大于新生代所有对象总空间。
如果这个条件成立,那么Minor GC可以确保是安全的。
如果不成立,则虚拟机会查看HandlePromotionFailure设置值是否允许担保失败 如果允许那么会继续检查老年代最大可用的连续空间是否大于晋级到老年代对象的平均大小 如果大于,将尝试进行一次Minor GC,尽管这次MinorGC 是有风险的 如果小于,或者HandlePromotionFailure设置不允许冒险,那这时也要改为进行一次Full GC。