垃圾收集器与内存分配策略
对象是否死亡
判断对象是否已死亡有两种方法,一种是引用计数法,另一种是可达性分析.
引用计数法
给对象添加一个引用计数器,每当有一个地方引用它时,计数器值就加1;当引用失效时,计数器值就减1.但是这种方法不能解决对象之间循环引用的问题.
可达性分析
通过一系列的称为“GC ROOT”的对象为起始点,从这些结点开始向下搜索,搜索走过的路径称为引用链,当一个对象到GC Roots没有任何引用链相连时,则证明这个对象是不可用的.
Java中,可作为GC Roots的对象包括:
- 虚拟机栈(栈帧中的本地变量表)中引用的对象
- 方法区中静态属性引用的对象
- 方法区中常量引用的对象
- 本地方法栈中JNI引用的对象
引用
Java中对引用的定义很传统:如果reference类型的数据中存储的数值代表的是另外一块内存的起始地址,就称这块内存代表着一个引用。但是我们希望描述这样一类对象:当内存空间还足够时,则能保留在内存中,如果内存空间在进行垃圾收集后还是很紧张,则可以抛弃这些对象。
引用分为以下几种:
强引用:在程序代码中普遍存在的,类似”Object obj = new Object()“这类的引用,只要强引用还存在,垃圾收集器永远不会回收掉被引用的对象。
软引用:描述一些有用但非必须的对象。对与软引用关联着的对象,在系统将要发生内存溢出异常之前,将会把这些对象列进回收范围之中进行二次回收。如果这次回收还没有足够的内存,才抛出内存溢出异常。
弱引用:描述非必须对象,但是它的强度比软引用更弱一些,被弱引用关联的对象只能生存到下次垃圾收集发生之前。当垃圾收集器工作时,无论当前内存是否足够,都会回收掉只被弱引用关联的对象。
虚引用:最弱的一种引用关系。一个对象是否有虚引用的存在,完全不会对其生存时间构成影响,也无法通过虚引用来取得一个对象示例。为一个对象设置虚引用关联的唯一目的在于这个对象被收集器回收时收到一个系统通知。
生存还是死亡
真正宣告一个对象死亡,至少要经历两次标注过程:如果对象在进行可达性分析后没有发现GC Roots相连结的引用链,那么它将会被第一次标记并且进行一次筛选,筛选的条件是次对象是否有必要执行finalize()方法。当对象没有覆盖finalize()方法,或者finalize()方法已经被调用过,虚拟机将这两种情况视为“没有必要执行”。
如果这个对象被判定为有必要执行finalize()方法,那么这个对象将会被放置在一个叫做F-Queue的队列中,并在稍后由一个虚拟机自动建立的、低优先级的Finalizer线程去执行。
GC将对F-Queue中的对象进行第二次小规模标记,如果对象要在finalize方法中成功拯救自己-只要重新与引用链上的任何一个对象关联即可,譬如把自己复制给某个类变量或者对象的成员变量,那么在第二次标记时它将被移除出“即将回收集合”;如果对象这时候还没有逃脱,那基本上就真的会被回收了。
回收方法区
永久代垃圾回收主要回收:废弃常量和无用的类。判断无用的类条件:
- 该类的所有实例都已经被回收,也就是Java堆中不存在该类的任何实例
- 加载该类的ClassLoader已经被回收
- 该类对应的java.lang.Class对象没有任何地方被引用,无法在任何地方通过反射访问该类的方法。
垃圾收集算法
标记清除算法
最基础的算法,分为两个阶段:标记和清除。首先标记出所有需要回收的对象,在标记完成后统一回收所有被标记的对象。
不足之处:一是效率问题,标记和清除两个过程的效率不高;另一个是空间问题,标记清除后产生大量不连续的内存碎片,空间碎片太多可能会导致以后在程序中需要分配较大对象时,无法找到足够的连续内存而不得不提前触发另一次垃圾收集动作。
复制算法
为了解决效率问题而产生,将可用内存分为大小相等的两块,每次只用其中的一块。当这一块内存用完了,就将还存活的对象复制到另外一块,然后把已使用过的内存空间清理一次。但是这种算法的代价是内存缩小为了原来的一半。
现在的商业虚拟机都采用这种收集算法来回收新生代,将内存分为一块较大的Eden空间和两块较小的Survivor空间,每次使用Eden和其中一块Survivor。当回收时,将Eden和Survivor中还存活的对象一次性地复制到另外一块Survivor空间上,最后清理掉Eden和刚才用过的Survivor空间。
标记整理算法
复制算法在对象存活率较高时要进行较多的复制操作,效率降低另外,如果不想浪费50%的空间,就要分配额外空间进行分配担保,以应对被使用内存中所有对象都100%存活的极端情况,。所以老年代一般不能直接选用这种算法。
标记过程不变,然后让所有存活的对象都向一端移动,然后直接清理掉边界以外的内存。
分代收集
把Java堆划分为新生代和老年代。新生代使用标记复制算法,老年代使用标记清理或者标记整理算法。
垃圾收集器
Serial收集器
单线程收集器,只会开一个收集线程去完成垃圾收集工作,而且在进行垃圾收集时,必须暂停其他所有工作线程,直到收集结束。目前是虚拟机运行在Client模式下的默认新生代收集器。优点:简单高效,没有线程交互开销,可以获得最高单线程效率。
ParNew收集器
是Serial收集器的多线程版本,除了使用多条线程进行垃圾收集外,其余与Serial完全一样。
是Server模式下的虚拟机中首选的新生代收集器,除了Serial收集器外,目前它只能与CMS收集器配合工作。
Parallel Scavenge收集器
Parallel Scavenge收集器是一个新生代收集器,也是使用复制算法的收集器。它的目标是达到一个可控制的吞吐量,所谓吞吐量就是CPU用于执行用户代码的时间与CPU总消耗时间的比值,即吞吐量=运行用户代码时间/(运行用户代码时间+垃圾回收时间)
Serial Old收集器
Serial Old是Serial收集器的老年代版本,同样是单线程收集器,使用“标记-整理”算法,主要给Client模式下的虚拟机使用。
它有两大用途:
- 在JDK 1.5以及之前版本中与Parallel Scavenge收集器搭配使用
- 作为CMS收集器的后备使用方案,在并发收集发生Concurrent Mode Failure时使用。
Parallel Old收集器
Parallel Old 是Parallel Scavenge收集器的老年代版本,使用多线程和“标记-整理”算法。在注重吞吐量和CPU资源的敏感的场景,可以优先考虑Parallel Scavenge和Parallel Old收集器
CMS收集器
CMS(Concurrent Mark Sweep)收集器是以获取最短回收停顿时间为目标的收集器。服务端一般比较重视响应速度,使用CMS收集器非常符合要求。
CMS收集器基于“标记-清除”算法实现,整个过程分为4个步骤:
- 初始标记:需要stop the work,仅标记一下GC Roots能直接关联的对象,速度很快;
- 并发标记: 需要stop the work,GC Roots tracing过程;
- 重新标记:为了修正并发标记期间因用户程序继续运作导致标记产生变动的那部分对象标记录;
- 并发清除
CMS优点:并发收集、低停顿。
缺点:
对CPU资源十分敏感,虽然重新标记和并发清除不需要停止用户线程,但是会占用CPU资源,导致吞吐量降低
无法处理浮动垃圾,CMS并发清理阶段用户线程还在运行,伴随程序运行自然还会有新的垃圾不断产生,这部分垃圾出现在标记过程之后,CMS无法在当次收集中处理掉他们,只好留到下一次垃圾收集再清理,这一部分垃圾被称为“浮动垃圾”。
采用“标记-清除”算法,会产生大量内存碎片
G1收集器
G1(garbage first)是一款面向服务端应用的垃圾收集器
- 并发与并行:G1可以使用多个CPU来缩短Stop The World停顿的时间,并且让Java程序不中断执行
- 分代收集:可以独立管理整个堆
- 空间整合:整体上看是“标记-整理”算法实现的收集器,从局部看是基于“复制”算法实现的。其运行期间不会产生空间碎片。
- 可预测停顿:G1除了追求低停顿外,还能建立可预测的停顿时间模型,能够让使用者明确指定在一个长度为M毫秒的时间片段内,消耗在垃圾收集上的时间不得超过N毫秒。
使用G1收集器时,Java堆的内存布局与其他收集器有很大差别。它将整个Java堆分为大小相等的独立区域Region。
emsp;emsp;G1能够预测停顿时间是因为:G1可以有计划地避免在整个Java堆中进行全区域的垃圾收集。它可以跟踪各个Region里面的垃圾堆积的价值大小(回收所获得的空间大小及回收所需时间的经验值),在后台维护一个优先列表,每次根据允许的收集时间,优先回收价值最大的region。这种使用region划分内存空间以及有优先级的区域回收方式,保证了G1收集器可以在有限的时间里获得尽可能高的效率。
内存分配与回收策略
对象优先在Eden分配
对象在新生代Eden区中分配,当Eden区中没有足够空间进行分配时,虚拟机将发起一次Minor GC。
大对象直接进入老年代
大对象是指需要内存连续空间的Java对象,最典型的大对象就是长字符串和数组。
长期存活的对象直接进入老年代
虚拟机给每个对象定义了一个对象年龄计数器,如果对象在Eden出生并且经过第一次Minor GC后仍然存活,并且能被Survivor容纳的话,将被移动到Survivor空间,并且对象年龄设为1。对象在Survivor区中每经过一次Minor GC,年龄就加1岁,当年龄增加之一定程度(默认是15岁),就会被移动到老年代中。
动态对象年龄判定
为了更好地适应不同程序的内存情况,虚拟机并不是永远地要求对象的年龄必须达到设置的年龄才进入老年代。如果在Survivor空间中相同年龄所有对象大小的总和超过Survivor空间的一半,年龄大于等于该年龄的对象就可以直接进入老年代。
空间分配担保
在发生Minor GC之前,虚拟机会检查老年代最大可用的连续空间是否大于新生代所有对象空间的总和,如果这个条件成立,那么Minor GC可以确保是线程安全的,如果不成立则虚拟机会查看是否允许担保失败,若允许,那么会继续检查老年代最大可用的连续空间是否大于历次晋升到老年代对象的平均大小,如果大于将尝试进行一次Minor GC,如果小于就会进行一次Full GC。