009-深入理解垃圾回收机制
in 003-性能优化 with 0 comment

009-深入理解垃圾回收机制

in 003-性能优化 with 0 comment

1. Garbage Collect(垃圾回收)

之前说堆内存中有垃圾回收,比如Young区的Minor GC,Old区的Major GC,Young区和Old区的Full GC。

但是对于一个对象而言,怎么确定它是垃圾?是否需要被回收?怎样对它进行回收?等等这些问题我们还需要详细探索。

因为Java是自动做内存管理和垃圾回收的,如果不了解垃圾回收的各方面知识,一旦出现问题我们很难进行排查和解决,
自动垃圾回收机制就是寻找Java堆中的对象,并对对象进行分类判别,寻找出正在使用的对象和已经不会使用的对象,
然后把那些不会使用的对象从堆上清除。

1.1 如何确定一个对象是垃圾?

要想进行垃圾回收,得先知道什么样的对象是垃圾。

1.1.1 引用计数法

引用计数算法:给对象中添加一个引用计数器,每当有一个地方引用它时,计数器值加1;当引用失效时,计数器值减1.任何时刻计数器值为0的对象就是不可能再被使用的

对于某个对象而言,只要应用程序中持有该对象的引用,就说明该对象不是垃圾,如果一个对象没有任何指针对其引用,它就是垃圾
弊端 :如果AB相互持有引用,导致永远不能被回收。
image.png

1.2 可达性分析算法

通过GC Root的对象,开始向下寻找,看某个对象是否可达

能作为GC Root:类加载器、Thread、虚拟机栈的本地变量表、static成员、常量引用、本地方法栈的变量等。

虚拟机栈(栈帧中的本地变量表)中引用的对象。
方法区中类静态属性引用的对象。
方法区中常量引用的对象。
本地方法栈中JNI(即一般说的Native方法)引用的对象。

image.png

1.2 垃圾收集算法

1.2.1 标记-清除(Mark-Sweep)

此时堆中所有的对象都会被扫描一遍,从而才能确定需要回收的对象,比较耗时

image.png

清除掉被标记需要回收的对象,释放出对应的内存空间

image.png
应用场景
该算法一般应用于老年代,因为老年代的对象生命周期比较长。

优点

缺点

1.2.2 复制(Copying)

将内存划分为两块相等的区域,每次只使用其中一块,如下图所示:

image.png

当其中一块内存使用完了,就将还存活的对象复制到另外一块上面,然后把已经使用过的内存空间一次清除掉。
image.png

优缺点

1.2.3 标记-整理(Mark-Compact)

复制收集算法在对象存活率较高时就要进行较多的复制操作,效率将会变低。更关键的是,如果不想浪费50%的空间,就需要有额外的空间进行分配担保,以应对被使用的内存中所有对象都有100%存活的极端情况,所以老年代一般不能直接选用这种算法。

标记过程仍然与"标记-清除"算法一样,但是后续步骤不是直接对可回收对象进行清理,而是让所有存活的对象都向一端移动,然后直接清理掉端边界以外的内存。

其实上述过程相对"复制算法"来讲,少了一个"保留区"

image.png
让所有存活的对象都向一端移动,清理掉边界以外的内存。
image.png
优缺点

1.2.4 分代收集算法

既然上面介绍了3中垃圾收集算法,那么在堆内存中到底用哪一个呢?

Young区:复制算法(对象在被分配之后,可能生命周期比较短,Young区复制效率比较高)
Old区:标记清除或标记整理(Old区对象存活时间比较长,复制来复制去没必要,不如做个标记再清理)

1.3 垃圾收集器

如果说收集算法是内存回收的方法论,那么垃圾收集器就是内存回收的具体实现。

image.png

1.3.1 Serial收集器(音标[ˈsɪriəl])

Serial收集器是最基本、发展历史最悠久的收集器,曾经(在JDK1.3.1之前)是虚拟机新生代收集的唯一选择。
它是一种单线程收集器,不仅仅意味着它只会使用一个CPU或者一条收集线程去完成垃圾收集工作,更重要的是其在进行垃圾收集的时候需要暂停其他线程。
image.png

优点:简单高效,拥有很高的单线程收集效率
缺点:收集过程需要暂停所有线程
算法:复制算法
适用范围:新生代
应用:Client模式下的默认新生代收集器
通过JVM参数-XX:+UseSerialGC可以使用串行垃圾回收器。

1.3.2 ParNew收集器

可以把这个收集器理解为Serial收集器的多线程版本。新生代并行,老年代串行
image.png

优点:在多CPU时,比Serial效率高。
缺点:收集过程暂停所有应用程序线程,单CPU时比Serial效率差。
算法:复制算法
适用范围:新生代
应用:运行在Server模式下的虚拟机中首选的新生代收集器
-XX:+UseParNewGC ParNew收集器
-XX:ParallelGCThreads 限制线程数量

1.3.3 Parallel Scavenge收集器(音标[ˈpærəlel] [ˈskævɪndʒ])

Parallel Scavenge收集器是一个新生代收集器,它也是使用复制算法的收集器,又是并行的多线程收集器,看上去和ParNew一样,但是Parallel Scanvenge更关注系统的吞吐量

吞吐量=运行用户代码的时间/(运行用户代码的时间+垃圾收集时间)
比如虚拟机总共运行了100分钟,垃圾收集时间用了1分钟,吞吐量=(100-1)/100=99%
吞吐量越大,意味着垃圾收集的时间越短,则用户代码可以充分利用CPU资源,尽快完成程序的运算任务。

-XX:MaxGCPauseMillis 控制最大的垃圾收集停顿时间,
-XX:GCTimeRatio 直接设置吞吐量的大小。

1.3.4 Serial Old收集器

Serial Old收集器是Serial收集器的老年代版本,也是一个单线程收集器,不同的是采用标记-整理算法,运行过程和Serial收集器一样。
image.png

1.3.5 Parallel Old收集器(音标[ˈpærəlel])

Parallel Old收集器是Parallel Scavenge收集器的老年代版本使用多线程和标记-整理算法进行垃圾回收。

吞吐量优先
-XX:+UseParallelOldGC 指定使用Parallel Old收集器

1.3.6 CMS收集器

CMS(Concurrent Mark Sweep)收集器是一种以获取 最短回收停顿时间 为目标的收集器。
采用的是"标记-清除算法",整个过程分为4步

(1)初始标记 CMS initial mark                标记GC Roots能关联到的对象 Stop The World--->速度很快
(2)并发标记 CMS concurrent mark        进行GC Roots Tracing
(3)重新标记 CMS remark                      修改并发标记因用户程序变动的内容 Stop The World
(4)并发清除 CMS concurrent sweep

由于整个过程中,并发标记和并发清除,收集器线程可以与用户线程一起工作,所以总体上来说,CMS收集器的内存回收过程是与用户线程一起并发地执行的。

image.png

优缺点

JVM参数 -XX:+UseConcMarkSweepGC设置

1.3.7 G1收集器

G1收集器在JDK 7正式作为商用的收集器。与前几个收集器相比,G1有以下特点:

使用G1收集器时,Java堆的内存布局与就与其他收集器有很大差别,它将整个Java堆划分为多个大小相等的独立区域(Region),虽然还保留有新生代和老年代的概念,但新生代和老年代不再是物理隔离的了,它们都是一部Region(不需要连续)的集合。

image.png

初始标记(Initial Marking)                                 标记一下GC Roots能够关联的对象,并且修改TAMS的值,需要暂停用户线程
并发标记(Concurrent Marking)                          从GC Roots进行可达性分析,找出存活的对象,与用户线程并发执行
最终标记(Final Marking)                                   修正在并发标记阶段因为用户程序的并发执行导致变动的数据,需暂停用户线程
筛选回收(Live Data Counting and Evacuation)  对各个Region的回收价值和成本进行排序,根据用户所期望的GC停顿时间制定
回收计划

image.png

JVM参数 -XX:+UseG1GC 使用G1垃圾回收器

1.3.8 垃圾收集器分类

1.3.9 吞吐量和停顿时间

停顿时间越短就越适合需要和用户交互的程序,良好的响应速度能提升用户体验;

高吞吐量则可以高效地利用CPU时间,尽快完成程序的运算任务,主要适合在后台运算而不需要太多交互的任务。

小结 :这两个指标也是评价垃圾回收器好处的标准,其实调优也就是在观察者两个变量

1.3.10 如何选择合适的垃圾收集器

官网

1.3.11 再次理解G1

JDK 7开始使用,JDK 8非常成熟,JDK 9默认的垃圾收集器,适用于新老生代。

是否使用G1收集器?

(1)50%以上的堆被存活对象占用
(2)对象分配和晋升的速度变化非常大
(3)垃圾回收时间比较长

1.3.12 如何开启需要的垃圾收集器

这里JVM参数信息的设置大家先不用关心,下一章节会学习到。

(1)串行
	-XX:+UseSerialGC
	-XX:+UseSerialOldGC
(2)并行(吞吐量优先):
	-XX:+UseParallelGC
	-XX:+UseParallelOldGC
(3)并发收集器(响应时间优先)
	-XX:+UseConcMarkSweepGC
	-XX:+UseG1GC