Java之GC机制
1 JVM基本结构
1)类加载器classLoader:在JVM启动时或者类运行时将需要的.class文件加载到内存中
2)内存区域(运行时数据区): 是在JVM运行的时候操作所分配的内存区
3)执行引擎:负责执行class文件中包含的字节码指令
4)本地方法接口:主要是调用C/C++实现的本地方法及返回结果
2 JVM内存结构
1 ) 方法区:用于存储类结构信息的地方,包括常量池、静态变量、构造函数等。
2) Java堆(heap):存储Java实例或者对象的地方。这块是gc的主要区域
3) Java栈(stack):Java栈总是和线程关联的,每当创建一个线程时,JVM就会为这个线程创建一个对应的Java栈。在这个java栈中又会包含多个栈帧,每运行一个方法就创建一个栈帧,用于存储局部变量表、操作栈、方法返回值等。每一个方法从调用直至执行完成的过程,就对应一个栈帧在java栈中入栈到出栈的过程。所以java栈是线程私有的。
4)程序计数器:用于保存当前线程执行的内存地址,由于JVM是多线程执行的,所以为了保证线程切换回来后还能恢复到原先状态,就需要一个独立的计数器,记录之前中断的地方,可见程序计数器也是线程私有的
5)本地方法栈:和Java栈的作用差不多,只不过是为JVM使用到的native方法服务的
3 Java对象引用
Java对象的引用可以分为4类:强引用、软引用、弱引用和虚引用。
1)强引用:通常可以认为是通过new出来的对象,即使内存不足,GC进行垃圾收集的时候也不会主动回收。
Object obj = new Object();
2)软引用:在内存不足的时候,GC进行垃圾收集的时候会被GC回收
Object obj = new Object();
SoftReference<Object> softReference = new SoftReference<>(obj);
3)弱引用:无论内存是否充足,GC进行垃圾收集的时候都会回收
Object obj = new Object();
WeakReference<Object> weakReference = new WeakReference<>(obj);
4)虚引用:和弱引用类似,主要区别在于虚引用必须和引用队列一起使用
Object obj = new Object();
ReferenceQueue<Object> referenceQueue = new ReferenceQueue<>();
PhantomReference<Object> phantomReference = new PhantomReference<>(obj, referenceQueue);
引用队列:如果软引用和弱引用被GC回收,JVM就会把这个引用加到引用队列里,如果是虚引用,在回收前就会被加到引用队列里。
4 GC机制
垃圾收集器一般完成两件事->检测出垃圾->回收垃圾
1) 对象的年龄相关知识
对象的年龄,如果在一次垃圾回收过程中有使用该对象的,则将对象年龄加1,否则减1,当计数为0,则进行回收,如果年龄达到一定数字则进入老生代。总的来说内存分配机制主要体现在对象创建之后是否仍在使用,已经不使用的则回收,继续使用的则对其年龄进行更新,达到一定程度,转移到年老代。
下图所示是堆中内存分配示意图,创建一个对象,首先会在eden区域分配区域,如果内存不够,就会将年龄大的转移到Survivor区,当survivor区域存储不下,则会转移年老代的。对于一些静态变量不需要使用对象,直接调用的,则会被放入永生代。一般来说长期存活的对象最终会被存放到年老代,还有一种特殊情况也会被存放到年老代,就是创建大对象时,比如数据这种需要申请连续空间的,如果空间比较大的,则会直接进入年老代
2) 垃圾检测方法
- 引用计数法:给每个对象添加引用计数器,每个地方引用它,计数器就+1,失效时-1。如果两个对象互相引用时,就导致无法回收
- 可达性分析算法:以根集对象为起始点进行搜索,如果对象不可达的话就是垃圾对象。根集(Java栈中引用的对象、方法区中常量池中引用的对象、本地方法中引用的对象等。JVM在垃圾回收的时候,会检查堆中所有对象是否被这些根集对象引用,不能够被引用的对象就会被垃圾回收器回收。)
3) 垃圾回收算法
标记-清除:首先标记所有需要回收的对象,在标记完成之后统计回收所有被标记的对象,它的标记过程即为上面的可达性分析算法,清除所有被标记的对象,缺点:效率不足,标记和清除效率都不高,空间问题,标记清除之后会产生大量不连续的内存碎片,导致大对象分配无法找到足够的空间,提前进行垃圾回收。
- 复制算法:复制算法将可用的内存分成两份,每次使用其中一块,当这块回收之后把未回收的复制到另一块内存中,然后把使用的清除。这种算法运行简单,解决了标记-清除算法的碎片问题,但是这种算法代价过高,需要将可用内存缩小一半,对象存活率较高时,需要持续的复制工作,效率比较低 优点:保证了空间的连续性,又避免了大量的内存空间浪费.
- 标记-整理算法:标记过程与标记-清除的标记一样,但后续不是对可回收对象进行清理,而是让所有的对象都向一端移动,然后直接清理掉端边界以外的内存。样既可以避免不连续空间出现,还可以避免对象存活率较高时的持续复制。这种算法适合老生代。
- 分代收集算法: 分代收集算法就是目前虚拟机使用的回收算法,它解决了标记整理不适用于老年代的问题,将内存分为各个年代,在不同年代使用不同的算法,从而使用最合适的算法,新生代存活率低,可以使用复制算法。而老年代对象存活率高,没有额外空间对它进行分配担保,所以使用标记整理算法