Java随想录
CSDN: 码农BookSea
在堆里面存放着Java世界中几乎所有的对象实例,垃圾收集器在对堆进行回收前,第一件事情就是要确定这些对象之中哪些还“存活”着,哪些已经“死去”(“死去”即不可能再被任何途径使用的对象)了。
引用计数算法
这种算法的工作原理是这样的:在对象中添加一个引用计数器,每当有一个地方引用它时,计数器值就加一;当引用失效时,计数器值就减一;任何时刻计数器为零的对象就是不可能再被使用的。客观的说,引用计数算法虽然占用了一些额外的内存空间来计数,但原理简单,效率也很高,但是目前主流的Java虚拟机里面都没有选用引用计数法来进行内存管理,主要原因是,引用计数算法很难解决对象之间相互循环引用的问题。
public class MyObject {
public Object ref = null;
public static void main(String[] args {
MyObject myObject1 = new MyObject(;
MyObject myObject2 = new MyObject(;
myObject1.ref = myObject2;
myObject2.ref = myObject1;
myObject1 = null;
myObject2 = null;
}
}
myObject1和myObject2这两个对象再无任何引用,实际上这两个对象已经不可能再被访问,但是它们因为互相引用着对方,导致它们的引用计数都不为零,引用计数算法也就无法回收它们,这就是循环引用问题。
可达性分析算法。
可达性分析算法
GC Roots的根对象作为起始节点集,从这些节点开始,根据引用关系向下搜索,搜索过程所走过的路径称为引用链(Reference Chain)
,如果某个对象到GC Roots间没有任何引用链相连,或者用图论的话来说就是从GC Roots到这个对象不可达时,则证明此对象是不可能再被使用的。
在Java技术体系里面,固定可以作为GC Roots的对象包括以下几种
- 在虚拟机栈(栈中 的本地变量表)中引用的对象,例如各个线程被调用的方法堆栈中使用到的参数、局部变量、临时变量等。
- 在方法区中常量引用的对象,例如字符串常量池(String Table)里的引用。
- 在本地方法栈中JNI(本地方法)引用的对象。
- Java虚拟机内部的引用,如基本数据类型对应的Class对象,一些常驻的异常对象(NullPointException、OutOfMemoryError)等,以及系统类加载器。
- 所有被同步锁(synchronized)持有的对象。
- 反映Java虚拟机内部情况的JMXBean、JVMTI中注册的回调、本地代码缓存等。
根节点枚举这一步骤时都是必须暂停用户线程的,这里面细讲东西很多,先埋个坑,之后出篇文章来讲根节点枚举。
引用类型
强引用(Strongly Re-ference)、软引用(Soft Reference)
、弱引用(Weak Reference)
和虚引用(Phantom Reference)
4种,这4种引用强度依次逐渐减弱。
- 强引用是最传统的“引用”的定义,是指在程序代码之中普遍存在的引用赋值,即类似
- 软引用是用来描述一些还有用,但非必须的对象。只被软引用关联着的对象,在系统将要发生内存溢出异常前,会把这些对象列进回收范围之中进行第二次回收,如果这次回收还没有足够的内存,才会抛出内存溢出异常。在JDK 1.2版之后提供了SoftReference类来实现软引用。
- 弱引用也是用来描述那些非必须对象,但是它的强度比软引用更弱一些,被弱引用关联的对象只能生存到下一次垃圾收集发生为止。当垃圾收集器开始工作,无论当前内存是否足够,都会回收掉只被弱引用关联的对象。在JDK 1.2版之后提供了WeakReference类来实现弱引用。
- 虚引用也称为“幽灵引用”或者“幻影引用”,它是最弱的一种引用关系。一个对象是否有虚引用的存在,完全不会对其生存时间构成影响,也无法通过虚引用来取得一个对象实例。为一个对象设置虚引用关联的唯一目的只是为了能在这个对象被收集器回收时收到一个系统通知。在JDK 1.2版之后提供了PhantomReference类来实现虚引用。
Object obj=new Object(
这种引用关系。无论任何情况下,只要强引用关系还存在,垃圾收集器就永远不会回收掉被引用的对象。
总结一句话就是:强引用内存不足也不会回收,软引用内存不足才回收,弱引用和虚引用看见就回收。
Dead Or Alive
缓刑”阶段,要真正宣告一个对象死亡,至少要经历两次标记过程:
那它将会被第一次标记,随后进行一次筛选,筛选的条件是此对象是否有必要执行finalize(方法。假如对象没有覆盖finalize(方法,或者finalize(方法已经被虚拟机调用过,那么虚拟机将这两种情况都视为“没有必要执行”。
如果这个对象被判定为确有必要执行finalize(方法,那么该对象将会被放置在一个名为F-Queue
的队列之中,并在稍后由一条由虚拟机自动建立的、低调度优先级的Finalizer线程去执行它们的finalize(方法。
finalize(方法执行缓慢,或者更极端地发生了死循环,将很可能导致F-Queue
队列中的其他对象永久处于等待,甚至导致整个内存回收子系统的崩溃。finalize(方法是对象逃脱死亡命运的最后一次机会,稍后收集器将对F-Queue中的对象进行第二次小规模的标记,如果对象要在finalize(中成功拯救自己——只要重新与引用链上的任何一个对象建立关联即可,譬如把自己(this关键字)赋值给某个类变量或者对象的成员变量,那在第二次标记时它将被移出“即将回收”的集合;如果对象这时候还没有逃脱,那基本上它就真的要被回收了。
我只能救你一次,剩下的就靠你自己了。
总结一下,就是finalize(这个方法并没什么卵用。
永久代真的"永久"吗?
但其实方法区是可以被回收的,只不过回收的判定条件过于苛刻,垃圾收集的成果很差。
并不是名字叫永久代就真的"永久"了。
废弃的常量和不再使用的类型。
不再被使用的类”的条件就比较苛刻了。需要同时满足下面三个条件:
- 该类所有的实例都已经被回收,也就是Java堆中不存在该类及其任何派生子类的实例。
- 加载该类的类加载器已经被回收,这个条件除非是经过精心设计的可替换类加载器的场景,如OSGi、JSP的重加载等,否则通常是很难达成的。
- 该类对应的
java.lang.Class
对象没有在任何地方被引用,无法在任何地方通过反射访问该类的方法。
-Xnoclassgc参数进行控制。
也就说如果没有开启这项参数支持类型的卸载,哪怕满足了所有条件,也不会进行类型的卸载。
垃圾收集算法
标记-清除算法
首先标记出所有需要回收的对象,在标记完成后,统一回收掉所有被标记的对象,也可以反过来,标记存活的对象,统一回收所有未被标记的对象。
-
缺点:标记-清除算法主要缺点有两个。第一个是执行效率不稳定,如果Java堆中包含大量对象,而且其中大部分是需要被回收的,这时必须进行大量标记和清除的动作;第二个是内存空间的碎片化问题,标记、清除之后会产生大量不连续的内存碎片,空间碎片太多可能会导致当以后在程序运行过程中需要分配较大对象时无法找到足够的连续内存而不得不提前触发另一次垃圾收集动作。
优点:不需要进行对象的移动,在存活对象比较多的情况下非常高效。
后续的收集算法大多都是以标记-清除算法为基础,对其缺点进行改进而得到的。
标记-复制算法
标记-清除算法面对大量可回收对象时执行效率低的问题,1969年Fenichel提出了一种称为“半区复制”(Semispace Copying)的垃圾收集算法,它将可用内存按容量划分为大小相等的两块,每次只使用其中的一块。当这一块的内存用完了,就将还存活着的对象复制到另外一块上面,然后再把已使用过的内存空间一次清理掉。
-
缺点:代价是将可用内存缩小为了原来的一半。
优点:实现简单;内存回收时不用考虑内存碎片的出现。
标记-整理算法
标记-复制算法在对象存活率较高时就要进行较多的复制操作,效率将会降低。更关键的是,如果不想浪费50%的空间,就需要有额外的空间进行分配担保,以应对被使用的内存中所有对象都100%存活的极端情况,所以在老年代一般不能直接选用这种算法。针对老年代对象的存亡特征,1974年Edward Lueders提出了另外一种有针对性的“标记-整理”(Mark-Compact)算法,其中的标记过程仍然与“标记-清除”算法一样,但后续步骤不是直接对可回收对象进行清理,而是让所有存活的对象都向内存空间一端移动,然后直接清理掉边界以外的内存。
-
优点:经过整理之后,新对象的分配只需要通过指针碰撞便能完成,也解决了内存碎片的问题。
- 缺点:GC 暂停的时间会增长,对象移动的时间成本是十分可观的。
标记-清除 VS 标记-整理
是否移动回收后的存活对象是一项优缺点并存的风险决策。
但如果跟标记-清除
算法那样完全不考虑移动和整理存活对象的话,弥散于堆中的存活对象导致的内存碎片问题就只能依赖更为复杂的内存分配器和内存访问器来解决。譬如通过“分区空闲分配链表”来解决内存分配问题。内存的访问是用户程序最频繁的操作,甚至都没有之一,假如在这个环节上增加了额外的负担,势必会直接影响应用程序的吞吐量。
HotSpot虚拟机里面关注吞吐量的Parallel Scavenge
收集器是基于标记-整理算法的,而关注延迟的CMS
收集器则是基于标记-清除算法的,这也从侧面印证这点。
直到内存空间的碎片化程度已经大到影响对象分配时,再采用标记-整理算法收集一次,以获得规整的内存空间。基于标记-清除算法的CMS收集器采用的就是这种处理办法。
Serial Old收集器来重新进行老年代的垃圾收集,而Serial Old
正是基于标记-整理算法。