《包你懂系列》Java 字符串常量池漫游指南(图文并茂)

我是风筝,大众号「古时的风筝」,一个不只要技能的技能大众号,一个在程序圈混迹多年,主业 Java,另外 Python、React 也玩儿的 6 的斜杠开发者。
Spring Cloud 系列文章现已完成,能够到 我的 github 上查看系列完好内容。也能够在大众号内回复y L 7 8 A z 7 Updf」获取我精心制作的 pdf 版完好教程。

字符串问题可谓是 Java 中经久不衰的问题,尤其是字符串常量池经常作为面试题呈现。可即便是看似简单而又经常被提起的问题,还l ; R Z g 6 Q D ;是有很多同学一知半解,看上] , W { u e 7去懂了,仔细分析起来却~ ] h q G j f U有发现不太理解。

布景说明

本文以 JDK 1.8 为评论版别,虽然现在都现已 JDK 14# T x t O + O ^了,奈何咱们还是钟爱 1.8。

一个发问引起的评论

为什么提到字符/ e P _ ! f | 0串常量呢,源于群里为数不多的一个) ; _ B R } = h ?程序员小姐姐的发问。

这本来和字符串常量没有关系,后来,一个; T j 9 P同学说不只是 inT d ? . ( 4 0 s }t ,换成 Stri? q u Ing 相同能, J s v u n够。

为什么会有”Java开发_北京”这么奇特的 H ` d 5 !字符串乱入呢,由于提出问题的这位小姐姐的群昵称叫这个,所以群里的同学恶作剧说,认为她是某b g ? ~ h } , }个房地产大佬,要来开发北京。

] c ) 4 ;上是开个玩笑,好了,收。

字符; u C P o `串用 == 比较也是 true,这就有意思了。立刻有机灵的小伙伴说这和字符串常量池有关系。没错,便是由于字符串常量池的原因。

第一张图其实没什么好说的,在 JR L C ! ) & F T 9DK 1.8 之后现已不允许 Object 和 int 类型用 == 相比较了,编译直接报错。

第二张图中的代码才是, , –要点要说的,咱们能够把它简化成下面这段代码,用 == 符号比较字符串,之后的内容都从7 ! k h z这几行代码动身。

publicstaticvoidmain(String[]args){
Strings1="古时的风筝";
SyX : H =stem.out.println(s1=="古时的g I =风筝");
}

当然,实践开发中强烈不推荐用 == 符号判别两个字s u = s d ]符串J Y ] E l 6 W # 9是否持平,应该用 equals() 办法。

字符串常量池何许人也

为什么要有字符串} ^ T O( h 3 b @量池呢,像其他目标相同直接存在堆中不行吗,这就要问 Java 言语的设计者了,当然,这么做也并不是拍脑袋想出来的。

这就要从字符串说起。

首要目标的分配要付出时间和空间上的开销,字符串能够说是和 8 个根本类型相同常用的类v S A 7 5 ]型,乃至比 8 个根本类型愈加常用,故而频频的创立字符串目标,对功能的影响是非常大的,所以,用常量池的方法能m = 5够很大程度上+ J T降低目标创立、分配的次数,然后3 K m提升功能。

在 JDK 1.7 之后(包含1.7),字符串常量池现已从办法区移到了堆中。

字面量赋值

咱们把上G W u g S + m } 2面的那个实例代码拿过来

Strings1="古时的风筝";

这是咱们平时声明字符串变量的最常用的方法,这种方法叫做字面量声明,也就用把字符串用双引号引起来,然后赋值给一个变量。

这种状况下会直接将字符串放到字1 g # C a + ; Q I符串常量池中y | m r S i ^,然后回来给变量。

那这是我再声明一个内容相同的字符串,会发现字符串常量池中现已存在了,那直接指向常量池中的地址即可。

例如上图所示,声明晰 s1 和f G & R ] 4 n n ) s2,到最后都是指向同一个常量池的地址,所以 s1== s2 的成果是 true。

new String() 方法

与之对应的是用 new String() 的方法,但是根本上不建议Z A j D } = F :这么用,除非有特殊的逻辑需求。

Strings2=newString("古时的风筝3 I u 4 I");

运用这种方法声明字符串变量的时分,会有两种状况发作。

第一种状况,字符串常量池之前现已存在相同字符串

2 k . x d方在运用 new 之前,现已用字面量声明的方C k V g y ! 6 $ ]法声明晰一个变量,此刻字符串常量池中现已存在了相同内容的字符串常量。

  1. 首要会在堆中创立一个 s2 变量的目标引证;
  2. 然后将这个目标引证指向字符串常量p ( B : N池中的现已存在的常量;
第二种状况,字符串常量池中不存在相同内容的常量

之前没有任何地方用到了这个字符串,第一次声M f M明这个字符串就用的是 new String() 的方法,这种状况下会直接在堆7 – K K * T E $ +中创立一个字符串目标然后回来给变! Z ; t量。

我看到很多地方说,假如字符串常量池中不存在的话,就先把字符串先放进去,然后再引证字符串常量池的这个常量目标r 3 g Z,这种说法是有问题的,只是 new String() 的话,假如池中没有也不会放一份进去。

基于 new String() 的这种U O ] Z p特性,咱们能够得出一个定论:

Strings1="古时的风筝";
Strings2=newString( G _ r * @ $ ( l"古时的风筝");
Strings3=newString("古时的风筝");
System.h # g R sout.println(s1==s2);//false
System.out.println(s2==s3);//false

以上代码,肯定输出的都是 false,由于 new String() 不管你常量池中有没有,我都会在1 e ] p D M @ u #堆中新建一个目标,新建出来的目标,当然不会和其他目标持平。

intern() 池化

那什么时分会放到字符串常量池呢,便是在运用 intern() 办法之后。

interR 9 ^ I # 8 q Dn() 的界说:假如当前字符串内容存在于字符串常量池,存在的条件是运用 equas() 办法为ture,也便是内容是相同的,那直接回来此字符串在常L b U v f s量池的引证;假如之前不在字符串常量池中,那么在常量池创立一个引证并且指向堆中已存在的字符串,然后回来常量池中的地址。

第一种状况,准备池化的字符串与字符串常量池m i ( 3中的字符串有相同(equas()判别)
Strings1="古时的风筝";
Strings2={ z W a gnewString("古时的风筝");
s2=s2.intern();

这时,这个字符串常量现已在P c ^ } b常量池存在了,这时,再 new 了一个新的目标+ i L f Y g C s2,并在堆中创立了一个相同字C ~ s符串内容的目标。

这时,s1 == s2 会回来 fasle。然后咱们调用 sD . Q ; + 7 j i e2 = s2.intern(),将池化操作回来的成果赋值给 s2,就会发作如下的变] ! [ K 5化。

此刻,; 9 M Z 再次判别 s1 == s2 ,就会回来 true,由于它们都指) P | } ! F I –向了字符串常量池的同一个字符串。

第二种状况,字符串常量池中不存在相y X 0 e 4 ;同内容的字符串

运用 new String() 在堆中创立了一个字符串目标

运用了 intern() 之后发作了什么呢,在常量池新增了一个目标,但是 并没有 将字符串仿制一份到常量池,而是直接指向了之前现已存在于堆中的字符串目标。由于在 JDK 1.7 之后,字符串常量池不一定便是; w –存字符串目标的,还有可能存储的是一个指向堆中地址的引证,现在说的便是这种状况,注意了,下图是只调用了 s2.intern(),并没有回来给一个变量。其中字符串常量池(0x88)指向堆中字符串目标(0x99)便是intern() 的进程。

只要当咱们把 s2.intern() 的成果回来给 s2 时,s2 才真正的指向[ * i d 6 n h H #字符串常量池。

我理解了

经过以上的介绍,咱们来看下面的一段代码回来的成果是什么

publicc2 0 ) W 3 H [lassTest{

publicstaticvoidmain(String[]args){
Strings1="古时的风筝";
Stringt - g 4 a P D Xs2="古时的风筝";
Stringo # % W H T c x us3=newStrF I jing("古时的风筝");
Strings4=newString("古时的风筝");
System.out.println(s1==s2)J V N u 4;//【1】true
System.out.println(s2==s3J Y F);//【2】false
System.o2 ? % Y ?ut.println(s3==s4)h y P;//【3】false
s3.inte$ , B n X H crr q L b A 2n();
System.out.printF q @ + z _ p + (ln(i ; D a S / M 4s2==s3);//【4】false
s3=s3.intern();
System.out.println(s2==s3);//【5】true
s4=s4.intern();
System.out.println(s33 E C S K f S n==s4);//【6】true
}
}

【1】:s1 == s2 回来 ture,由于都是字面量声明,全都指向字符串常量池中同一字符串。

【2】: s2 == s3 回来 false,由于 new String()~ & ! a p 是在堆中新建目标,所以和常量池的常量不相同& b _ F ) q 9 i

【3】: s3 == s4 回来 false,都是在堆中新建目标,所以是两个目标,肯定z = 5不相同。

【4】: s2 == s3 回来 false,前面虽然调用了I X s h G $ intern() ,但是没有回来,不起作用。

【5】: s2 == s3 回来 ture,前面调用P C B N 3 a了 intern() ,并且回来给了 s3 ,此刻# p H W z 4 s2、s3 都直接指向常量池的同一个字符串。

【6】: s3 == s4 回来 true,和 s3 相同,都指向了常量池同一个字符串。

为啥我字符串就不行变

字符串常量池的基础便是字符串的不行变性,假如字符串是可变的,那想一想,常量池就没必要存在了。假定多个变量都指向字符串常量池的同一个字符串,然后呢,突然来了% r q m O n %一行代码,不管三七二十一,直接把字符串给变了,那岂不是 jvm 国际大乱。

字符串不行变的根本原因应该是处于安全性考虑。

咱们知道 jvm 类型加载的时? c 3 b B f分会用到类名,比方加载 java.lang.String 类型,假如字符串可变的话,那我替换成其他的字符,那岂不是很危险。

项目中会用到比方数据库衔接串、账号、暗码等字符串,只要不行变的衔接串、用户名和暗码才F & 9 = y D ]能确保安全性。

字符串在 Java 中的运用h F = c 1 H m y频率可谓高之又高,那在高并发的状况下不行变性也使得对字符串的读写操作不用考虑多线程竞争的状况。

还有便是 Ha( L @ n r Q % U MshCode,HashCode 是判别两个目标是否彻底持平的核心条件,另外,像 Set、Map 结构中的 key 值也需求用到 HashCode 来确保唯一性和一致性,因而不行变的 HashCode 才是安全可靠的。

最后一点便是上面提到的,字符串目标的Q ! g B S频频创立会带来功能上的开销,所以,利用不行变性才有了字符串常量池,使得功能得以保证。

后话

知其然,也要知所以然。一知半解才不是咱们追求的目标。不知道图画的够不够明晰,希望能帮助到对字符串常量池不甚了解的同学。

创造不易,小小的赞,大大的暖,快来温暖我。赞我!一点也不要客气。

我是风筝,大众号「古时的风筝」,一个在程序圈混迹多年,主业 Java,另外 Python、React / q O 也玩儿的很 6 的] ] d !斜杠开发者。能够在大众号中加我老友,进群里小伙伴交流学习,很多大厂的同学也在群内呦。