当前位置: 移动技术网 > IT编程>开发语言>Java > 详细分析Java中String、StringBuffer、StringBuilder类的性能

详细分析Java中String、StringBuffer、StringBuilder类的性能

2019年07月22日  | 移动技术网IT编程  | 我要评论

我们先要记住三者的特征:

  • string 字符串常量
  • stringbuffer 字符串变量(线程安全)
  • stringbuilder 字符串变量(非线程安全)

一、定义
查看api会发现,string、stringbuffer、stringbuilder都实现了 charsequence接口,虽然它们都与字符串相关,但是其处理机制不同。

  • string:是不可改变的量,也就是创建后就不能在修改了。
  • stringbuffer:是一个可变字符串序列,它与string一样,在内存中保存的都是一个有序的字符串序列(char类型的数组),不同点是stringbuffer对象的值都是可变的。
  • stringbuilder:与stringbuffer类基本相同,都是可变字符换字符串序列,不同点是stringbuffer是线程安全的,stringbuilder是线程不安全的。 在性能方面,由于string类的操作是产生新的string对象,而stringbuilder和stringbuffer只是一个字符数组的扩容而已,所以string类的操作要远慢于stringbuffer和stringbuilder。

二、使用场景
使用string类的场景:在字符串不经常变化的场景中可以使用string类,例如常量的声明、少量的变量运算。
使用stringbuffer类的场景:在频繁进行字符串运算(如拼接、替换、删除等),并且运行在多线程环境中,则可以考虑使用stringbuffer,例如xml解析、http参数解析和封装。
使用stringbuilder类的场景:在频繁进行字符串运算(如拼接、替换、和删除等),并且运行在单线程的环境中,则可以考虑使用stringbuilder,如sql语句的拼装、json封装等。

三、分析
简要的说, string 类型和 stringbuffer 类型的主要性能区别其实在于 string 是不可变的对象, 因此在每次对 string 类型进行改变的时候其实都等同于生成了一个新的 string 对象,然后将指针指向新的 string 对象。所以经常改变内容的字符串最好不要用 string ,因为每次生成对象都会对系统性能产生影响,特别当内存中无引用对象多了以后, jvm 的 gc 就会开始工作,那速度是一定会相当慢的。

而如果是使用 stringbuffer 类则结果就不一样了,每次结果都会对 stringbuffer 对象本身进行操作,而不是生成新的对象,再改变对象引用。所以在一般情况下我们推荐使用 stringbuffer ,特别是字符串对象经常改变的情况下。而在某些特别情况下, string 对象的字符串拼接其实是被 jvm 解释成了 stringbuffer 对象的拼接,所以这些时候 string 对象的速度并不会比 stringbuffer 对象慢,而特别是以下的字符串对象生成中, string 效率是远要比 stringbuffer 快的:

string s1 = “this is only a" + “ simple" + “ test";
stringbuffer sb = new stringbuilder(“this is only a").append(“ simple").append(“ test");

你会很惊讶的发现,生成 string s1 对象的速度简直太快了,而这个时候 stringbuffer 居然速度上根本一点都不占优势。其实这是 jvm 的一个把戏,在 jvm 眼里,这个

string s1 = “this is only a" + “ simple" + “test"; 

其实就是:

string s1 = “this is only a simple test";

所以当然不需要太多的时间了。但大家这里要注意的是,如果你的字符串是来自另外的 string 对象的话,速度就没那么快了,譬如:

string s2 = "this is only a";
string s3 = "simple";
string s4 = "test";
string s1 = s2 +s3 + s4;

这时候 jvm 会规规矩矩的按照原来的方式去做。

四、深入jvm的优化处理
真的会有上面的性能代价么,字符串拼接这么常用,没有特殊的处理优化么,答案是有的,这个优化进行在jvm编译.java到bytecode时。

一个java程序如果想运行起来,需要经过两个时期,编译时和运行时。在编译时,java jvm(compiler)将java文件转换成字节码。在运行时,java虚拟机(jvm)运行编译时生成的字节码。通过这样两个时期,java做到了所谓的一处编译,处处运行。

我们实验一下编译期都做了哪些优化,我们制造一段可能会出现性能代价的代码。

public class concatenation {
 public static void main(string[] args) {
   string username = "andy";
   string age = "24";
   string job = "developer";
   string info = username + age + job;
   system.out.println(info);
 }
}

对concatenation.java进行编译一下。得到concatenation.class

javac concatenation.java

然后我们使用javap反编译一下编译出来的concatenation.class文件。javap -c concatenation。如果没有找到javap命令,请考虑将javap所在目录加入环境变量或者使用javap的完整路径。

17:22:04-androidyue~/workspace_adt/strings/src$ javap -c concatenation
compiled from "concatenation.java"
public class concatenation {
 public concatenation();
  code:
    0: aload_0
    1: invokespecial #1         // method java/lang/object."<init>":()v
    4: return    

 public static void main(java.lang.string[]);
  code:
    0: ldc      #2         // string andy
    2: astore_1
    3: ldc      #3         // string 24
    5: astore_2
    6: ldc      #4         // string developer
    8: astore_3
    9: new      #5         // class java/lang/stringbuilder
   12: dup
   13: invokespecial #6         // method java/lang/stringbuilder."<init>":()v
   16: aload_1
   17: invokevirtual #7         // method java/lang/stringbuilder.append:(ljava/lang/string;)ljava/lang/stringbuilder;
   20: aload_2
   21: invokevirtual #7         // method java/lang/stringbuilder.append:(ljava/lang/string;)ljava/lang/stringbuilder;
   24: aload_3
   25: invokevirtual #7         // method java/lang/stringbuilder.append:(ljava/lang/string;)ljava/lang/stringbuilder;
   28: invokevirtual #8         // method java/lang/stringbuilder.tostring:()ljava/lang/string;
   31: astore    4
   33: getstatic   #9         // field java/lang/system.out:ljava/io/printstream;
   36: aload     4
   38: invokevirtual #10         // method java/io/printstream.println:(ljava/lang/string;)v
   41: return
}

其中,ldc,astore等为java字节码的指令,类似汇编指令。后面的注释使用了java相关的内容进行了说明。 我们可以看到上面有很多stringbuilder,但是我们在java代码里并没有显示地调用,这就是javajvm做的优化,当javajvm遇到字符串拼接的时候,会创建一个stringbuilder对象,后面的拼接,实际上是调用stringbuilder对象的append方法。这样就不会有我们上面担心的问题了。

五、仅靠jvm优化?
既然jvm帮我们做了优化,是不是仅仅依靠jvm的优化就够了呢,当然不是。
下面我们看一段未优化性能较低的代码

public void implicitusestringbuilder(string[] values) {
 string result = "";
 for (int i = 0 ; i < values.length; i ++) {
   result += values[i];
 }
 system.out.println(result);
}

使用javac编译,使用javap查看

public void implicitusestringbuilder(java.lang.string[]);
  code:
    0: ldc      #11         // string 
    2: astore_2
    3: iconst_0
    4: istore_3
    5: iload_3
    6: aload_1
    7: arraylength
    8: if_icmpge   38
   11: new      #5         // class java/lang/stringbuilder
   14: dup
   15: invokespecial #6         // method java/lang/stringbuilder."<init>":()v
   18: aload_2
   19: invokevirtual #7         // method java/lang/stringbuilder.append:(ljava/lang/string;)ljava/lang/stringbuilder;
   22: aload_1
   23: iload_3
   24: aaload
   25: invokevirtual #7         // method java/lang/stringbuilder.append:(ljava/lang/string;)ljava/lang/stringbuilder;
   28: invokevirtual #8         // method java/lang/stringbuilder.tostring:()ljava/lang/string;
   31: astore_2
   32: iinc     3, 1
   35: goto     5
   38: getstatic   #9         // field java/lang/system.out:ljava/io/printstream;
   41: aload_2
   42: invokevirtual #10         // method java/io/printstream.println:(ljava/lang/string;)v
   45: return

其中8: if_icmpge 38 和35: goto 5构成了一个循环。8: if_icmpge 38的意思是如果jvm操作数栈的整数对比大于等于(i < values.length的相反结果)成立,则跳到第38行(system.out)。35: goto 5则表示直接跳到第5行。

但是这里面有一个很重要的就是stringbuilder对象创建发生在循环之间,也就是意味着有多少次循环会创建多少个stringbuilder对象,这样明显不好。赤裸裸地低水平代码啊。

稍微优化一下,瞬间提升逼格。

public void explicitusestringbuider(string[] values) {
 stringbuilder result = new stringbuilder();
 for (int i = 0; i < values.length; i ++) {
   result.append(values[i]);
 }
}

对应的编译后的信息

public void explicitusestringbuider(java.lang.string[]);
  code:
    0: new      #5         // class java/lang/stringbuilder
    3: dup
    4: invokespecial #6         // method java/lang/stringbuilder."<init>":()v
    7: astore_2
    8: iconst_0
    9: istore_3
   10: iload_3
   11: aload_1
   12: arraylength
   13: if_icmpge   30
   16: aload_2
   17: aload_1
   18: iload_3
   19: aaload
   20: invokevirtual #7         // method java/lang/stringbuilder.append:(ljava/lang/string;)ljava/lang/stringbuilder;
   23: pop
   24: iinc     3, 1
   27: goto     10
   30: return

从上面可以看出,13: if_icmpge 30和27: goto 10构成了一个loop循环,而0: new #5位于循环之外,所以不会多次创建stringbuilder.

总的来说,我们在循环体中需要尽量避免隐式或者显式创建stringbuilder. 所以那些了解代码如何编译,内部如何执行的人,写的代码档次都比较高。

六、结论
在大部分情况下 stringbuffer > string

java.lang.stringbuffer是线程安全的可变字符序列。一个类似于 string 的字符串缓冲区,但不能修改。虽然在任意时间点上它都包含某种特定的字符序列,但通过某些方法调用可以改变该序列的长度和内容。在程序中可将字符串缓冲区安全地用于多线程。而且在必要时可以对这些方法进行同步,因此任意特定实例上的所有操作就好像是以串行顺序发生的,该顺序与所涉及的每个线程进行的方法调用顺序一致。

stringbuffer 上的主要操作是 append 和 insert 方法,可重载这些方法,以接受任意类型的数据。每个方法都能有效地将给定的数据转换成字符串,然后将该字符串的字符追加或插入到字符串缓冲区中。append 方法始终将这些字符添加到缓冲区的末端;而 insert 方法则在指定的点添加字符。

例如,如果 z 引用一个当前内容是“start”的字符串缓冲区对象,则此方法调用 z.append(“le”) 会使字符串缓冲区包含“startle”(累加);而 z.insert(4, “le”) 将更改字符串缓冲区,使之包含“starlet”。

在大部分情况下 stringbuilder > stringbuffer

java.lang.stringbuilder一个可变的字符序列是java 5.0新增的。此类提供一个与 stringbuffer 兼容的 api,但不保证同步,所以使用场景是单线程。该类被设计用作 stringbuffer 的一个简易替换,用在字符串缓冲区被单个线程使用的时候(这种情况很普遍)。如果可能,建议优先采用该类,因为在大多数实现中,它比 stringbuffer 要快。两者的使用方法基本相同。

如对本文有疑问, 点击进行留言回复!!

相关文章:

验证码:
移动技术网