Go语言字符串高效拼接（一）-白红宇

在我们编程的时候，和字符串打交道是必不可少的，我们对数据库里文本的处理，Web文本的显示，文本数据的存储等都需要和字符串打交道，那么对于字符串来说，查找、拼接这些都是常用的操作，尤其是以拼接使用的比较多，比如把一个人的姓名和年龄拼接在一起显示。

在Go语言（golang）中，对于字符串的拼接处理有很多种方法，那么那种方法才是效率最高的呢？因为内存很贵、性能很重要，有时候不慎字符串的转换和拷贝，就可以把你的内存吃光，性能低下，不得不考虑。

一个例子

对于任何功能、性能、方法的研究，没有比例子更有说服力的啦。在这里，我们使用一个例子，来演示不同字符串的拼接方式，以及对应的性能分析。这个例子如下：

昵称:飞雪无情博客:http://www.flysnow.org/微信公众号:flysnow_org复制代码

在这个例子中，通过字符串拼接的方式，拼接出如上的内容，这里特别强调，在这个例子中，换行也是字符串拼接的一部分，因为我们要严格拼接出如上的内容。

+号拼接

这种拼接最简单，也最容易被我们使用，因为它是不限编程语言的，比如Go语言有，Java也有，它们是+号运算符，在运行时计算的。现在演示下这种拼接的代码，虽然比较简单。

func StringPlus() string{	var s string	s+="昵称"+":"+"飞雪无情"+"\n"	s+="博客"+":"+"http://www.flysnow.org/"+"\n"	s+="微信公众号"+":"+"flysnow_org"	return s}复制代码

我们可以自己写个用例测试下，可以打印出和我们例子中一样的内容。那么这种最常见的字符串拼接的方式性能怎么样的呢，我们测试下：

func BenchmarkStringPlus(b *testing.B) {	for i:=0;i

运行go test -bench=. -benchmem 查看性能输出如下：

BenchmarkStringPlus-8   20000000    108 ns/op   144 B/op    2 allocs/op复制代码

每次操作需要108ns,进行2次内存分配，分配114字节的内存。

fmt 拼接

这种拼接，借助于fmt.Sprint系列函数进行拼接，然后返回拼接的字符串。

func StringFmt() string{	return fmt.Sprint("昵称",":","飞雪无情","\n","博客",":","http://www.flysnow.org/","\n","微信公众号",":","flysnow_org")}复制代码

为了演示，代码没有换行，可能在手机上影响阅读体验，见谅。它的性能我们也测试一下看看效果。

func BenchmarkStringFmt(b *testing.B) {	for i:=0;i

运行查看测试结果：

BenchmarkStringFmt-8    5000000     385 ns/op   80 B/op     1 allocs/op复制代码

虽然每次操作内存分配只有1次，分配80字节也不多，但是每次操作耗时太长，性能远没有+号操作快。

Join 拼接

这个是利用strings.Join函数进行拼接，接受一个字符串数组，转换为一个拼接好的字符串。

func StringJoin() string{	s:=[]string{
   "昵称",":","飞雪无情","\n","博客",":","http://www.flysnow.org/","\n","微信公众号",":","flysnow_org"}	return strings.Join(s,"")}func BenchmarkStringJoin(b *testing.B) {	for i:=0;i

为了方便，把性能测试的代码放一起了，现在看看性能测试的效果。

BenchmarkStringJoin-8   10000000    177 ns/op   160 B/op    2 allocs/op复制代码

整体和+操作相差不了太多，大概低0.5倍的样子。

buffer 拼接

这种被用的也很多，使用的是bytes.Buffer进行的字符串拼接，它是非常灵活的一个结构体，不止可以拼接字符串，还是可以byte,rune等，并且实现了io.Writer接口，写入也非常方便。

func StringBuffer() string {	var b bytes.Buffer	b.WriteString("昵称")	b.WriteString(":")	b.WriteString("飞雪无情")	b.WriteString("\n")	b.WriteString("博客")	b.WriteString(":")	b.WriteString("http://www.flysnow.org/")	b.WriteString("\n")	b.WriteString("微信公众号")	b.WriteString(":")	b.WriteString("flysnow_org")	return b.String()}func BenchmarkStringBuffer(b *testing.B) {	for i:=0;i

看看他的性能，运行输出即可：

BenchmarkStringBuffer-8     5000000     291 ns/op   336 B/op    3 allocs/op复制代码

好像并不是太好,和最差的fmt拼接差不多，和+号，Join拼接差好远，内存分配也比较多。每次操作耗时也很长。

builder 拼接

为了改进buffer拼接的性能，从go 1.10 版本开始，增加了一个builder类型，用于提升字符串拼接的性能。它的使用和buffer几乎一样。

func StringBuilder() string {	var b strings.Builder	b.WriteString("昵称")	b.WriteString(":")	b.WriteString("飞雪无情")	b.WriteString("\n")	b.WriteString("博客")	b.WriteString(":")	b.WriteString("http://www.flysnow.org/")	b.WriteString("\n")	b.WriteString("微信公众号")	b.WriteString(":")	b.WriteString("flysnow_org")	return b.String()}func BenchmarkStringBuilder(b *testing.B) {	for i:=0;i

官方都说比buffer性能好了，我们看看性能测试的结果。

BenchmarkStringBuilder-8    10000000    170 ns/op   232 B/op    4 allocs/op复制代码

的确提升了，提升了一倍，虽然每次分配的内存次数有点多，但是每次分配的内存大小比buffer要少。

性能对比

以上就是常用的字符串拼接的方式，现在我们把这些测试结果，汇总到一起，对比下看看,因为Benchmark的测试，对于性能只显示，我把测试的时间设置为3s（秒），把时间拉长便于对比测试，同时生成了cpu profile文件，用于性能分析。

运行go test -bench=. -benchmem -benchtime=3s -cpuprofile=profile.out得到如下测试结果：

StringPlus-8    50000000    112 ns/op   144 B/op    2 allocs/opStringFmt-8     20000000    344 ns/op   80 B/op     1 allocs/opStringJoin-8    30000000    171 ns/op   160 B/op    2 allocs/opStringBuffer-8  20000000    302 ns/op   336 B/op    3 allocs/opStringBuilder-8 30000000    171 ns/op   232 B/op    4 allocs/op复制代码

我们通过go tool pprof profile.out 看下我们输出的cpu profile信息。这里主要使用top命令。

Showing top 15 nodes out of 89      flat  flat%   sum%        cum   cum%    11.99s 42.55% 42.55%     11.99s 42.55%  runtime.kevent     6.30s 22.36% 64.90%      6.30s 22.36%  runtime.pthread_cond_wait     1.65s  5.86% 70.76%      1.65s  5.86%  runtime.pthread_cond_signal     1.11s  3.94% 74.70%      1.11s  3.94%  runtime.usleep     1.10s  3.90% 78.60%      1.10s  3.90%  runtime.pthread_cond_timedwait_relative_np     0.58s  2.06% 80.66%      0.62s  2.20%  runtime.wbBufFlush1     0.51s  1.81% 82.47%      0.51s  1.81%  runtime.memmove     0.44s  1.56% 84.03%      1.81s  6.42%  fmt.(*pp).printArg     0.39s  1.38% 85.42%      2.36s  8.37%  fmt.(*pp).doPrint     0.36s  1.28% 86.69%      0.70s  2.48%  fmt.(*buffer).WriteString (inline)     0.34s  1.21% 87.90%      0.93s  3.30%  runtime.mallocgc     0.20s  0.71% 88.61%      1.20s  4.26%  fmt.(*fmt).fmtS     0.18s  0.64% 89.25%      0.18s  0.64%  fmt.(*fmt).truncate     0.16s  0.57% 89.82%      0.16s  0.57%  runtime.memclrNoHeapPointers     0.15s  0.53% 90.35%      1.35s  4.79%  fmt.(*pp).fmtString复制代码

前15个，可以看到fmt拼接的方式是最差的，因为fmt里很多方法耗时排在了最前面。buffer的WriteString方法也比较耗时。

以上的TOP可能还不是太直观，如果大家看火焰图的话，就会更清晰。性能最好的是+号拼接、Join拼接，最慢的是fmt拼接，这里的builder和buffer拼接差不多，并没有发挥出其能力。

总结

从整个性能的测试和分析来看，我们期待的builder并没有发挥出来，这是不是意味着builder不实用了呢？还不如+号和Join拼接呢？我们下一篇继续接着分析，这里提前透漏一些：比如:

拼接的字符串大小

拼接的字符串数量

以上这两个很关键，可以看下我上面的例子是属于哪一种。

好了，更深入具体的，请看下一篇字符串拼接分析。

本文为原创文章，转载注明出处，「总有烂人抓取文章的时候还去掉我的原创说明」欢迎扫码关注公众号flysnow_org或者网站，第一时间看后续精彩文章。「防烂人备注**……&*￥」觉得好的话，顺手分享到朋友圈吧，感谢支持。