首页 > 资讯 > 后端开发 > GO >Go中string与[]byte高效互转的方法实例

136

分享到

Go中string与[]byte高效互转的方法实例

2024-04-02 19:04:59 136人浏览泡泡鱼

摘要

目录前言数据结构常规实现 string转[]byte []byte转string 高效实现性能测试总结前言当我们使用Go进行数据序列化或反序列化操作时，可能经常涉及到字

前言

当我们使用Go进行数据序列化或反序列化操作时，可能经常涉及到字符串和字节数组的转换。例如：


if str, err := JSON.Marshal(from); err != nil {

    panic(err)

} else {

    return string(str)

}

json序列化后为[]byte类型，需要将其转换为字符串类型。当数据量小时，类型间转换的开销可以忽略不计，但当数据量增大后，可能成为性能瓶颈，使用高效的转换方法能减少这方面的开销

数据结构

在了解其如何转换前，需要了解其底层数据结构

本文基于go 1.13.12

string：


type stringStruct struct {

   str unsafe.Pointer

   len int

}

slice：


type slice struct {

   array unsafe.Pointer

   len   int

   cap   int

}

与slice的结构相比，string缺少一个表示容量的cap字段，因此不能对string遍历使用内置的cap()函数那为什么string不需要cap字段呢？因为go中string被设计为不可变类型（当然在很多其他语言中也是）,由于其不可像slice一样追加元素，也就不需要cap字段判断是否超出底层数组的容量，来决定是否扩容

只有len属性不影响for-range等读取操作，因为for-range操作只根据len决定是否跳出循环

那为什么字符串要设定为不可变呢？因为这样能保证字符串的底层数组不发生改变

举个例子，map中以string为键，如果底层字符数组改变，则计算出的哈希值也会发生变化，这样再从map中定位时就找不到之前的value，因此其不可变特性能避免这种情况发生，string也适合作为map的键。除此之外，不可变特性也能保障数据的线程安全

常规实现

字符串不可变有很多好处，为了维持其不可变特性，字符串和字节数组互转一般是通过数据拷贝的方式实现：


var a string = "hello world"

var b []byte = []byte(a)  // string转[]byte

a = string(b)             // []byte转string

这种方式实现简单，但是通过底层数据复制实现的，在编译期间分别转换成对slicebytetostring和stringtoslicebyte的函数调用

string转[]byte


func stringtoslicebyte(buf *tmpBuf, s string) []byte {

   var b []byte

   if buf != nil && len(s) <= len(buf) {

      *buf = tmpBuf{}

      b = buf[:len(s)]

   } else {

      // 申请内存

      b = rawbyteslice(len(s))

   }

   // 复制数据

   copy(b, s)

   return b

}

其根据返回值是否逃逸到堆上，以及buf的长度是否足够，判断选择使用buf还是调用rawbyteslice申请一个slice。但不管是哪种，都会执行一次copy拷贝底层数据

[]byte转string


func slicebytetostring(buf *tmpBuf, b []byte) (str string) {

   l := len(b)

   if l == 0 {

 return ""

   }

   if l == 1 {

      stringStructOf(&str).str = unsafe.Pointer(&staticbytes[b[0]])

      stringStructOf(&str).len = 1

      return

   }



   var p unsafe.Pointer

   if buf != nil && len(b) <= len(buf) {

      p = unsafe.Pointer(buf)

   } else {

      p = mallocGC(uintptr(len(b)), nil, false)

   }

   // 赋值底层指针

   stringStructOf(&str).str = p

   // 赋值长度

   stringStructOf(&str).len = len(b)

   // 拷贝数据

   memmove(p, (*(*slice)(unsafe.Pointer(&b))).array, uintptr(len(b)))

   return

}

首先处理长度为0或1的情况，再判断使用buf还是通过mallocgc新申请一段内存，但无论哪种方式，最后都要拷贝数据
这里设置了转换后字符串的len属性

高效实现

如果程序保证不对底层数据进行修改，那么只转换类型，不拷贝数据，是否可以提高性能？

unsafe.Pointer，int，uintpt这三种类型占用的内存大小相同


var v1 unsafe.Pointer

var v2 int

var v3 uintptr

fmt.Println(unsafe.Sizeof(v1)) // 8

fmt.Println(unsafe.Sizeof(v2)) // 8

fmt.Println(unsafe.Sizeof(v3)) // 8

因此从底层结构上来看string可以看做[2]uintptr，[]byte切片类型可以看做 [3]uintptr

那么从string转[]byte只需构建出 [3]uintptr{ptr,len,len}

这里我们为slice结构生成了cap字段，其实这里不生成cap字段对读取操作没有影响，但如果要往转换后的slice append元素可能有问题，原因如下：

这样做slice的cap属性是随机的，可能是大于len的值，那么append时就不会新开辟一段内存存放元素，而是在原数组后面追加，如果后面的内存不可写就会panic

[]byte转string更简单，直接转换指针类型即可，忽略cap字段

实现如下：


func stringTobyteSlice(s string) []byte {

   tmp1 := (*[2]uintptr)(unsafe.Pointer(&s))

   tmp2 := [3]uintptr{tmp1[0], tmp1[1], tmp1[1]}

   return *(*[]byte)(unsafe.Pointer(&tmp2))

}



func byteSliceToString(bytes []byte) string {

   return *(*string)(unsafe.Pointer(&bytes))

}

这里使用unsafe.Pointer来转换不同类型的指针，没有底层数据的拷贝

性能测试

接下来对高效实现进行性能测试，这里选用长度为100的字符串或字节数组进行转换

分别测试以下4个方法：


func stringTobyteSlice(s string) []byte {

   tmp1 := (*[2]uintptr)(unsafe.Pointer(&s))

   tmp2 := [3]uintptr{tmp1[0], tmp1[1], tmp1[1]}

   return *(*[]byte)(unsafe.Pointer(&tmp2))

}



func stringTobyteSliceOld(s string) []byte {

   return []byte(s)

}



func byteSliceToString(bytes []byte) string {

   return *(*string)(unsafe.Pointer(&bytes))

}



func byteSliceToStringOld(bytes []byte) string {

   return string(bytes)

}

测试结果如下：

BenchmarkStringToByteSliceOld-12            28637332                42.0 ns/op

BenchmarkStringToByteSliceNew-12            1000000000                 0.496 ns/op

BenchmarkByteSliceToStringOld-12            32595271                36.0 ns/op

BenchmarkByteSliceToStringNew-12            1000000000                 0.256 ns/op

可以看出性能差距比较大，如果需要转换的字符串或字节数组长度更长，性能提升更加明显

总结

本文介绍了字符串和数组的底层数据结构，以及高效的互转方法，需要注意的是，其适用于程序能保证不对底层数据进行修改的场景。若不能保证，且底层数据被修改可能引发异常，则还是使用拷贝的方式

到此这篇关于Go中string与[]byte高效互转的文章就介绍到这了,更多相关Go中string与[]byte互转内容请搜索编程网以前的文章或继续浏览下面的相关文章希望大家以后多多支持编程网！

您可能感兴趣的文档:

Go语言（Golang）教程

--结束END--

本文标题: Go中string与[]byte高效互转的方法实例

本文链接: https://lsjlt.com/news/136245.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

回答

如何调试操作系统的错误？
操作系统

2023-11-15发布

回答

操作系统中的I/O系统是如何实现的？
操作系统

2023-11-15发布

回答

如何实现操作系统的内存管理？
操作系统

2023-11-15发布

回答

什么是虚拟内存，它对操作系统有什么影响？
操作系统

2023-11-15发布

回答

ASP中的MVC架构和WebForms架构有什么区别和使用场景？
ASP.NET

2023-11-15发布

回答

ASP中的数据验证和数据校验有什么不同？
ASP.NET

2023-11-15发布

回答

ASP中的ADO对象和DAO对象有什么区别和使用方法？
ASP.NET

2023-11-15发布

回答

Node.js中的包管理器NPM是什么？如何使用它进行依赖管理？
node.js

2023-11-15发布

回答

Vue.js中的动态组件是什么？如何使用它来动态渲染组件？
VUE

2023-11-15发布

回答

如何使用Vue.js实现懒加载和预加载？
VUE

2023-11-15发布

Go中string与[]byte高效互转的方法实例

目录

前言

数据结构

常规实现

string转[]byte

[]byte转string

高效实现

性能测试

总结

Go中string与[]byte高效互转的方法实例

Golang中字符串(string)与字节数组([]byte)一行代码互转实例

go中string、int、float相互转换的实现示例

java的Array,List和byte[],String相互转换的方法你了解嘛

go语言map与string的相互转换的实现

JAVA中int与string相互转化的几种方法

python中py文件与pyc文件相互转换的方法实例

Android中webview与JS交互、互调方法实例详解

常用json与javabean互转的方法实现

Java中字符串与byte数组之间的转换方法

go语言中的json与map相互转换实现

JAVA11中图片与BASE64相互转换的实现方法

Java中的String类getBytes()方法详解与实例

Java中JavaBean对象和Map的互相转换方法实例

java中JsonObject与JsonArray转换方法实例

string实现数字转中文的方法

C语言中QString与QByteArray互相转换的方法

java中Calendar与Date类型互相转换的方法

Go语言实现二进制与十进制互转的示例代码

高效开发Go语言项目的经验与方法

Sqlx 连接具有相同字段的表

如何从 go 中的另一个包访问结构变量？

使用 kafka-go 在 Kafka 中计划创建消费者

无法从 Golang 中的 Google userinfo API 响应访问电话号码（使用 golang.org/x/oauth2 和 Google People API）

如何在Golang中为Azure SDK指定x509证书

etcd 事务中的原子计数器增量

将字段添加到 MongoDB 内部对象

如何处理关闭同一通道的多个 go 例程？

Cron Job 不会用 TimeZone 触发

API 网关 -> Go Lambda 参数