string rune byte 的关系

在Go当中 string底层是用byte数组存的,并且是不可以改变的。

例如 s:="Go编程" fmt.Println(len(s)) 输出结果应该是8因为中文字符是用3个字节存的。

len(string(rune('编')))的结果是3

如果想要获得我们想要的情况的话,需要先转换为rune切片再使用内置的len函数

fmt.Println(len([]rune(s)))

结果就是4了。

所以用string存储unicode的话,如果有中文,按下标是访问不到的,因为你只能得到一个byte。 要想访问中文的话,还是要用rune切片,这样就能按下表访问。

共 5 个回复


lizichao

最直观的区别就是
rune 能操作 任何字符
byte 不支持中文的操作

# 0

igo

学习

# 1

needkane

例如 s:=”Go编程” fmt.Println(len(s)) 输出结果应该是8因为中文字符是用3个字节存的

知道为嘛是3个字节吗,有没有不是3个字节的情况

# 2

joeonly

问得好 UTF一8有一字节 两字节 三字节的可能 汉字是否全落三字节区域忘了

# 3

stevewang

utf-8编码里,也有个别汉字是四个字节。

# 4