Python如何获取字符串中的字节数?Python获取字节数的函数是什么?

Python中,我们之前学习了获取一个字符串的长度,可以使用len函数,如果我们想获取一个字符串占用了多少个字节,也可以使用这个函数来操作,下面一起看看是如何实现的吧 。

Python如何获取字符串中的字节数?Python获取字节数的函数是什么?

文章插图
一、字节
在Python中,不同的字符它们占用的空间大小会不一样,比如字母、数字、下划线所占用的就是一个字节,只有汉字比较的特殊,占用的字节数是2-4个字节,具体占的字节数要根据所采用的编码方式,当我们使用GBK/GB2312编码时,中文所占的字节就是2个,使用UTF-8编码中一般占用3个字节 。想要知道字符所占的字节数,可以使用len函数,它的基本语法格式为:
len(string)在这个函数中,只有一个参数,它表示的就是一个需要进行统计的字符串 。
二、具体的实例
1、使用urf-8的编码
知道了这个函数的基本语法,下面通过具体的实例可以实际的操作一下,在这里我们使用的是urf-8的编码格式,假设有一个字符串为“学习Python!我用Python”,然后通过使用我们之前所学习的encode()方法,将字符串先进行编码的操作,然后再去获取它的字节数,代码如下:
str1 = "学习Python!我用Python "len(str1.encode())运行结果:

【Python如何获取字符串中的字节数?Python获取字节数的函数是什么?】27在示例中,因为我们使用的是UTF-8编码,在这个编码中一个汉字是占用3个字节的,字母是一个,所以在代码中汉字加中文标点符号共5个,占15个字节,而英文字母和英文的标点符号占12个字节,一共占用27个字节 。
2、使用GBK的编码
同样的使用上面的那个示例,我们将字符的编码格式换一下,使用GBK编码,代码如下:
str1 = "学习Python!我用Python "len(str1.encode(gbk))运行结果:
22因为在GBK的编码中,汉字只占用2个字节,所以这里有四个汉字加一个标点符号,所以为10个字节,再加上12个字母,所以字节数为22 。
关于Python如何获取字符串中的字节数?Python获取字节数的函数是什么?的文章就分享到这里了,希望可以对大家的学习带来帮助 。

    推荐阅读