运维开发网

Python内置数据结构——bytes,bytearray

运维开发网 https://www.qedev.com 2020-02-27 12:50 出处:51CTO 作者:AiSmile
bytes,bytearray字符串与bytes字符串是字符组成的有序序列,字符可以使用编码来理解bytes是字节组成的有序的不可变序列bytesarray是字节组成的有序的可变序列编码与解码字符串按照不同的字符集编码encode返回字序列bytes            byt

bytes,bytearray

字符串与bytes

  • 字符串是字符组成的有序序列,字符可以使用编码来理解

  • bytes是字节组成的有序的不可变序列

  • bytesarray是字节组成的有序的可变序列

编码与解码

  • 字符串按照不同的字符集编码encode返回字序列bytes

            bytes.encode(encoding = 'utf - 8',errors = 'stirct') -> bytes

  • 字节序列按照不同的字符集解码decode 返回字符串

            bytes.decode(encoding = "utf - 8",errors = "strict") -> str

            bytearray.decode(encoding ="utf - 8",errors = "strict" ) -> str

ASCII

            ASCII(American Standard Code for information Interchange,美国信息交换标准代码)是基于拉丁字母的一套单字节编码系统

bytes定义

  • bytes() 空bytes

  • bytes(int) 指定字节bytes,被0填充

  • bytes(iterable_of_ints) -> bytes[0~255] 的int组成的可迭代对象

  • bytes(string,encodeing[,errors]) -> bytes  等价于string.encode()

  • bytes(bytes_or_buffer) -> immutable copy of bytes_or_buffer从一个字节序列或者buffer复制出一个新的额不可变的bytes对象

  • 使用b 前缀定义

            只允许基本ASCII使用字符形式 b'abc9'

            使用16进制表示b'\x41\x61'

bytes操作

  • 和str类型类似,都是不可变类型,所以犯法很多都一样,只不过bytes的方法,输入是bytes,输出是bytes

    • b'abcdef'.replace(b'f',b'k')

    • b'abc'.find(b'b')

  • 类方法 bytes.fromhex(string)

    • string必须是2 个字符的16进制的形式,"6162 6a 6b", 空格将被忽略

    • bytes.fromhex("6162 09 6a 6b00")

  • hex()

    • 返回16 进制表示的字符串

    • "abc".encode().hex()

  • 索引

    • b.'abcdef'[2] 返回该字节对应的数,int类型

bytearray定义

定义:

  • bytearray()空bytearray

  • bytearray(int) 指定字节的bytearray, 被0 填充

  • bytearray(iterable_of_ints) -> bytearray  [0,255]的int组成的可迭代对象

  • bytearray(string,encoding[,errors]) -> bytearry 近似string.encode() ,不过返回可变对象

  • bytearray(bytes_or_buffer)从一个字节序列或者buffer复制出一个新的可变的bytearray对象

注意:b前缀定义的类型是bytes类型

bytearray操作

  • 和bytes类型的方法相同

    • bytearray(b'abcdef').replace(b'f',b'k')

    • bytearray(b'abc').find(b'b')

  • 类方法 bytearray.fromhex(string)

    • string必须是2 个字符的16进制的形式,‘6162 6a 6b’,空格将被忽略

    • bytearray.fromhex('6162 09 6a 6b00')

  • hex()

    • 返回16 进制表示的字符串

    • bytearray('abc'.encode()).hex()

  • 索引

    • bytearray(b'abcdef')[2] 返回该字节对应的数,in类型

  • .append(int)尾部追加一个元素

  • .insert(index,int)在指定索引位置插入元素

  • .extend(iterable_of_ints) 讲一个可迭代的整数集合追加到当前bytearray

  • .pop(index = -1)从指定索引上移除元素,默认从尾部移除

  • .remove(value)找到第一个value移除,找不到抛value error

注意: 上述方法若需要使用int类型,值在[0,255]

  • .clear() 清空bytearray

  • .reverse()翻转bytearray ,就地修改

int 和 bytes 之间转换

  • int.from_bytes(bytes,byteorder)

    • 将以个字节数组表示成整数

  • int.to_bytes(length, byteorder)

    • byteorder 指字节序(大端big)

    • 将一个整数表达成一个指定长度的字节数组

i = int.form_bytes(b.'abc', 'big')
print( i , hex()) # 6382179  0x616263
printn(i.to_bytes(3 , 'big')) # b'abc'

所有数据在内存中全部都是2进制的形式,人要理解一个内存中的数据必须先要指定它的类型,否则这个数据是没有意义的

一个字节 = 8位

一个字节0~255

两个字节0~65535

0~255

0~127

大小端的意思是在内存中数据是如何存放的 (大小端代表着高低字节)例如:如果给两个字节ab 是a放高地址呢还是b放高地址呢

低字节放在高地址上,大端模式big

低字节放在小地址上,小端模式little

高低字节的排放顺序~~~

网络上采用大端模式

windows内部采用小端模式

mac用大端模式

0

精彩评论

暂无评论...
验证码 换一张
取 消