290

分享到

字符串与编码

字符串 2023-01-31 00:01:03 290人浏览八月长安

Python 官方文档：入门教程 => 点击学习

摘要

在最新的python 3版本中，字符串是以Unicode编码的，即Python的字符串支持多语言编码和解码　　字符串在内存中以Unicode表示，在操作字符串时，经常需要str和bytes互相转换　　字符串是可以直接在内存上进行处

在最新的python 3版本中，字符串是以Unicode编码的，即Python的字符串支持多语言

编码和解码
　　字符串在内存中以Unicode表示，在操作字符串时，经常需要str和bytes互相转换
　　字符串是可以直接在内存上进行处理的，但如果要将其传输到网络或磁盘上，需要将其编码，反过来则需要解码，因为str是不可以直接存储在磁盘上或在网络上传输的
　　如果将字符串从内存传输到网络或保存到磁盘，则要把str转换为以字节为单位的bytes，称为编码
　　如果要从网络或磁盘上获取字符串，则要从网络上或者磁盘上读取字节流，并把bytes转换为str，称为解码
　　为避免乱码问题，应当始终坚持使用UTF-8编码对str和bytes进行转换，关于编码，请参照字符编码

使用示例：

单个字符的编码

print(ord('A')) #输出：65，获取字符的整数表示
print(chr(66)) #输出：B，把编码转换为对应的字符

十六进制表示

print('中文') #输出：'中文'，
print('\u4e2d\u6587') #输出：'中文'，'\u4e2d\u6587'和'中文'完全对等，如果知道字符的整数编码，还可以用十六进制这么写str

bytes类型的数据表示

x = b'ABC' #Python对bytes类型的数据用带b前缀的单引号或双引号表示，'ABC'和b'ABC'在显示上完全一样，但bytes的每个字符都只占用一个字节

编码

print('ABC'.encode('ascii')) #输出：b'ABC'，以Unicode表示的str通过encode()方法可以编码为指定的bytes
print('中文'.encode('utf-8')) #输出：b'\xe4\xb8\xad\xe6\x96\x87'，
print('中文'.encode('ascii')) #输出：报错，因为中文字符在ascii编码范围外，所以导致编码失败

解码

print(b'ABC'.decode('ascii')) #输出：'ABC'
print(b'\xe4\xb8\xad\xe6\x96\x87'.decode('ascii')) #输出：'中文'
print(b'\xe4\xb8\xad\xff'.decode('utf-8', errors='ignore')) #输出：'中'，如果bytes中只有一小部分无效的字节，可以传入errors='ignore'忽略错误的字节

计算长度

#len(a)函数返回a的长度，如果a是字符串则返回字符数，如果a是字节表示则返回字节数
print(len('中文')) #输出：2，共2个字符
print(len('ABC')) #输出：3，共3个字符
print(len(b'ABC')) #输出：3，共是3个字节
print(len(b'\xe4\xb8\xad\xe6\x96\x87')) #输出：6，共是6个字节
print(len('中文'.encode('utf-8'))) #输出：6, 1个中文字符经过UTF-8编码后通常会占用3个字节,因此两个汉字的字节数是6

源码文件开头与编码

#!/usr/bin/env python3       告诉linux/OS X系统，这是一个Python可执行程序，windows系统会忽略这个注释
# -*- coding: utf-8 -*-      告诉Python解释器，按照UTF-8编码读取源代码，否则在源代码中写的中文输出可能会有乱码

#注意：告诉编译器使用UTF-8编码的同时，.py文件也要保存为UTF-8 without BOM编码，两者统一了，才可确保文件中的中文正常显示

您可能感兴趣的文档:

--结束END--

本文标题: 字符串与编码

本文链接: https://lsjlt.com/news/182346.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

回答

如何调试操作系统的错误？
操作系统

2023-11-15发布

回答

操作系统中的I/O系统是如何实现的？
操作系统

2023-11-15发布

回答

如何实现操作系统的内存管理？
操作系统

2023-11-15发布

回答

什么是虚拟内存，它对操作系统有什么影响？
操作系统

2023-11-15发布

回答

ASP中的MVC架构和WebForms架构有什么区别和使用场景？
ASP.NET

2023-11-15发布

回答

ASP中的数据验证和数据校验有什么不同？
ASP.NET

2023-11-15发布

回答

ASP中的ADO对象和DAO对象有什么区别和使用方法？
ASP.NET

2023-11-15发布

回答

Node.js中的包管理器NPM是什么？如何使用它进行依赖管理？
node.js

2023-11-15发布

回答

Vue.js中的动态组件是什么？如何使用它来动态渲染组件？
VUE

2023-11-15发布

回答

如何使用Vue.js实现懒加载和预加载？
VUE

2023-11-15发布

字符串与编码

字符串与编码

Python中的字符串与字符编码

python字符串编码

再谈Python中的字符串与字符编码（推荐）

python字符串与url编码的转换

深入解析Go 变量字符串与字符编码问题

python字符编码与转码

VBScript中的Base64编码字符串

day08（字符编码，字符与字节，文件操

php如何改变字符串编码

python字符串编码如何转换

python如何获取字符串编码

java怎么查看字符串编码

java字符串怎么转gbk编码

jquery如何转换字符串编码

php字符串如何转换编码

python 字符编码与转换

VBS字符串编码转换函数代码

MySQL字符串拼接与分组拼接字符串实例代码

php如何查看字符串的编码

python分析数据的方法是什么

如何使用Python实现抽奖小程序

python copy函数的作用是什么

python ffmpeg模块怎么安装和使用

python进程池创建队列的方法是什么

python无法运行文件的原因有哪些

python can't open file报错怎么解决

python keyerror错误怎么解决

python字符串处理与应用的方法有哪些

python全局变量如何定义