返回顶部
首页 > 资讯 > 后端开发 > Python >utf-8 下汉字为什么需要三个字节
  • 822
分享到

utf-8 下汉字为什么需要三个字节

汉字字节utf 2023-01-31 00:01:24 822人浏览 安东尼

Python 官方文档:入门教程 => 点击学习

摘要

  Unicode 十六进制码点范围    -->   UTF-8 二进制0000 0000 - 0000 007F    -->   0xxxxxxx 0000 0080 - 0000 07FF    -->   11

 

Unicode 十六进制码点范围    -->   UTF-8 二进制0000 0000 - 0000 007F    -->   0xxxxxxx

0000 0080 - 0000 07FF    -->   110xxxxx 10xxxxxx                            
0000 0800 - 0000 FFFF    -->   1110xxxx 10xxxxxx 10xxxxxx                        
0001 0000 - 0010 FFFF    -->   11110xxx 10xxxxxx 10xxxxxx 10xxxxxx
                  
                                                        
 

一个字节八个二进制位              

unicode 下汉字占用空间为0X4E00到0x9FA5    0010  1110  0000 0000--> 1001 1111 1010 0101
则转化为utf-8为:1110 0010 -10 111000-10 000000 --> 1110 1001-10 111111-10 100101    

       即:0x00E2 B880            --> 0x00E9 BFA5

utf-8只是改变了unicode的保存形式,提高传输译码效率

python 3.7.2系统使用的是utf-8,但编码转换对应的是unicode;例:ord(汉)=27721,chr(27721)=汉,'汉'对应 unicode为0x6C49,即27721,其utf-8表示为0xE6 0xB7 0x89

 

 

参考:

原文:https://blog.csdn.net/hezh1994/article/details/78899683       

Https://blog.csdn.net/hezh1994/article/details/78899683

 

https://blog.csdn.net/hezh1994/article/details/78899683

http://www.cnblogs.com/xinruzhishui/p/5763894.html

--结束END--

本文标题: utf-8 下汉字为什么需要三个字节

本文链接: https://lsjlt.com/news/182235.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

猜你喜欢
  • utf-8 下汉字为什么需要三个字节
      Unicode 十六进制码点范围    -->   UTF-8 二进制0000 0000 - 0000 007F    -->   0xxxxxxx 0000 0080 - 0000 07FF    -->   11...
    99+
    2023-01-31
    汉字 字节 utf
  • php怎么将汉字转换为UTF-8编码
    这篇文章主要介绍“php怎么将汉字转换为UTF-8编码”,在日常操作中,相信很多人在php怎么将汉字转换为UTF-8编码问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答”php怎么将汉字转换为UTF-8编码”的疑...
    99+
    2023-07-05
  • 为什么redis集群最少需要6个节点
    为什么redis集群最少需要6个节点?针对这个问题,这篇文章详细介绍了相对应的分析和解答,希望可以帮助更多想解决这个问题的小伙伴找到更简单易行的方法。这也算个思考吧,通过redis-trib.rb可创建re...
    99+
    2024-04-02
  • 为什么python中需要命名关键字参数
    这篇文章将为大家详细讲解有关为什么python中需要命名关键字参数,文章内容质量较高,因此小编分享给大家做个参考,希望大家阅读完这篇文章后对相关知识有一定的了解。1、说明*,nkw表示命名关键字参数,是用户想输入的关键字参数名称,定义方式是...
    99+
    2023-06-14
  • Java为什么占用四个字节你知道吗
    目录简单了解计算机为什么要采用二进制表示信息:二进制位分析那么为什么int就占了4个字节呢?问:所有的int都是占四个字节吗?总结简单了解计算机为什么要采用二进制表示信息: 因为计算...
    99+
    2024-04-02
  • 为什么数字化转型不仅需要技术,也需要人的改变?
    事实证明,在一个大型企业中,数字化转型是不可能的。因为传统的中层管理人员会尽其所能地抵制任何对现状的改变。缺乏文化变革通常不会带来有意义的进展。根据Gartner的说法,积极主动和适应性文化是一项关键资产,一些CIO可能会在其企业内建立正确...
    99+
    2023-06-03
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作