返回顶部
首页 > 资讯 > 后端开发 > Python >python3里gbk编码的问题解决
  • 733
分享到

python3里gbk编码的问题解决

2024-04-02 19:04:59 733人浏览 安东尼

Python 官方文档:入门教程 => 点击学习

摘要

在python3有关字符串的处理当中,经常会遇到 'gbk' codec can't encode character '\xa0'这个问题,

python3有关字符串的处理当中,经常会遇到

'gbk' codec can't encode character '\xa0'这个问题,原因是在str里面存在着不能正确编码的字符。

通过以下方法即可解决。

import requests
from bs4 import BeautifulSoup
url = "Http://jecvay.com/2015/03/learning-compilers-1.html"
url = url.encode('gbk','ignore').decode('utf-8') //忽略
response = requests.get(url)
print(response)
soup = BeautifulSoup(response.text)

print(soup.body.text)

以上方法在必须要记录数据的时候会出现数据不准确问题

python3 字符串无法将 gbk 完全转换为utf8

对于必须存储的情况,将gbk -> 十六进制字节码文本 保存,需要的时候在转换为gbk以便显示。

def string_hex(data):
    lin = ['%02X' % i for i in data]
    return "".join(lin).upper()
 
 
def __ToUTF8(tuple):
    lists = []
    for itme in tuple:
        tmp = itme
        if type(itme) == bytes:
            try:
                tmp = itme.decode('gbk')
            except UnicodeDecodeError:
                tmp = string_hex(itme)
        lists.append(tmp)
    return lists
def readFileAll(file):
    with open(file, 'rb') as f:
        data = f.read()
    return data
s = readFileAll('gkb.txt') //gbk 字符串文件
sx = string_hex(s)//转化为16进制文本
print(sx)

 到此这篇关于Python3里gbk编码的问题解决的文章就介绍到这了,更多相关python3 gbk编码内容请搜索编程网以前的文章或继续浏览下面的相关文章希望大家以后多多支持编程网!

--结束END--

本文标题: python3里gbk编码的问题解决

本文链接: https://lsjlt.com/news/120079.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

猜你喜欢
  • python3里gbk编码的问题解决
    在python3有关字符串的处理当中,经常会遇到 'gbk' codec can't encode character '\xa0'这个问题,...
    99+
    2024-04-02
  • 解决python3 中的np.load编码问题
    由于在Python2 中的默认编码为ASCII,但是在Python3中的默认编码为UTF-8。 问题: 所以在使用np.load(det.npy)的时候会出现错误提示: you m...
    99+
    2024-04-02
  • Python3的编码问题
    ​介绍Python3中的编码问题前,第一个段落对字节、ASCII​与Unicode与UTF-8等进行基本介绍,如果不对这几种编码犯头晕,可直接跳过。 ASCII​与Unicode与UTF-8与GBK 首先从老大哥说起。跟很多人一样,...
    99+
    2023-01-31
  • maven编码gbk的不可映射字符问题怎么解决
    在Maven编码为GBK的情况下,如果遇到不可映射字符的问题,可以使用下面的解决方法:1. 修改源代码文件的编码:将源代码文件的编码...
    99+
    2023-09-23
    maven
  • 详解nodejs爬虫程序解决gbk等中文编码问题
    使用nodejs写了一个爬虫的demo,目的是提取网页的title部分。 遇到最大的问题就是网页的编码与nodejs默认编码不一致造成的乱码问题。nodejs支持utf8, ucs2, ascii, b...
    99+
    2022-06-04
    爬虫 中文 详解
  • Python3如何解决字符编码问题详解
    编码 因为计算机只能处理数字,如果要处理文本,就必须先把文本转换为数字才能处理。最早的计算机在设计时采用8个比特(bit)作为一个字节(byte),所以,一个字节能表示的最大的整数就是255(二进制1111...
    99+
    2022-06-04
    如何解决 详解 字符
  • python3编码问题汇总
    这两天写了个监测网页的爬虫,作用是跟踪一个网页的变化,但运行了一晚出现了一个问题。。。。希望大家不吝赐教! 我用的是python3,错误在对html response的decode时抛出,代码原样为: ...
    99+
    2022-06-04
  • 解决uWSGI的编码问题详解
    发现问题 最近工作中遇到一个问题,在把 Flask 写的应用通过 Supervisor+uWSGI 部署到正式服务器上时,出现了这样的错误: Unable to print the message an...
    99+
    2022-06-04
    详解 uWSGI
  • java编码GBK的不可映射怎么解决
    在Java编码中,如果使用GBK编码遇到了不可映射的字符,可以尝试以下几种解决方法:1. 使用其他编码:尝试使用其他能够支持该字符的...
    99+
    2023-08-26
    java
  • 怎么用UTF-8解决GBK中生僻字乱码问题
    这篇文章主要介绍“怎么用UTF-8解决GBK中生僻字乱码问题”,在日常操作中,相信很多人在怎么用UTF-8解决GBK中生僻字乱码问题问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解...
    99+
    2024-04-02
  • R语言编码问题的解决
    今天博客主要是解决一个学R语言里面最最痛苦的问题(嗯,python2.x里面也有),就是中文乱码问题: 一般用R语言的同学,多半遇见过以下这个问题: 反正虾神我每次遇见这个问题,立...
    99+
    2024-04-02
  • python中文编码乱码问题的解决
    目录前言:一、什么是字符编码。1.ASCII2.GB23123.Unicode4.UTF-8二、Python2中的字符编码三、decode()与encode()方法四、一个字符编码的...
    99+
    2024-04-02
  • 如何解决mysql编码问题
    解决mysql编码问题的方法更改数据库安装时的字符编码。打开mysql安装目录。找到my.ini文件,以记事本的方式打开。直接修改配置文件的字符编码为utf8,如:default-character-set=utf8character-se...
    99+
    2024-04-02
  • php5.6 gbk乱码的解决方法
    这篇文章主要介绍php5.6 gbk乱码的解决方法,文中介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们一定要看完!php5.6 gbk乱码的解决办法:首先在“/etc/php.ini”的php标签下增加参数“default_chars...
    99+
    2023-06-15
  • python3安装解决ssl问题
    1 安装python3.6可能使用的依赖 yum install openssl-devel bzip2-devel expat-devel gdbm-devel readline-devel sqlite-devel gcc gcc-...
    99+
    2023-01-31
    ssl
  • python2.7的编码问题与解决方法
    前言 Python的编码问题基本是每个新手都会遇到的坎,但只要完全掌握了就跳过了这个坑,万变不离其中,下面给大家整理了在python2.7遇到的编码问题,下面来一起看看吧。 一、直接在python文件内修改...
    99+
    2022-06-04
    解决方法
  • Python3的URL编码解码
    博主最近在用python3比较强大的Django开发web的时候,发现一些url的编码问题,在浏览器提交请求api时,如果url中包含汉子,就会被自动编码掉。呈现的结果是 ==> %xx%xx%xx。如果出现3个百分号为一个原字符则...
    99+
    2023-01-31
    URL
  • 如何解决PHP base64编码后解码乱码的问题
    如何解决PHP base64编码后解码乱码的问题 PHP base64编码后解码乱码的解决办法:用GET形式传递时,防止【+】号被替换成空格即可,代码为【$str = base64_decode(str_replace(" ","...
    99+
    2023-09-06
    servlet java html
  • MySQL解决字符集编码问题
    目录前言方法1:在创建数据库时,指定字符集方法2: 更改mysql的配置文件前言 MySQL的默认编码方式是 拉丁文,如果想要设置一些汉字的数据.可能会报错.分享一下我解决这个问题时的方法.1. 在创建数据库时,指定字符...
    99+
    2023-04-12
    MySQL解决字符集编码 字符集编码问题 MySQL字符集
  • 怎么解决MySQL Invalid gbk character string 1300报错问题
    这篇文章主要讲解了“怎么解决MySQL Invalid gbk character string 1300报错问题”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学...
    99+
    2024-04-02
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作