返回顶部
首页 > 资讯 > 后端开发 > JAVA >java出现乱码的原因与解决方法详解
  • 258
分享到

java出现乱码的原因与解决方法详解

java基础java乱码 2017-02-06 23:02:58 258人浏览 猪猪侠
摘要

java在字符串中统一用Unicode表示。(推荐:java视频教程)对于任意一个字符串:String string = “测试字符串”;如果源文件是GBK编码,操作系统默认环境编码也为GBK,那么编译的时候,JVM将按照GBK编码将字节数

java在字符串中统一用Unicode表示。(推荐:java视频教程

对于任意一个字符串:String string = “测试字符串”;

如果源文件是GBK编码,操作系统默认环境编码也为GBK,那么编译的时候,JVM将按照GBK编码将字节数组解析为字符,然后将字符转换为Unicode格式的字节数组,作为内部存储(字节数组→字符→Unicode字节数组)

当打印这个字符串时,JVM根据操作系统本地的语言环境,将Unicode转换为GBK,然后操作系统将GBK格式的内容显示出来。

源码文件是UTF-8, 我们需要通知编译器源码的格式,javac -encoding utf-8 … , 编译时,JVM按照utf-8 解析成字符,然后转换为unicode格式的字节数组, 那么不论源码文件是什么格式,同样的字符串,最后得到的unicode字节数组是完全一致的,显示的时候,也是转成GBK来显示(跟OS环境有关)

乱码是如何产生的?

本质上都是由于字符串原本的编码格式与读取时解析用的编码格式不一致导致的。

乱码指的是程序显示出来的字符文本无法用任何语言去解读。一般情况下会包含大量的?。乱码问题是所有计算机用户或多或少会遇到的问题。

造成乱码的原因就是因为使用了错误的字符编码去解码字节流,因此当我们在思考任何跟文本显示有关的问题时,请时刻保持清醒:当前使用的字符编码是什么。只有这样,我们才能正确分析和处理乱码问题。

例如最常见的网页乱码问题。如果你是网站技术人员,遇到这样的问题,需要检查以下原因:

服务器返回的响应头Content-Type没有指明字符编码

网页内是否使用META Http-EQUIV标签指定了字符编码

网页文件本身存储时使用的字符编码和网页声明的字符编码是否一致

java代码中的乱码问题如何解决呢?

例如:String s = “测试字符串”;

System.out.println( new String(s.getBytes(),"UTF-8")); 
//错误,因为getBytes()默认使用GBK编码, 而解析时使用UTF-8编码,肯定出错。

其中getBytes()是将Unicode转换为操作系统默认格式的字节数组,即“测试字符串”的GBK格式,new String (bytes, Charset) 中的charset 是指定读取byte的方式,这里指定为UTF-8,即把bytes的内容当做UTF-8来读取。

如下两种方式得到的结果都是正确的,因为它们的源内容编码和解析用的编码是一致的。

System.out.println( new String(s.getBytes(),"GBK"));
System.out.println( new String(s.getBytes("UTF-8"),"UTF-8"));

那么,如何利用getBytes 和 new String() 来进行编码转换呢?

网上流传着一种错误的方法:

GBK--> UTF-8: new String( s.getBytes("GBK") , "UTF-8);

这种方式是完全错误的,因为getBytes 的编码与 UTF-8 不一致,肯定是乱码。

但是为什么在Tomcat 下,使用 new String(s.getBytes(“iso-8859-1”) ,”GBK”) 却可以用呢?

答案是:

tomcat 默认使用iso-8859-1编码, 也就是说,如果原本字符串是GBK的,tomcat传输过程中,将GBK转成iso-8859-1了,默认情况下,使用iso-8859-1读取中文肯定是有问题的。

那么我们需要将iso-8859-1 再转成GBK, 而iso-8859-1 是单字节编码的,即他认为一个字节是一个字符, 那么这种转换不会对原来的字节数组做任何改变,因为字节数组本来就是由单个字节组成的。

如果之前用GBK编码,那么转成iso-8859-1后编码内容完全没变, 则 s.getBytes(“iso-8859-1”) 实际上还是原来GBK的编码内容则 new String(s.getBytes(“iso-8859-1”) ,”GBK”) 就可以正确解码了。 所以说这是一种巧合。

如何正确的将GBK转UTF-8 ? (实际上是unicode转UTF-8)

//利用getBytes将unicode字符串转成UTF-8格式的字节数组,然后用utf-8 对这个字节数组解码成新的字符串
new String( s.getBytes("utf-8") , "utf-8");

UTF-8 转GBK原理也是一样
new String( s.getBytes("GBK") , "GBK");

其实核心工作都由getBytes(charset)做了。getBytes的jdk描述:Encoding this String into a sequence of bytes using the named charset,storing the result into a new byte array.

OutputStreamWriter w1 = new OutputStreamWriter(new FileOutputStream("D:file1.txt"),"UTF-8");
InputStreamReader( stream, charset)

可以帮助我们轻松的按照指定编码读写文件。

附录:
HttpClient post请求中文乱码问题解决

最近接到现场同事反馈,在掉接口的过程中,厂家收到的请求报文中文是乱码的。我检查了版控的代码,找到如下解决办法:

原始代码(中文乱码):

HttpPost httpPost = new HttpPost(url);
DefaultHttpClient httpClient = new DefaultHttpClient();
//请求头
httpPost.setHeader("Accept", MediaType.APPLICATioN_JSON);
httpPost.setHeader("Content-Type", "application/json;charset=UTF-8");
//请求实体
StringEntity reqEntity = new StringEntity(reqStr);
httpPost.setEntity(reqEntity);
//获取响应
HttpResponse httpResp = httpClient.execute(httpPost);
HttpEntity respEntity = httpResp.getEntity();

解决办法:

方法一:
//请求实体
HttpEntity reqEntity = new ByteArrayEntity(reqStr.getBytes("UTF-8"));
//StringEntity reqEntity = new StringEntity(reqStr);
httpPost.setEntity(reqEntity);

方法二:
//请求实体
StringEntity reqEntity = new StringEntity(reqStr,Charset.forName("UTF-8"));
httpPost.setEntity(reqEntity);

更多java知识请关注Java基础教程栏目。

--结束END--

本文标题: java出现乱码的原因与解决方法详解

本文链接: https://lsjlt.com/news/4556.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

猜你喜欢
  • java出现乱码的原因与解决方法详解
    java在字符串中统一用Unicode表示。(推荐:java视频教程)对于任意一个字符串:String string = “测试字符串”;如果源文件是GBK编码,操作系统默认环境编码也为GBK,那么编译的时候,JVM将按照GBK编码将字节数...
    99+
    2017-02-06
    java基础 java 乱码
  • java汉字乱码的原因与解决方法
    在基于Java的编程中,经常会碰到汉字的处里及显示的问题,比如一大堆乱码或问号。这是因为JAVA中默认的编码方式是UNICODE,而中国人通常使用的文件和DB都是基于GB2312或者BIG5等编码,故会出现此问题。推荐:java基础教程1、...
    99+
    2021-11-01
    java
  • MySQL出现乱码的原因及解决方法
    本篇内容主要讲解“MySQL出现乱码的原因及解决方法”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“MySQL出现乱码的原因及解决方法”吧!MySQL出现乱码的原...
    99+
    2024-04-02
  • java导出excel乱码解决方法及原因
    java导出错误方式与正确方法:(推荐:java视频教程)错误方式: response.setHeader("Content-Disposition", "inline;filename="+ new String(fileName.get...
    99+
    2019-01-11
    java
  • java导出excel乱码原因及解决方法
    java导出错误方式与正确方法:(推荐:java视频教程)错误方式: response.setHeader("Content-Disposition", "inline;filename="+ new String(fileName.get...
    99+
    2015-10-16
    java基础 java
  • python中urllib.unquote乱码的原因与解决方法
    发现问题 Python中的urllib模块用来处理url相关的操作,unquote方法对应javascript中的urldecode方法,它对url进行解码,把类似"%xx"的字符替换成单个字符,例如:“%...
    99+
    2022-06-04
    乱码 解决方法 原因
  • java zip压缩乱码原因与解决方法介绍
    java zip压缩乱码的原因与解决方法:(推荐:java视频教程)运行环境Jdk 1.5,win 7中文版JDK1.5中有zip压缩相关的API,在java.util.zip包下面。正常情况下,使用JDK自带的API把目录(文件)压缩成z...
    99+
    2015-12-05
    java
  • 分析phpexcel中出现乱码的原因和解决方法
    随着PHP语言在开发中的广泛应用,越来越多的开发者遇到过phpexcel输出乱码的情况。面对这种问题,大家不要慌张,本文将向大家介绍phpexcel中出现乱码的原因和解决方法。一、乱码产生的原因编码问题phpexcel文件的编码设置与本地环...
    99+
    2023-05-14
  • java文件读取中文乱码的原因与解决方法
    最近遇到一个问题,Java读取文本文件(例如csv文件、txt文件等),遇到中文就变成乱码。(推荐:java视频教程)读取代码如下:List lines=new ArrayList(); BufferedReader br = ne...
    99+
    2015-03-18
    java
  • PHP开发出现中文乱码的原因及解决方法
    本篇内容主要讲解“PHP开发出现中文乱码的原因及解决方法”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“PHP开发出现中文乱码的原因及解决方法”吧!一.首先是PHP网页的编码php文件本身的编码与...
    99+
    2023-06-17
  • java文件出现乱码解决方法
    做java开发的过程中由于编码问题打开项目发现里面的中文都是乱码,这种情况我们可以在eclipse中设置对应的编码显示,或者把项目里的java文件都转为支持的编码就好了。解决方法:首先我们可以打开工具菜单“Project”--“Proper...
    99+
    2019-06-07
    java 乱码
  • PHP出现中文乱码的原因及解决方法是什么
    本篇内容主要讲解“PHP出现中文乱码的原因及解决方法是什么”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“PHP出现中文乱码的原因及解决方法是什么”吧!PHP出现中文乱码的原因字符集编码不一致常常...
    99+
    2023-07-05
  • 乱码问题的原因及解决方法
    这篇文章主要讲解了“乱码问题的原因及解决方法”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“乱码问题的原因及解决方法”吧!PHP乱码问题1、PHP 如何处理上传的CSV文件?可以用fgetcs...
    99+
    2023-06-17
  • 浅析PHP输出汉字乱码的原因及解决方法
    PHP是一种开源的服务器端脚本语言,被广泛应用于Web开发。但是,在进行中文字符的输出时,经常会发生字符集转换的问题而出现乱码,这是让许多开发人员头疼的问题。本文将介绍PHP输出汉字乱码的原因及解决方法。原因分析在PHP中,字符编码主要有两...
    99+
    2023-05-14
    php 乱码
  • java文件读取出现乱码解决方法
    java读取文件出现乱码解决方法:(推荐:java视频教程)首先将要读取的文本文件的编码格式设置为UTF-8使用InputStreamReader类取读取文件,因为它的构造方法中可以指定字符集,将它的字符集指定为UFT-8的格式。例:Buf...
    99+
    2020-06-12
    java 乱码
  • Oracle乱码提示的原因分析与解决方案
    标题:Oracle乱码提示的原因分析与解决方案 在使用Oracle数据库过程中,经常会遇到乱码显示的问题,这不仅影响数据的正确性,还会给数据处理与展示带来困扰。本文将从Oracle乱码...
    99+
    2024-03-09
    解决方案 oracle 乱码
  • Mysql数据库乱码的原因及解决方法
    这篇文章主要介绍“Mysql数据库乱码的原因及解决方法”,在日常操作中,相信很多人在Mysql数据库乱码的原因及解决方法问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答”Mysq...
    99+
    2024-04-02
  • 浅析Golang中乱码的原因及解决方法
    Golang的多语言支持和Unicode字符集的全面支持使其成为开发者的一种非常流行的语言选择。但是,有些开发者在使用Golang时会遇到乱码问题,特别是在处理中文字符时更为常见。本文将介绍Golang中可能出现的乱码问题、原因以及解决方法...
    99+
    2023-05-14
    Golang 乱码
  • 探讨golang oracle乱码的原因和解决方法
    在Golang使用Oracle数据库时,出现乱码的问题是比较常见的,具体表现为在数据库中插入的汉字或其他特殊字符无法正确显示。这个问题可能有多个原因,下面我们来逐一分析并解决。首先,我们需要确认Oracle数据库本身是否支持中文字符集。在数...
    99+
    2023-05-14
  • PHP5.6乱码的原因及解决方法是什么
    本篇内容介绍了“PHP5.6乱码的原因及解决方法是什么”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!1.原因乱码的出现是由于字符集的不匹配或...
    99+
    2023-07-05
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作