返回顶部
首页 > 资讯 > 精选 >java编码转换过程是怎样的
  • 702
分享到

java编码转换过程是怎样的

2023-07-06 03:07:00 702人浏览 安东尼
摘要

本文小编为大家详细介绍“java编码转换过程是怎样的”,内容详细,步骤清晰,细节处理妥当,希望这篇“java编码转换过程是怎样的”文章能帮助大家解决疑惑,下面跟着小编的思路慢慢深入,一起来学习新知识吧。java中的编码转换(以utf8和gb

本文小编为大家详细介绍“java编码转换过程是怎样的”,内容详细,步骤清晰,细节处理妥当,希望这篇“java编码转换过程是怎样的”文章能帮助大家解决疑惑,下面跟着小编的思路慢慢深入,一起来学习新知识吧。

    java中的编码转换(以utf8和gbk为例)

    在正常javaweb开发中经常会发现字符转换的需求,会存在中文字符转换乱码的现象,如何解决以及其转换原理我至今懵懵懂懂,于是专门写了个测试代码进行尝试,总算理清了编码,先上结论,总结如下:

    utf8中存放有各种语言编码,当前主流开发中会使用utf8进行编码解码,该方式不会产生乱码,产生乱码有以下几种情况

    • gbk(中文)、iso-8859-1(无中文)等其他方式进行编码,则只能用其对应方式进行解码,否则为乱码

    • 使用utf8进行编码用其他方式解码则会导致乱码,需进行一次转换

    • 使用无对应字符(中文)的字符集(iso-8859-1)编码会导致乱码,且无法还原解码

    以下是针对以上情况的代码测试

    如何编码就如何解码

    @Testpublic void test0() {    String test = "测试";    System.out.println(Arrays.toString(test.getBytes(StandardCharsets.UTF_8)));//[-26, -75, -117, -24, -81, -107]    System.out.println(new String(test.getBytes(StandardCharsets.UTF_8), StandardCharsets.UTF_8));//测试}
    @Testpublic void test1() throws UnsupportedEncodingException {    String test = "测试";    System.out.println(Arrays.toString(test.getBytes("gbk")));//[-78, -30, -54, -44]    System.out.println(new String(test.getBytes("gbk"), "GBK"));//测试}

    utf8编码 - 错误形式解码

    @Testpublic void test2() throws UnsupportedEncodingException {    String test = "测试";    System.out.println(Arrays.toString(test.getBytes(StandardCharsets.UTF_8)));//[-26, -75, -117, -24, -81, -107]    System.out.println(new String(test.getBytes(StandardCharsets.UTF_8), "gbk"));//娴嬭瘯}

    正确做法,按错误的解码形式(gbk)作为中转,将其按错误形式(gbk)重新还原编码(utf8-encode),再使用utf8进行一次正确解码(utf8-decode)即可得到原来的字符

    @Testpublic void test3() throws UnsupportedEncodingException {    String test = "测试";    String test_gbk_utf8 = new String(test.getBytes(StandardCharsets.UTF_8), "gbk");    System.out.println(test_gbk_utf8);//娴嬭瘯    String test_utf8_gbk = new String(test_gbk_utf8.getBytes("gbk"), StandardCharsets.UTF_8);    System.out.println(test_utf8_gbk);//测试}

    无对应字符编码

    @Test    public void test4() throws UnsupportedEncodingException {        String test = "测试";        System.out.println(Arrays.toString(test.getBytes(StandardCharsets.ISO_8859_1)));//[63, 63]        System.out.println(new String(test.getBytes(StandardCharsets.ISO_8859_1), StandardCharsets.ISO_8859_1));//??    }

    该情况下即使使用原先的编码方式进行解码也无法还原字符了,属于不可逆的状态

    java编码格式的转换以及乱码恢复

    如何在java中进行编码格式转换

    下面这行代码的含义是: 获取目标字符串str的gbk编码格式的二进制码,然后将二进制码按照utf8编码格式重新编码成字符串,当然,下面这种写法百分百会乱码,因为编码格式不一致.

    new String(str.getBytes("gbk"),"utf8")

    首先什么情况会乱码

    如果要传输一个字符串,首先要按照一定的编码格式将字符串转换成字节流,当字节流传输到接收方的时候再将字节流按照某种编码格式转换成字符串.乱码也正是产生在重新转换成字符串的过程中.以下是我对中文乱码的测试:

      String str="彩虹";        String [] a=new String[] {"gbk","unicode","utf8","gb2312"};        for (int i=0;i<a.length;i++){            for (int j=0;j<a.length;j++){                System.out.println("二进制格式:   "+a[i]+"编码格式:  "+a[j]);                System.out.println("编码后的字符串:  "+new String(str.getBytes(a[i]),a[j]));             }        }

    二进制格式:   gbk编码格式:  gbk
    编码后的字符串:  彩虹
    二进制格式:   gbk编码格式:  unicode
    编码后的字符串:  닊뫧
    二进制格式:   gbk编码格式:  utf8
    编码后的字符串:  �ʺ�
    二进制格式:   gbk编码格式:  gb2312
    编码后的字符串:  彩虹
    二进制格式:   unicode编码格式:  gbk
    编码后的字符串:  �_i唝
    二进制格式:   unicode编码格式:  unicode
    编码后的字符串:  彩虹
    二进制格式:   unicode编码格式:  utf8
    编码后的字符串:  ��_i�y
    二进制格式:   unicode编码格式:  gb2312
    编码后的字符串:  ��_i�y
    二进制格式:   utf8编码格式:  gbk
    编码后的字符串:  褰╄櫣
    二进制格式:   utf8编码格式:  unicode
    编码后的字符串:  ꧨ馹
    二进制格式:   utf8编码格式:  utf8
    编码后的字符串:  彩虹
    二进制格式:   utf8编码格式:  gb2312
    编码后的字符串:  褰╄��
    二进制格式:   gb2312编码格式:  gbk
    编码后的字符串:  彩虹
    二进制格式:   gb2312编码格式:  unicode
    编码后的字符串:  닊뫧
    二进制格式:   gb2312编码格式:  utf8
    编码后的字符串:  �ʺ�
    二进制格式:   gb2312编码格式:  gb2312
    编码后的字符串:  彩虹

    可以看出,如果二进制编码格式和字符串的编码格式不同就会引起乱码.

    为什么gbk,gb2312转换没有乱码?

    gbk和gb2312之间的转换没有乱码是因为gbk是gb2312的增强版本,支持更多的汉字编码,所以如果二进制编码格式是gbk而解码格式是gb2312,这种情况是有可能出现部分汉字乱码的.

    乱码的数据可以转变回来吗?

    上述结果中的乱码其实可以大致分为两种,一种是复杂的汉字和图形组合,一种是"?".

    如果希望恢复的乱码数据中有问号,那么这条数据恢复的可能性就不大了.因为除了"?"的其他乱码其实都是有自己的编码规则的,只要逆向的解码并按照正确的编码格式重新编码就可以恢复.但是"?"除外,因为当字节流按照某种编码格式重新编译的时候,字节数据中无法按照该编码格式转换成有意义字符的字节都会转换成"?",所以就算逆向的编码成字节流,所有的"?"都会转换成同一字节,也就失去了他本身的意义.

    如果乱码中不包含"?",那么还是有希望转换回去的,我以上述乱码中的 "褰╄櫣" 为例重新进行了一次转换,代码如下:

           String str="褰╄櫣";        String [] charset=new String[] {"gbk","unicode","utf8","gb2312"};        for (int i=0;i<charset.length;i++){            for (int j=0;j<charset.length;j++){                System.out.println("二进制格式:   "+charset[i]+"编码格式:  "+charset[j]);                System.out.println("编码后的字符串:  "+new String(str.getBytes(charset[i]),charset[j]));             }        }

    二进制格式:   gbk编码格式:  gbk
    编码后的字符串:  褰╄櫣
    二进制格式:   gbk编码格式:  unicode
    编码后的字符串:  ꧨ馹
    二进制格式:   gbk编码格式:  utf8
    编码后的字符串:  彩虹
    二进制格式:   gbk编码格式:  gb2312
    编码后的字符串:  褰╄��
    二进制格式:   unicode编码格式:  gbk
    编码后的字符串:  ��0%Dj�
    二进制格式:   unicode编码格式:  unicode
    编码后的字符串:  褰╄櫣
    二进制格式:   unicode编码格式:  utf8
    编码后的字符串:  ���0%Dj�
    二进制格式:   unicode编码格式:  gb2312
    编码后的字符串:  ���0%Dj�
    二进制格式:   utf8编码格式:  gbk
    编码后的字符串:  瑜扳晞娅�
    二进制格式:   utf8编码格式:  unicode
    编码后的字符串:  냢閄�
    二进制格式:   utf8编码格式:  utf8
    编码后的字符串:  褰╄櫣
    二进制格式:   utf8编码格式:  gb2312
    编码后的字符串:  瑜扳��娅�
    二进制格式:   gb2312编码格式:  gbk
    编码后的字符串:  褰╄?
    二进制格式:   gb2312编码格式:  unicode
    编码后的字符串:  ꧨ�
    二进制格式:   gb2312编码格式:  utf8
    编码后的字符串:  彩�?
    二进制格式:   gb2312编码格式:  gb2312
    编码后的字符串:  褰╄?

    可以看到 其中一种转换方式成功的将乱码转变回了正常的中文汉字

    二进制格式:   gbk编码格式:  utf8
    编码后的字符串:  彩虹

    读到这里,这篇“java编码转换过程是怎样的”文章已经介绍完毕,想要掌握这篇文章的知识点还需要大家自己动手实践使用过才能领会,如果想了解更多相关内容的文章,欢迎关注编程网精选频道。

    --结束END--

    本文标题: java编码转换过程是怎样的

    本文链接: https://lsjlt.com/news/357466.html(转载时请注明来源链接)

    有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

    猜你喜欢
    • java编码转换过程是怎样的
      本文小编为大家详细介绍“java编码转换过程是怎样的”,内容详细,步骤清晰,细节处理妥当,希望这篇“java编码转换过程是怎样的”文章能帮助大家解决疑惑,下面跟着小编的思路慢慢深入,一起来学习新知识吧。java中的编码转换(以utf8和gb...
      99+
      2023-07-06
    • java中的编码转换过程是什么
      在Java中,编码转换的过程通常包括以下几个步骤:1. 读取输入数据:首先,从输入源(例如文件、网络连接或内存)中读取原始的字节数据...
      99+
      2023-08-16
      java
    • java中的编码转换过程(以utf8和gbk为例)
      目录java中的编码转换(以utf8和gbk为例)以下是针对以上情况的代码测试java编码格式的转换以及乱码恢复如何在java中进行编码格式转换首先什么情况会乱码为什么gbk,gb2...
      99+
      2023-05-15
      java中的编码 java编码转换 java utf8和gbk
    • Linux中的编码转换程序convmv的安装和使用教程是怎样的
      今天就跟大家聊聊有关Linux中的编码转换程序convmv的安装和使用教程是怎样的,可能很多人都不太了解,为了让大家更加了解,小编给大家总结了以下内容,希望大家根据这篇文章可以有所收获。今天介绍个文件名转码的工具--convmv,convm...
      99+
      2023-06-12
    • Java 8 - Base64-编码转换
      在 Java 8 中,提供了 java.util.Base64 类来进行 Base64 编码和解码操作。 import java.util.Base64;public class MyBase64Example { public st...
      99+
      2023-08-18
      java
    • 剖析Python源代码编制过程是怎么样的
      剖析Python源代码编制过程是怎么样的,相信很多没有经验的人对此束手无策,为此本文总结了问题出现的原因和解决方法,通过这篇文章希望你能解决这个问题。Python语言中提供的re模块能支持正则表达式,还提供SGML,XML分析模块,大多数的...
      99+
      2023-06-17
    • java的运行过程是怎样的
      这篇文章给大家介绍java的运行过程是怎样的,内容非常详细,感兴趣的小伙伴们可以参考借鉴,希望对大家能有所帮助。java的运行流程一,我们所看不到的:1,如果java文件没有package,就默认给文件加上"无名"pac...
      99+
      2023-06-03
    • Java String类型的编码方式转换是什么
      这篇文章主要讲解了“Java String类型的编码方式转换是什么”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“Java String类型的编码方式转换是什么”吧!String类型的编码方式...
      99+
      2023-07-05
    • J2ME中KVM编译过程是怎样的
      今天就跟大家聊聊有关J2ME中KVM编译过程是怎样的,可能很多人都不太了解,为了让大家更加了解,小编给大家总结了以下内容,希望大家根据这篇文章可以有所收获。这里向大家简单介绍一下Windows下编译KVM的...
      99+
      2024-04-02
    • mysql big5转 utf-8的转换程式是怎么样的
      今天就跟大家聊聊有关mysql big5转 utf-8的转换程式是怎么样的,可能很多人都不太了解,为了让大家更加了解,小编给大家总结了以下内容,希望大家根据这篇文章可以有所收获。這支程式 會 dump 出 ...
      99+
      2024-04-02
    • java doc线程关键代码的编写是怎样的
      这期内容当中小编将会给大家带来有关java doc线程关键代码的编写是怎样的,文章内容丰富且以专业的角度为大家分析和叙述,阅读完这篇文章希望大家可以有所收获。java doc线程在使用的时候需要我们不断学习相关问题,下面我们就详细的看看如何...
      99+
      2023-06-17
    • Java Unicode和中文编码转换
              今天在开发项目的时候,第三方提供的接口返回的数据是经过Unicode编码的,我们使用的时候多有不便,所以经过代码将Unicode解码才能使用,故记录一下使用Java进行Unicode和中文的互转。通常我们在安全优先级不是特...
      99+
      2023-09-02
      java 开发语言
    • Java类的加载过程是怎样的
      这篇文章主要讲解了“Java类的加载过程是怎样的”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“Java类的加载过程是怎样的”吧!  一、加载  在加载阶段,虚拟机主要完成三件事:  1.通过...
      99+
      2023-06-02
    • HTTP转换HTTPS的过程是什么
      这篇文章主要讲解了“HTTP转换HTTPS的过程是什么”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“HTTP转换HTTPS的过程是什么”吧!我们知道,HTTP请求都是明文传输的,所谓的明文指...
      99+
      2023-06-27
    • javascript的类型转换是怎样的
      javascript的类型转换是怎样的,很多新手对此不是很清楚,为了帮助大家解决这个难题,下面小编将为大家详细讲解,有这方面需求的人可以来学习下,希望你能有所收获。数字转字符串toString()方法。如:1.toString()。该方法无...
      99+
      2023-06-26
    • Java之String类型的编码方式转换
      目录String类型的编码方式转换String字符集的编码和解码String编码String解码总结String类型的编码方式转换 在JAVA中,String类型的编码方式转换,St...
      99+
      2023-02-28
      Java String类型 String类型编码 String类型编码转换
    • java编程两种树形菜单结构的转换代码
      首先看看两种树形菜单结构的代码示例。SingleTreeNode:package com.zzj.tree;public class SingleTreeNode {private int id;private int pId;privat...
      99+
      2023-05-30
      java 树形菜单 转换
    • Java详解entity转换到vo过程
      目录起因1. 将Entity转化为Vo2. 将List<Entity>转换为List<Vo>封装到工具类后使用性能以及原理ConvertUtil工具类源码起因...
      99+
      2024-04-02
    • java中文编码转换的方法有哪些
      Java中常用的编码转换方法有以下几种:1. 使用`String`类的构造方法:```javaString str = new St...
      99+
      2023-08-16
      java
    • Java线程生命周期及转换过程
      目录Java 线程生命周期生命周期转换1.从 NEW 到 RUNNABLE2.从 RUNNABLE 到 BLOCKED3.从 RUNNABLE 到 WAITTING4.从 RUNNA...
      99+
      2024-04-02
    软考高级职称资格查询
    编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
    • 官方手机版

    • 微信公众号

    • 商务合作