专注Java教育14年 全国咨询/投诉热线:400-8080-105
动力节点LOGO图
始于2009,口口相传的Java黄埔军校
首页 学习攻略 Java学习 Java中文乱码的处理技巧

Java中文乱码的处理技巧

更新时间:2022-07-27 11:35:03 来源:动力节点 浏览13955次

Java中文乱码的处理技巧是什么?动力节点小编来告诉大家。

Java中文乱码的处理技巧

1.为了处理Java中文乱码问题,需要了解字符、字符集、编码的概念。

字符:是文字和符号的总称,包括文字、图形符号、数学符号等。

字符集:是一组抽象的字符。一个字符集往往对应一种特定的语言文本,文本中的所有字符或大部分常用字符构成文本的字符集,如英文字符集。繁体汉字集、日文汉字集等计算机要处理各种字符,需要将字符与二进制内码对应起来。

这种对应就是字符编码:首先要确定字符集,对字符集中的字符进行排序,再对应二进制数。根据字符集中的字符数,使用多少字节进行编码。每种编码都定义了一组明确的字符,称为编码字符集(Coded Character Set),这是字符集的另一种含义。最常被称为字符集的就是这个意思。

2.如果要处理java中文乱码的问题,还必须了解我们常用的编码方式:ASCII编码是目前计算机中使用最广泛的字符集和编码。ISO8859-1可以表达西欧语言。看起来很单一,为什么还在用呢?因为是单字节编码,和计算机最基本的表示单位是一致的,所以很多时候,还是用ISO-8859-1编码来表示。并且在许多协议中,默认使用这种编码。

Unicode(unicode 、通用码、单码)是计算机上使用的字符编码。通常我们遇到太多的UTF-8,也就是Unicode编码的实现,请务必区分。

GB2312字符集是简化字符集;BIG5字符集是台湾繁体字符集;GBK字符集是简繁字符集,包括GB字符集、BIG5字符集和一些符号。GB18030是国家制定的强制性大字符集标准。汉字集的引入有统一的标准。Linux系统使用默认ISO-8859-1编码,Win32系统默认使用GB2312编码。

3.了解乱码是怎么产生的,java中文乱码怎么处理?如果保存时字符的编码格式与要显示的编码格式不同,就会出现乱码问题。海浪在做开发的时候,始终提倡开发环境编码一致。比如页面编码、数据库编码等。Java在运行时总是使用Unicode来存储字符,这有利于支持多语言环境。

我们在开发过程中经常使用文件读取。当Java读取文件,它使用系统默认编码来解码文件。因此,您可以使用FileInputStream类指定读取文件的编码。JSP页面乱码通常只需要在页面开头用如下代码指定字符集编码即可。如果还是不行,请用下面这句话转换str=new String(str.getBytes("ISO-8859-1"),"页面编码方式"); JAVA在网络传输中使用的编码是“ISO-8859-1” ,所以需要在输出时进行转换,如:String str=new String(str.getBytes("开发环境代码"),"ISO-8859-1");网络编码后中文必须正确,必须在类似Stirng的页面显示 str=new String(str.getBytes("ISO-8859-1"), "开发环境代码");这样解码。

4.为了避免不必要的Java中文乱码,首先要从源头做起。这意味着什么?这意味着在项目开发中,首先要让我们的开发环境统一编码。例如,使用的开发环境是Eclipse +Tomcat5.0+SQLServer 2005 。项目的代码可以在Eclipse的项目属性中设置, JSP页面可以设置统一的代码。

提交申请后,顾问老师会电话与您沟通安排学习

免费课程推荐 >>
技术文档推荐 >>