当前位置:首页 > 女频小说 > 综漫之玩家3245917

第六卷:死神 chapter 16

    正文第一段:

    在离露琪亚处刑还有十四天的时候,双殛的解放许可下达,露琪亚被移动到了仟罪宫四深牢。

    正文高|潮:

    白哉皱了皱眉:“你想说什么?”

    “绕与颈项,代表束缚,朽木家的主人必须有被束缚在规则之下的觉悟;垂于肩背,代表责任,朽木家的主人所背负的,是因为规则而失去自由的灵魂。”掏出手绢擦去他脸上的血污:“别再把银白风花纱解下了,这是内心动摇的表现。”

    正文最后一段:

    转身离开,即使不跟着我也知道,这场处刑不会就这么顺利地进行。

    那本就是我一手制造的障碍!

    嗯,以下随便说说什么--

    盗文的孩子们辛苦了,基本上更新后3个小时内就会被盗,虽然不知道这是职业还是仅仅出于“共享”的精神,但是——辛苦了!

    我其实不反对所谓的“网络共享”,毕竟互联网这种平台太过自由,各种各样的事情出于什么理由都好,都会发生。

    我能够接受自己文的TXT在论坛中分享,但是无法接受晋江以外的网站在线连载我的文。

    嗯,就是这样……

    所以,请看盗文的亲们再等段时间,就当是养肥好了,等这文完结了小说论坛里自然而然地会有txt下载的。就算没有完结,有些论坛也会有更新的txt,对于论坛哪怕是同步更新我也不会有任何怨言。

    再次,向各位鞠躬。不管是从什么途径,对于看到我的文,喜欢我的文,并且仍然想要继续看下去的读者,我对你们都心存感激。

    谢谢

    潭123

    11.10.9

    以下,复制过来的乱码相关

    首先,要想解决java中文乱码问题就有必要了解一下什么是字符,字符集,编码的概念。

    字符:是文字与符号的总称,包括文字、图形符号、数学符号等。

    字符集:就是一组抽象字符的集合。字符集常常和一种具体的语言文字对应起来,该文字中的所有字符或者大部分常用字符就构成了该文字的字符集,比如英文字符集。繁体汉字字符集、日文汉字字符集等等。

    计算机要处理各种字符,就需要将字符和二进制内码对应起来,这种对应关系就是字符编码:制定编码首先要确定字符集,并将字符集内的字符排序,然后和二进制数字对应起来。根据字符集内字符的多少,会确定用几个字节来编码。

    每种编码都限定了一个明确的字符集合,叫做被编码过的字符集(Coded Character Set),这是字符集的另外一个含义。通常所说的字符集大多是这个含义。

    其次,要想解决java中文乱码问题也得了解一下我们常用的编码方式:

    ASCII编码是目前计算机中用得最广泛的字符集及其编码。

    ISO8859-1可以表示的是西欧语言。看起来很单一为什么还在使用呢?,由于是单字节编码,和计算机最基础的表示单位一致,所以很多时候,仍旧使用ISO-8859-1编码来表示。 而且在很多协议上,默认使用该编码。

    Unicode(统一码、万国码、单一码)是一种在计算机上使用的字符编码。通常我们所遇到过多UTF-8这是Unicode编码的实现方式,请一定要加以区分。

    GB2312字集是简体字集;BIG5字集是台湾繁体字集;GBK字集是简繁字集,包括了GB字集、BIG5字集和一些符号

    GB18030是国家制定的一个强制性大字集标准,它的推出使汉字集有了一个统一的标准。

    Linux系统默认使用的是ISO-8859-1编码,Win32系统默认使用的是GB2312编码。

    再是,了解乱码是怎么产生的,如何解决java中文乱码?

    字符在保存时的编码格式如果和要显示的编码格式不一样的话,就会出现乱码问题。我们在做开发的时候,始终提倡开发环境编码一致。如页面编码,数据库编码等。

    Java在运行期一律以Unicode来存储字符,这样有利的支持了多语言环境。我们在开发过程中经常会用到文件读取。Java读文件的时候会用到系统默认的编码来解码文件。所以在用FileInputStream类读取文件可以指定编码读取。

    JSP页面乱码通常只要在页面开始地方用下面代码指定字符集编码即可。如果还不行,那么请用下面这句话来转换 str=new String(str.getBytes("ISO-8859-1"),"页面编码方式");

    JAVA在网络传输中使用的编码是"ISO-8859-1",故在输出时需要进行转化,如:

    String str=new String(str.getBytes("开发环境编码"),"ISO-8859-1");

    经过网络编码后的中文,要正确显示在页面上必须要用类似于

    Stirng str=new String(str.getBytes("ISO-8859-1"),"开发环境编码");这样的方式来解码

    最后,为了避免不必要的java中文乱码,我们首先要从源头做起。

    什么意思呢?这就是说,我们在项目开发中,首先要让我们开发环境统一编码。比如我用的开发环境是Eclipse+Tomcat5.0+SQLServer 2005。Eclipse的项目属性中可以设置项目的编码,可以针对JSP页面的设置统一的编码。

    = =字数居然还没到!

    ┭─────┮﹏ ┭─────┮我突然发现我码字真不容易--

    尤其是,我还要上学还有作业,平时每天抽半个小时左右码字,勉强才能做到周更--

    于是,再来段字符编码

    美国(国家)信息交换标准(代)码,一种使用7个或8个二进制位进行编码的方案,最多可以给256个字符 ASCII

    (包括字母、数字、标点符号、控制字符及其他符号)分配(或指定)数值。   ASCII码于1968年提出,用于在不同计算机硬件和软件系统中实现数据传输标准化,在大多数的小型机和全部的个人计算机都使用此码。ASCII码划分为两个集合:128个字符的标准ASCII码和附加的128个字符的扩充和ASCII码。比较EBCDIC。其中95个字符可以显示。另外33个不可以显示。 标准ASCII码为7位,扩充为8位。   目前使用最广泛的西文字符集及其编码是 ASCII 字符集和 ASCII 码( ASCII 是 American Standard Code for Information Interchange 的缩写),它同时也被国际标准化组织( International Organization for Standardization, ISO )批准为国际标准。   基本的 ASCII 字符集共有 128 个字符,其中有 96 个可打印字符,包括常用的字母、数字、标点符号等,另外还有 32 个控制字符。标准 ASCII 码使用 7 个二进位对字符进行编码,对应的 ISO 标准为 ISO646 标准。下表展示了基本 ASCII 字符集及其编码:   字母和数字的 ASCII 码的记忆是非常简单的。我们只要记住了一个字母或数字的 ASCII 码(例如记住 A 为 65 , 0 的 ASCII 码为 48 ),知道相应的大小写字母之间差 32 ,就可以推算出其余字母、数字的 ASCII 码。   虽然标准 ASCII 码是 7 位编码,但由于计算机基本处理单位为字节( 1byte = 8bit ),所以一般仍以一个字节来存放一个 ASCII 字符。每一个字节中多余出来的一位(最高位)在计算机内部通常保持为 0 (在数据传输时可用作奇偶校验位)。   由于标准 ASCII 字符集字符数目有限,在实际应用中往往无法满足要求。为此,国际标准化组织又制定了 ISO2022 标准,它规定了在保持与 ISO646 兼容的前提下将 ASCII 字符集扩充为 8 位代码的统一方法。 ISO 陆续制定了一批适用于不同地区的扩充 ASCII 字符集,每种扩充 ASCII 字符集分别可以扩充 128 个字符,这些扩充字符的编码均为高位为 1 的 8 位代码(即十进制数 128~255 ),称为扩展 ASCII 码。   通过了解字符的存储编码,可以解决很多由编码不匹配引起的问题,比如网页乱码、邮件乱码,本文简单扼要地阐明了ASCII编码、EBCDIC编码、GB2312编码、Unicode编码、UTF-8编码、以及Base64编码。

    在显示器上看见的文字、图片等信息在电脑里面其实并不是我们看见的样子,即使你知道所有信息都存储在硬盘里,把它拆开也看见里面有任何东西,只有些盘片。假设,你用显微镜把盘片放大,会看见盘片表面凹凸不平,凸起的地方被磁化,凹的地方是没有被磁化;凸起的地方代表数字1,凹的地方代表数字 EBCDIC

    0。硬盘只能用0和1来表示所有文字、图片等信息。那么字母”A”在硬盘上是如何存储的呢?可能小张计算机存储字母”A”是1100001,而小王存储字母”A”是11000010,这样双方交换信息时就会误解。比如小张把1100001发送给小王,小王并不认为1100001是字母”A”,可能认为这是字母”X”,于是小王在用记事本访问存储在硬盘上的1100001时,在屏幕上显示的就是字母”X”。也就是说,小张和小王使用了不同的编码表。小张用的编码表是ASCII,ASCII编码表把26个字母都一一的对应到2进制1和0上;小王用的编码表可能是EBCDIC,只不过EBCDIC编码与ASCII编码中的字母和01的对应关系不同。一般地说,开放的操作系统(LINUX 、WINDOWS等)采用ASCII 编码,而大型主机系统(MVS 、OS/390等)采用EBCDIC 编码。在发送数据给对方前,需要事先告知对方自己所使用的编码,或者通过转码,使不同编码方案的两个系统可沟通自如。   ASCII码使用7位2进制数表示一个字符,这样,7位2进制数可以表示出2的7次方个字符,共128个字符。EBCDIC码使用8位,可以表示出2的8次方个字符,256个字符。   无论是ASCII码还是EBCDIC码,都无法对拥有几万个的汉字进行编码。因为上面已经提过,7位2进制数最多对应上128个字符,8位最多对应上256个字符。

    ASCII码的提出,有效的解决了西文文字的信息化问题,但对于汉字字符却完全不适用。为了满足国内在计算机中使用汉字的需要,中国国家标准总局发布了一系列的汉字字符集国家标准编码,统称为GB码,或国标码。其中最有影响的是于1980年发布的《信息交换用汉字编码字符集 基本集》,标准号为GB 2312-1980,因其使用非常普遍,也常被通称为国标码。GB2312编码通行于我国内地;新加坡等地也采用此编码。几乎所有的中文系统和国际化的软件都支持GB 2312。   GB 2312是一个简体中文字符集,由6763个常用汉字和682个全角的非汉字字符组成。其中汉字根据使用的频率分为两级。一级汉字3755个,二级汉字3008个。由于字符数量比较大,GB2312采用了二维矩阵编码法对所有字符进行编码。首先构造一个94行94列的方阵,对每一行称为一个“区”,每一列称为一个“位”,然后将所有字符依照下表的规律填写到方阵中。这样所有的字符在方阵中都有一个唯一的位置,这个位置可以用区号、位号合成表示,称为字符的区位码。如第一个汉字“啊”出现在第16区的第1位上,其区位码为1601。因为区位码同字符的位置是完全对应的,因此区位码同字符之间也是一一对应的。这样所有的字符都可通过其区位码转换为数字编码信息。GB2312字符的排列分布情况见表1-4。

    嗯,差不多了,↑来源自百科
Back to Top