既然Latin1为单字节编码,并且将1个字节的所有256个值全部占满,因此理论上把任何编码的值塞到Latin1字段都是可以存的(无非就是显示乱码而已)。这也就导致了,如果把GBK编码的中文文本另存为UTF8编码,体积会大50%左右。GBK编码,是对GB2312编码的扩展,因此完全兼容GB2312-80标准。
本质上,你存的数据值依然是0xE8AEAF,这种欺骗Mysql的行为并没有导致数据丢失,只不过你需要注意读取出来该值的时候,自己要以UTF8编码的方式显示出来,要不然就是乱码。UTF8与前面说的GB系列编码不兼容,所以如果一个文件中即有UTF8编码的文字,又有GB18030编码的文字,那绝对会有乱码。这也是单字节编码的一大好处:显示可以乱码,但是里面的数据值永远正确。
1、郭保坤
这图中展示了前文所述的几种编码在编码完成后,前2个byte的值域(用16进制表示)。ASCII编码每个字母或符号占1byte(8bits),并且8bits的最高位是0,因此ASCII能编码的字母和符号只有128个。在实际应用中,GBK编码常用于中文Windows操作系统的默认编码设睁凳置,以及一些中文软件和网页的编正早高码方式。
2、干部考察谈话简短精辟
关于GBK、UTF8常见编码格式的阶段性知识总结(结合标准库、操作系统、编译器、集成开发环境、Qt、OSG等分析)只要全都按照GB18030编码的规则去解析并展示文件,就不会有乱码出现。GBK详细的编码规则GBK编码,是对GB2312编码的扩展,因此完全兼容GB2312-80标准。此外,举尺在网页开发中,通过设置网页的字符编码为GBK,可以确保网页中的中文内容能够正确显示,避免出现乱码等问题。
3、gbk和gb2312的区别
GBK编码范围:8140-FEFE,汉字编码范围见第二节:码位分配及顺序。假设默认为UTF8这一多字节编码,在用户误把一个不使用UTF8编码的字符串存进去时,很有可能因为该字符串不符合UTF8的编码要求导致Mysql根本没法处理。具体来说,GBK编码使用了双字节表示法,其中大部分常用汉字使用两个字节进行编码,而一些特殊字符或扩展汉字可能需要使用四个字节进行编码。
4、GBK查询
我们可以使用这些编辑器打开和编辑GBK编码的文件,然后再将它们保存为其他编码格式,如UTF-8,以便在Sublime Text中打开和编辑。ASCII编码几乎被世界上所有编码所兼容(UTF16和UTF32是个例外),因此如果一个文本文档里面的内容全都由ASCII里面的字母或符号构成,那么不管你如何展示该文档的内容,都不可能出现乱码的情况。
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 80448874@qq.com 举报,一经查实,本站将立刻删除。如若转载,请注明出处:http://www.pglvshi.com/pgjn/6368.html