您的当前位置:首页正文

学习:UTF-8和GBK的区别

2024-04-21 来源:个人技术集锦
学习:UTF-8和GBK的区别

论编码问题⼜碰到了,为什么不⽤UTF8⽽⽤GBK呢?这个问题专业的解释好像⽹上有很多,但对我来讲,我只想知道⽤哪个有什么好处就够了。

下⾯是我⽤我个⼈应⽤中感觉到的及最简单的通俗的看法去理解这两种编码的区别?含义上区别1:GBK相关于我国的中⽂语⾔,UTF8相当于世界通⽤的英⽂语⾔。感觉上区别2:⽤DW编码UTF8字体时感觉看不清楚,GB2312⽐较清楚。

字节上区别3:从字节上区分  GBK的⽂字编码是双字节来表⽰的,占⽤空间⼤,UTF-8编码则是⽤以解决国际上字符的⼀种多字节编码,它对英⽂使⽤8位(即⼀个字节),对于英⽂字符较多的论坛则⽤UTF-8节省空间。字符上区分4:GBK包含全部中⽂字符; UTF-8则包含全世界所有国家需要⽤到的字符。

编码上区分5:GBK是在国家标准GB2312基础上扩容后兼容GB2312的标准(好像还不是国家标准) UTF-8编码的⽂字可以在各国各种⽀持UTF8字符集的浏览器上显⽰。例如,如果是UTF8编码,则在外国⼈的英⽂IE上也能显⽰中⽂,⽽⽆需他们下载IE的中⽂语⾔⽀持包。 所以,对于英⽂⽐较多的论坛 ,使⽤GBK则每个字符占⽤2个字节,⽽使⽤UTF-8英⽂却只占⼀个字节。 

使⽤上区分6:GBK是中国国家编码,通⽤性⽐UTF8差,不过UTF8占⽤的数据库⽐GBK⼤,⽽且是⼀般做论坛的DZ这些程序,对应的组件和插件⽀持上GBK相应开发的⽐较全⾯点,再DIY的时候⽐较⽅便。UTF8是国际编码,它的通⽤性⽐较好,外国⼈也可以浏览论坛,⽽且中⽂可以直接识别,如果你的论坛要做的⽐较国际化那就必须⽤UTF8的。补充下:UTF8再繁体⽀持上⽐GBK有优势滴。对于DZ论坛来说,很多插件都只⽀持GBK的,如果需要装较多插件的论坛还是⽤GBK⽐较好,⽽对装较少插件且有特殊⽤户群的论坛⽤UTF8⽐较好。所以,⼀般你要是做论坛只是国内的特定圈⼦⾥的就⽤GBK简单点,基本插件都可以安装,但是如果你的站有国外的市场需要就建议UTF8了。搜索上区分7:都说GG中⽂搜索没百度强。估计跟编码可能也有关系。GBK,GB2312可能让百度更感兴趣!最后总结⼀句话:感觉在中国做最好还是⽤GBK,GB2312,等应该隐藏好处还是有的,做世界⽹站UTF8。下现是⼀组编码收录字符的数据:

GB2312(1980年)⼀共收录了7445个字符,包括6763个汉字和682个其它符号; 1995年的汉字扩展规范GBK1.0收录了21886个符号,它分为汉字区和图形符号区。汉字区包括21003个字符。 2000年的GB18030是取代GBK1.0的正式国家标准。该标准收录了27484个汉字,同时还收录了藏⽂、蒙⽂、维吾尔⽂等主要的少数民族⽂字。现在的PC平台必须⽀持GB18030,对嵌⼊式产品暂不作要求。所以⼿机、MP3⼀般只⽀持GB2312。

因篇幅问题不能全部显示,请点此查看更多更全内容