UTF

字符均使用双字节来表示,只不过为区分中文,将其最高位都定成1。

至于UTF-8编码则是用以解决国际上字符的一种多字节编码,它对英文使用8位(即一个字节),中文使用24位(三个字节)来编码。对于英文字符较多的论坛则用UTF-8节省空间。

GBK包含全部中文字符;UTF-8则包含全世界所有国家需要用到的字符。

GBK是在国家标准GB2312基础上扩容后兼容GB2312的标准(好像还不是国家标准)
       UTF-8编码的文字可以在各国各种支持UTF8字符集的浏览器上显示。
   比如,如果是UTF8编码,则在外国人的英文IE上也能显示中文,而无需他们下载IE的中文语言支持包。 所以,对于英文比较多的论坛 ,使用GBK则每个字符占用2个字节,而使用UTF-8英文却只占一个字节。

UTF8是国际编码,它的通用性比较好,外国人也可以浏览论坛,GBK是国家编码,通用性比UTF8差,不过UTF8占用的数据库比GBK大。   字符均使用双字节来表示,只不过为区分中文,将其最高位都定成1。

至于UTF-8编码则是用以解决国际上字符的一种多字节编码,它对英文使用8位(即一个字节),中文使用24位(三个字节)来编码。对于英文字符较多的论坛则用UTF-8节省空间。

GBK包含全部中文字符;UTF-8则包含全世界所有国家需要用到的字符。

GBK是在国家标准GB2312基础上扩容后兼容GB2312的标准(好像还不是国家标准)
       UTF-8编码的文字可以在各国各种支持UTF8字符集的浏览器上显示。
   比如,如果是UTF8编码,则在外国人的英文IE上也能显示中文,而无需他们下载IE的中文语言支持包。 所以,对于英文比较多的论坛 ,使用GBK则每个字符占用2个字节,而使用UTF-8英文却只占一个字节。

UTF8是国际编码,它的通用性比较好,外国人也可以浏览论坛,GBK是国家编码,通用性比UTF8差,不过UTF8占用的数据库比GBK大。

(0)

相关推荐

  • ecshop模板UTF-8和GBK版本有什么区别呢

    UTF-8编码则是用以解决国际上字符的一种多字节编码,它对英文使用8位(即一个字节),中文使用24位(三个字节)来编码. 对于英文字符较多的论坛则用UTF-8节省空间: GBK的文字编码是双字节来表示 ...

  • 【Python面试】 说说4种常用编码的区别?

    公众号新增加了一个栏目,就是每天给大家解答一道Python常见的面试题,反正每天不贪多,一天一题,正好合适,只希望这个面试栏目,给那些正在准备面试的同学,提供一点点帮助! 小猿会从最基础的面试题开始, ...

  • gbk、utf-8、utf8mb4 区别

    gbk、utf-8、utf8mb4 区别

  • 女朋友问我:为什么会乱码?

    前言 乱码这个东西相信大家都遇到过,今天我的女朋友三歪就火急火燎的上来找我:"亲爱的,我的idea怎么输出乱码了?" 我一顿操作就给他搞好了,但是三歪不愧是我的女朋友,好奇心跟我是 ...

  • (7条消息) 彻底解决Qt中文乱码以及汉字编码的问题(UTF

    尊重作者,支持原创,如需转载,请附上原地址:https://blog.csdn.net/libaineu2004/article/details/19245205 这篇文章有点长,内容有点多,如果时间 ...

  • Go 学习笔记(31)— 字符串 string、字符 rune、字节 byte、UTF

    Go 学习笔记(31)— 字符串 string、字符 rune、字节 byte、UTF

  • 漫话:如何给女朋友解释为什么不能在 MySQL 中使用 UTF

    作者 | 漫话编程 来源 | 漫话编程(ID:mhcoding) MySQL是一种关系型数据库,这个大家肯定都不陌生,使用MySQL创建数据库的时候,大家需要指定一种编码方式. 很多时候,大家基于自己 ...

  • Windows自带cmd修改终端字符编码为UTF

    打开cmd,在提示符下输入 chcp 65001 标题栏右键,属性.字体,选择Lucida Console. 布局根据自己的喜好再设置吧. 缓冲区大小我的理解是实际能存放字符的终端范围.窗口大小顾名思 ...

  • 修改 cmd 控制台默认代码页编码的几种方法【GBK、UTF

    在程序开发中我们统一的编码是 UTF-8,这一点很重要,但是总还是会遇到许多乱码问题,乱码的原因是多方面的,但归根结底就是编码与解密标准不一致,这里暂不过多总结.这里只说明在 window 下使用控制 ...

  • (40条消息) php 判断中文 utf8,PHP 判断 UTF

    PHP 在判断简体 / 繁体中文部份,以前是可以 Big5 / GB2312 / GBK 来判断(可以使用 mb_detect_encoding()),但是 UTF-8 后,就有点麻烦了. PHP 判 ...

  • (2条消息) 字符编码的概念(UTF

    字符集为每个字符分配了一个唯一的编号,通过这个编号就能找到对应的字符.在编程过程中我们经常会使用字符,而使用字符的前提就是把字符放入内存中,毫无疑问,放入内存中的仅仅是字符的编号,而不是真正的字符实体 ...

  • Python中关于coding=utf

    写了很久的Python了,每次写之前都要在开头加上coding=utf-8,只知道是设置编码格式,但并没有太在意,今天在写socket编程时才发现编码格式的重要性. 一.关于开头coding=utf- ...