UTF-8对应汉字是3个字节还是2个字节的相关推荐

如题所述

推荐答案 2014-12-15

你应该去看
http://zh.wikipedia.org/wiki/UTF-8

UTF-8[编辑]
（重定向自UTF8）
UTF-8（8-bit Unicode Transformation Format）是一种针对Unicode的可变长度字符编码，也是一种前缀码。它可以用来表示Unicode标准中的任何字符，且其编码中的第一个字节仍与ASCII兼容，这使得原来处理ASCII字符的软件无须或只须做少部份修改，即可继续使用。因此，它逐渐成为电子邮件、网页及其他存储或发送文字的应用中，优先采用的编码。

UTF-8使用一至六个字节为每个字符编码(尽管如此，2003年11月UTF-8被RFC 3629重新规范，只能使用原来Unicode定义的区域，U+0000到U+10FFFF，也就是说最多4位字节)：

128个US-ASCII字符只需一个字节编码（Unicode范围由U+0000至U+007F）。
带有附加符号的拉丁文、希腊文、西里尔字母、亚美尼亚语、希伯来文、阿拉伯文、叙利亚文及它拿字母则需要两个字节编码（Unicode范围由U+0080至U+07FF）。
其他基本多文种平面（BMP）中的字符（这包含了大部分常用字）使用三个字节编码（Unicode范围由U+0800至U+FFFF）。
其他极少使用的Unicode 辅助平面的字符使用四至六字节编码（Unicode范围由U+10000至U+1FFFFF使用四字节，Unicode范围由U+200000至U+3FFFFFF使用五字节，Unicode范围由U+4000000至U+7FFFFFFF使用六字节）。
对上述提及的第四种字符而言，UTF-8使用四至六个字节来编码似乎太耗费资源了。但UTF-8对所有常用的字符都可以用三个字节表示，而且它的另一种选择，UTF-16编码，对前述的第四种字符同样需要四个字节来编码，所以要决定UTF-8或UTF-16哪种编码比较有效率，还要视所使用的字符的分布范围而定。不过，如果使用一些传统的压缩系统，比如DEFLATE，则这些不同编码系统间的的差异就变得微不足道了。若顾及传统压缩算法在压缩较短文字上的效果不大，可以考虑使用Unicode标准压缩格式（SCSU）。

千万别看百度百科，那上面错误很多。

温馨提示：答案为网友推荐，仅供参考

当前网址：http://00.wendadaohang.com/zd/enZTBnrjrZ0rIrDnZZ.html

其他回答

第1个回答 2020-04-12

3个字节，网上那种在线中文转utf-8的转换出来的都是2字节的其实是unicode，例如

百度转换为unicode是767E，5EA6

而真正的UTF-8则是E799BE，E5BAA6

不少在线中文转UTF-8转出来的确和unicode一样。所以这种网站是错误的。我给你一转utf-8的网站网页链接

第2个回答 2014-12-13

3个字节，就像按人分东西，在不确定的情况下只能多备

相似回答

utf-8一个汉字几个字节答：3个字节。如果你有十六进制编辑器，你自己就能验证。

一个汉字占几个字节?答：utf-8编码中，一个汉字占2~3个字节

存储一个汉字需要多少个字节答：UTF-8编码是一种变长字节表示方式，它可以根据不同的字符编码不同的字节数。对于汉字等字符，UTF-8编码使用3个字节表示，而ASCII编码使用1个字节表示。因此，在UTF-8编码下，一个汉字占用3个字节的空间。总之，一个汉字占用2个字节的空间，这是由于其采用的编码方式所决定的。在实际应用中，由于汉字...

一个汉字到底占几个字节答：GBK编码，一个汉字占两个字节。UTF-16编码，通常汉字占两个字节，CJKV扩展B区、扩展C区、扩展D区中的汉字占四个字节（一般字符的Unicode范围是U+0000至U+FFFF，而这些扩展部分的范围大于U+20000，因而要用两个UTF-16）。UTF-8编码是变长编码，通常汉字占三个字节，扩展B区以后的汉字占四个字节。

大家正在搜

汉字占2个字节的位置是指一个汉字的机内码需要几个字节 16*16的点阵一个汉字几个字节一个汉字两个字节每个汉字用几个字节表示通常一个汉字占几个字节一个汉字内码占几个字节计算机中一个汉字占几个字节 utf8汉字占几个字节