utf-8是什么意思

utf-8是什么意思

8位Unicode转换格式(UTF-8)是一种用于编码各种字符的相对较新的代码约定。
它是字符标识的标准,也是各种编程语言和设备的参考,有助于标准化字母,数字和其他字符的显示。
在许多情况下,UTF-8取代了一种名为美国信息交换标准码(ASCII)的旧约定。
ASCII处理英语语言文本所需的所有字符,但UTF-8为不使用英语或罗马字母的其他语言处理更多不同的符号集。UTF-8被认为是与ASCII向后兼容的。
温馨提示:答案为网友推荐,仅供参考
第1个回答  2006-01-06
编码格式的一种,
可以对应几乎所有文字
将来Linux的默认编码,
目前的Redhat系列最新版操作系统默认Unicode(UTF-8)编码

而且,目前比较先进的CMS,Forum,blog都已经推出或默认UTF-8语言包本回答被网友采纳
第2个回答  2006-01-07
所有的字符都是对应一个数值的, 但是不同的编码方式同样的数值对应的字符可能不同.

比如gb_2132中某个字对应于12345, 而法语编码中对应12345的则是另外一个字符. 所以只给数值的话就会搞混应该显示哪个字符.

UTF系列的编码, 试图包括世界上所有语言的所有字符, 并给没一个字符一个唯一的对应值, 这样在这个规则下, 就可以轻易判断应该显示哪个字符了.

问题是有的情况下 我们并不需要知道世界上都有什么字符, 因为我们根本不会用到, 所以每种语言有自己的编码系统. 不是那么浪费资源.
第3个回答  2006-01-06
简单来说,UTF-8编码可以看作是更大的字符集,它包含GB、BIG5和Shift_JS等大部分文字的编码。使用UTF-8编码主要是为了让不同语言用户在使用软件时不用安装其它编码即可正常显示信息,使软件国际化更容易。所以UTF-8编码是发展的趋势。

UTF-8 是一种用于将宽字符值转换为字节流的 Unicode 的标准机制。UTF-8 对于纯 ASCII 字符来说是透明的,且是自同步的(也就是说这使得程序能够得知字符从字节流的何处开始),并可被普通字符串比较函数用以比较等操作。PHP 可将 UTF-8 编码为多达四个字节的字符,如:

UTF-8 编码

字节(bytes) 位(bits) 表 示
1 7 0bbbbbbb
2 11 110bbbbb 10bbbbbb
3 16 1110bbbb 10bbbbbb 10bbbbbb
4 21 11110bbb 10bbbbbb 10bbbbbb 10bbbbbb

每个 UTF-8 表示一个能被用以储存字符数据的位。
相似回答