汉字在计算机内部采用的编码是

如题所述

在计算机系统内部使用的汉字编码是机内码。

汉字机内码,又称“汉字ASCII码”,简称“内码”,指计算机内部存储,处理加工和传输汉字时所用的由0和1符号组成的代码。输入码被接受后就由汉字操作系统的“输入码转换模块”转换为机内码,与所采用的键盘输入法无关。

机内码是汉字最基本的编码,不管是什么汉字系统和汉字输入方法,输入的汉字外码到机器内部都要转换成机内码,才能被存储和进行各种处理。不过国标码还不能直接在计算机上使用,因为这样还是会和早已通用的ASCII码冲突,从而导致乱码。

汉字进入计算机的三种途径:

1、机器自动识别汉字

计算机通过“视觉”装置(光学字符阅读器或其他),用光电扫描等方法识别汉字。

2、通过语音识别输入

计算机利用人们给它配备的“听觉器官”,自动辨别汉语语音要素,从不同的音节中找出不同的汉字,或从相同音节中判断出不同汉字。

3、通过汉字编码输入

根据一定的编码方法,由人借助输入设备将汉字输入计算机。机器自动识别汉字和汉语语音识别,国内外都在研究,虽然取得了不少进展,但由于难度大,预计还要经过相当一段时间才能得到解决。在现阶段,比较现实的就是通过汉字编码方法使汉字进入计算机。

温馨提示:答案为网友推荐,仅供参考
第1个回答  2023-09-17
汉字在计算机内部采用的编码是Unicode。Unicode是一种国际标准,为世界上所有文字字符分配了一个唯一的数字编码,包括汉字、拉丁字母、希腊字母、日文假名等。Unicode编码使用4个字节(32位)来表示一个字符。 在Unicode中,每个字符都有一个唯一的编号,称为码点。汉字对应的码点范围是0 x 4 E00到0 x 9FFF,共计20992个字符。Unicode编码提供了一个标准的方式,使得计算机能够存储和处理各种语言的字符,包括汉字。 在实际应用中,为了节省存储空间和方便传输,还会使用Unicode的压缩形式,如UTF-8、UTF-16等。UTF-8是一种可变长度的编码方式,可以根据字符的码点范围使用1到4个字节来表示字符,它兼容ASCII编码,对于只包含ASCII字符的文本,UTF-8编码的存储空间与ASCII编码相同。UTF-16是固定长度的编码方式,使用2个字节来表示大部分字符,且与大部分计算机内部存储方式一致。 需要注意的是,不同国家和地区在实际应用中可能会使用不同的字符编码方式,但Unicode是目前最广泛和通用的字符编码标准。
相似回答