汉字机内码占几个字节

【汉字机内码占几个字节】一个汉字的机内码占2个字节!

汉字机内码占几个字节

文章插图
一个汉字的机内码占2个字节 。因为汉字处理系统要保证中西文的兼容 , 当系统中同时存在ASCII码和汉字国标码时 , 将会产生二义性 。
计算机只识别由0、1组成的代码 , ASCII码是英文信息处理的标准编码 , 汉字信息处理也必须有一个统一的标准编码 。汉字交换码(国标码)主要用于汉字信息交换 , 我国国家标准局于1981年5月颁布了《信息交换用汉字编码字符集——基本集》 , 代号为GB2312-80 , 共对6763个汉字和682个图形字符进行了编码 , 其编码原则为:汉字用两个字节表示 , 原则上 , 两个字节可以表示256×256=65536种不同的符号 , 作为汉字编码表示的基础是可行的 。但考虑到汉字编码与其它国际通用编码 , 如ASCII西文字符编码的关系 , 我国国家标准局采用了加以修正的两字节汉字编码方案 , 只用了两个字节的低7位 。这个方案可以容纳128×128=16384种不同的汉字 , 但为了与标准ASCII码兼容 , 每个字节中都不能再用32个控制功能码和码值为32的空格以及127的操作码 。所以每个字节只能有94个编码 。这样 , 双七位实际能够表示的字数是:94×94=8836个 。

    推荐阅读