汉字内码采用 二进制表示,具体说明如下:
编码方式
汉字内码通常由两个 8位二进制数(即16位)组成,每个8位对应一个ASCII码,通过组合这两个ASCII码形成汉字的完整编码。例如,汉字“小”的内码为D0A1(十六进制),对应二进制为1101 0000 1010 0001。
物理存储
- 内码以 二进制形式存储在计算机内存中,物理地址通常用 十六进制表示(如D0A1对应的二进制地址为1101000010100001)。
- 由于二进制是计算机唯一能识别的机器语言,因此内码必须以二进制形式存在。
与国标码的关系
国标码(如GB2312)与内码的关系为:
$$text{内码} = text{国标码} + 8080H$$
例如,国标码为8048H的汉字,其内码为80C8H(二进制为1000000000100000)。
编码长度
- 每个汉字占用 16位(2个字节),这既保证了汉字的唯一性,又兼顾了存储效率。
总结:汉字内码采用二进制表示,通过双字节(16位)编码实现,其中每个字节的高位用于区分汉字与ASCII字符,物理存储时常用十六进制表示地址。