汉字在计算机中通常以二进制形式存储和表示,主要采用以下编码方式:
一、汉字二进制表示形式
每个汉字由16位二进制数表示,是计算机内部实际存储和处理的编码。例如:
- 汉字“小”对应内码 `D0A1`,二进制为 `1101000010100001`
- 汉字“米”对应内码 `C3D7`,二进制为 `1100001111011111`
(来源:)
区位码
由国标码和段码组合而成,需通过加值转换得到内码。例如:国标码 `B3F3` 转换为内码 `B0A1`(加 `8080H`)。
字模(点阵码)
通过二进制矩阵表示汉字字形,每个像素点用 `0` 或 `1` 表示显示状态。例如:连续竖线表示实心像素,间断竖线表示空心像素。
二、编码转换规则
国标码转内码: 在国标码的每个字节最高位加 `1`,即 `汉字机内码 = 汉字国标码 + 8080H`。
二进制转十六进制:每4位二进制数转换为1位十六进制数(如 `101011B` 转 `2BH`)。
三、注意事项
不同编码标准(如GB2312、GBK)的汉字编码可能不同,需根据具体应用场景选择。
现代系统多使用 Unicode(如 UTF-8)编码,支持更丰富的字符集,但传统内码仍常见于早期系统。