输入汉字时使用的编码称为 汉字输入码(简称“外码”),其设计目的是将汉字转换为计算机可识别的二进制形式。以下是具体说明:
一、汉字输入码的类型
按汉字在字表中的位置进行编码,分为“流水码”和“区码”两种形式。
字音码
根据汉字的读音进行编码,常见形式包括全拼、双拼等。
字形码
直接存储汉字字形信息的编码,如五笔字型码。
音形码
结合读音和字形特点的编码方式。
二、常见输入法示例
拼音输入法(如微软拼音、搜狗拼音):属于音形码,通过拼音和智能联想输入汉字。
五笔输入法:
属于字形码,通过笔画和字根组合输入。
三、与机内码、国标码的区别
机内码:是计算机内部存储汉字的编码,以GB2312国标码为基础,每个字节的最高位为1(例如“阿”字的机内码为BOA2H)。
国标码:用于汉字信息交换的标准编码(GB2312-80),共包含6763个汉字和682个图形字符。
四、总结
输入汉字时,计算机需要将人类可读的汉字转换为机器可处理的二进制形式,这一转换过程通过 汉字输入码实现。不同输入法对应不同编码类型,如拼音输入法使用音形码,五笔输入法使用字形码等。