中国汉字词库的字数统计存在不同口径,主要差异体现在收录范围和分类标准上,具体如下:
统计显示,现代汉语中常用汉字约为3500个,次常用字约1000个,常用字占语言篇幅的99%。
字库收录总量
- 现代常用汉字字库(如《汉语大字典》《中华字海》)收录汉字5万至8万多个,例如《汉语大字典》2010年版收录60370个。
- 全库总量: 2012年“中华字库”工程收录汉字约10万个,包含现代汉字、少数民族文字及甲骨文等古文字,总计约30万字。历史汉字总数
包含异体字、古文字及生僻字,总数超过12万个,但日常交流中几乎不使用。
总结:
若指现代常用汉字,词库收录量在3500-8万之间;若包含全库,则总数超过10万。实际应用中,字库会不断更新,但日常交流主要依赖几千个常用字。