现代汉语常用词表抽样检验

为了检验常用词列表中选取的常用词是否合理,我们委托山西大学计算机系采用计算机抽样的方式,对200万词的语料库进行统计,并对选取的常用词的使用频率进行检测。

取样材料包括:

1.人民日报7月1987(不含插图、广告、标题、非中文符号,为654.38+0.5万字);

6.5438+0987年7月北京科技报(不含插图、广告、标题、非中文符号,为20万字);

3.1987当代三期(不含插图、标题和非中文符号,30万字)。

测试结果显示,2500个常用词的覆盖率为97.97%,1,000个常用词的覆盖率为1.51%,总覆盖率(3500个词)为99.48%,说明《现代汉语常用词表》具有实用性。