提升打字效率30%!极点五笔状态栏功能全解析

我在这个视频中介绍了词库的概念,我们打开任何一个物比词库都可以发现无论是任何字词编码最长都只有4位。我们也会发现词组的编码都是4位,而单字的编码除了4位,还有可能是一位、两位或者是 3 位,一个单字的完整编码叫做全码。按照 5 笔的取码规则, GB 2312 字符集内 88% 的单字编码的全码是4位, 12% 的单字编码的全码是 3 位。为了方便我习惯只把4位的单子编码称为全码,而一二三位的编码统称为减码,只有一位编码的汉字叫做一级减码,简称为一减,只有两位编码的汉字叫做二级键码,简称为二减。只有三位编码的汉字叫做三级键码,简称为三减。各五笔输入法的默认词库一般是没有解码词的,所以解码只有单字。 5 笔中的 z 键是不参与编码的,所以只有 25 个字母键参与编码。

我来问大家一个问题,就是五笔中的一、二三级解码和全码都分别有多少个码位呢?大家可以暂停思考一下。一级解码有 25 个码位,二级解码有25,乘以 25 = 625 个码位,三级解码有 25 的 3 次方等于 15, 625 个码位,全码有 25 的 4 次方,等于 390, 625 个马位。

在这个视频中我讲了自频的概念,我们知道了每个字的自频是不一样的。如果每个字都打全码,效率就太低了,所以 5 笔选出来了一部分高频字,设置了解码,显然一个字的字频越高,我们就应该为其设置越短的解码,但是解码越短,位置就越稀缺。这是我做的字根图,是我分析了 GB 2312 字符集的全部 6, 763 个汉字做出来的没有错误和遗漏的字根图,因为这张图的质量太好,已经被很多人盗过啦。我们先不去管字根,只看这些红色的汉字,他们就是一级肩膀只有 25 个,是无比发明人王永明选出来的,这些字都是按一下字母键,再按一下空格键就能上平台。汉字一级解码是必须要记住的,字频前 23 的字有 17 个是一级解码,而剩下的 8 个一级减码字,字频都不高,产字更是排到了 453 位。其实这也不能怪发明人,毕竟这几个字在 80 年代的背景下是很常用的。

QQ截图20241004232013.png

那么为什么都 2024 年了,我们还在用 40 年前的 EG 加码呢?这是因为习惯的力量是强大的,就像 code 键盘一样,它并不高效。但由于人们已经习惯了,所以仍然沿用至今。而拼音输入法继承了靠着键盘不高效的特点。网友们在计算机汉字键盘设计三原理这篇论文中统计了键盘的中排键使用拼音和无比的情况下每个键的键位负荷,可以看到用拼音打字,每个手指的按键频率是差别非常大的,不符合手指的生理功能特点,但并不影响拼音的用户数量远多于五比二级解码就是按两下字母键,再按一下空格键就能上屏的汉字。

这是我做的一张二级解码表,可以看到在 625 个码位中,只有 599 个有字,其中还有 11 个同时为一级键码,就是图中的蓝底白字,所以纯二键一共有 588 个。在这 588 个字中,图中的黑底白字比较不常用,可以不记,而黄底红字属于前一前 500 常用字范围之外,但也需要记的字。正常的黑色字就是既属于前一前 500 常用字,又属于二级掩码的字。是一定要记得三级键码,就是按三下字母键,再按一下空格键或选重键就能上屏的汉字。是的,三级解码是有重码的。在 GB 2312 范围内,三级解码一共有 4, 397 个,其中有 585 个是一减或 2 减,所以纯散减共有 3, 812 个。关于解码可以讲的内容还有非常多,我会在之后的 5 笔文章教程中再来详细介绍本期文章提到文件都可以在我的网盘中下载,如果对你有帮助,就请给我点个免费的赞,那么我们下期文章再见,记得点赞关注哦。

来源:科技输入法