当前位置: 首页 > 专利查询>刘全忠专利>正文

适用于计算机输入的数码化汉字部首检索法及其专用键盘制造技术

技术编号:2886875 阅读:311 留言:0更新日期:2012-04-11 18:40
一种适用于计算机输入的数码化汉字部首检索法,其特征在于,根据汉字的字形将汉字归类成50个不同的部首,分别赋予01-50的两位代码,每个汉字则分为字首和字尾两部分,或者分为字首、字尾和中间三个部分,每一部分都用所述部首的代码取码。此外,本申请还公开了一种适用于这种数码化汉字部首检索法的专用键盘。(*该技术在2018年保护过期,可自由使用*)

【技术实现步骤摘要】

本专利技术涉及一种高效率的汉字部首检索法。其部首都用数字编码,因此适宜作字典的索引和计算机输入使用;本专利技术还涉及一种适用于这种方法的专用键盘。现时所用的传统部首检索法不方便使用,既要寻找部首又要计算其笔划的数目,然后再翻开对应的页数,还要从许多个相同数目笔划的字中逐一找出来,至于以拼音的方式,如使用者不认识某个字或者发音欠准时,则不能使用。另外一种起笔+笔划法虽然比较易用,但需严格遵守笔顺,亦要计算笔划数目,否则不行。为了解决汉字检索的难题,有人将汉字拉丁化或数字化。拉丁化使用颇广泛。数字化则较为少有。汉字拉丁化是将字以拼音形式显示,采用普通话作发音标准,只适宜懂得正确的拼音者使用,如果不熟悉普通话或不能掌握准确拼音的人士则无法使用。最早期的汉字数字化是四角号码,从每个字的四个角取码,因为有许多字都没有明显的角可取,有些字取了四个码还未能一一分辨出来,换句话说,它的分辨能力很低,需用五个以上码。更因为汉字繁多,十个代码不足够使用。尽管它已面世数十年,但熟练掌握这种方法的人不多。有人将四角号码加以改良,沿用着它的代码,每字不取四角而按笔顺逐笔取码,汉字中大多数是六笔以上的,如果每划一码的话,有些字就要十多个码,因此就需要定下规则,区分要与不要的笔划,这样就增加取码的难度。例如重庆科委、重庆大学等的天府码。它有许多字要取六个码次之多,检字时既费时又费神,更因为笔顺的问题,不方便使用。在台湾有一种名为三角码的输入法,不取笔划而以字根为编码元素,每个码有两个数字--01至99,共有99个代码代表99个字根。因为数目太多,部分字根笔形相似,无法清楚地分别记忆,而且要用六位数字输入,不甚方便。林语堂汉英词典所用的五十个名为上下笔形的检索法亦是以字根编码,其用起来不方便的原因和三角码相同,只不过要记忆的笔形略为少些而已,况且它的代码内含有S和●等,非纯数字化代码,不宜作计算机输入用。编码结构较为简单的有王颂平先生专利技术的笔顺码输入法,它除了用作计算机输入外,亦可作字典检索用。这种输入法采用6种单笔和4种复笔编码,取码时需按正确的笔顺进行,但是末三码是按相反笔顺取码,取复笔时有笔顺混乱的错觉,虽然大部分字只需四码输入,但有些字却要取五至六次码之多才能分辨出来。更因为第五码和第六码要逆向取码而很不方便。除此之外,这种输入法至今未能广泛流行,相信最大的原因是大部分人不能掌握正确的笔顺。CN 85108032的中国专利申请公开了香港黄金富先生的唯物检索法和输入法,它是采用数目字以笔划为主的编码方式,部分按笔顺取码,有部分字取足六位数目字仍然有重码字。多数字都需要用传统部首作辅助识别。即是六位数目字的识别能力并不足够。朗文中文新词典内的458检字法是用数目字编码,每字需要用五种不同的方式取码,必须服从指定的笔顺还要计算笔划数目,有许多重码,使用不方便。其新版本的词典已不再使用这种方法。CN92111341.2中国专利申请中公开了这种方法。此外,有许多种采用字根编码的方法,例如五笔,仓颉,大易,快码等等。这些方法受笔顺问题的影响较轻,但随之而来的却是字根的归类和记忆困难的问题。键盘上只有数十个键,将二至三百个字根分布于上面需要经过精密设计和合理分配。需要考虑字根的归类是否清晰明确而不牵强,对应键位是否容易记忆等问题。到目前为止,还没有一种检索和输入法可达到令人满意的程度。基于以上各种原因中文计算机不能达到普及使用,而中文检索仍然依赖部首为主,因此在计算机上使用中文的方便程度远不如英文,法文等外文。综合上述因素,本专利技术的目的是提供一种适用于中文计算机的汉字编码方法这种方法摒弃笔划编码,不拆字取码,只取字首和字尾清晰可见的形状作为代码,这样就可顾及广泛的中文使用者,包括中文程度不高的小学生及外国人。这种取码方式是公认为最简便的,那么为何五笔,大易和仓颉等方法要将每个字拆开呢?就是首尾法无决解决重码问题。本专利技术的汉字编码方法有能力改善重码问题和解决记忆方法,因此达到了满意的效果。本专利技术的另一个目的是提供一种适用于上述汉字编码方法的专用键盘。根据本专利技术的一个方面,一种适用于计算机输入的数码化汉字部首检索法,其特征在于,根据汉字的字形将汉字归类成50个不同的部首,分别赋予01-50的两位代码,每个汉字则分为字首和字尾,所述字首和字尾都用所述部首的代码取码。根据本专利技术的另一个方面,一种适用于计算机输入的数码化汉字部首检索法,其特征在于,根据汉字的字形将汉字归类成50个不同的部首,分别赋予01-50的两位代码,每个汉字则分为首、尾和中间三个部分,所述三个部分都用所述部首的代码取码。根据本专利技术的再一个方面,一种适用于权利要求1和11的数码化汉字部首检索法的键盘,包括一个传统的计算机键盘,其特征在于,还包括四个专用复合键,所述专用复合键配置在空格键和末列字母键之间,每个所述专用复合键包括两个利用粘结剂上下叠置在一起的具有不同特征的开关(SW1和SW2),其中位于上方的开关(SW1)是一个触控开关,位于下方的开关(SW2)则是一个按钮开关,所述开关(SW1)只可从上方按压,所述开关(SW2)则可从上方及侧向按压,而且所述开关(SW1)所需的按压力比所述开关(SW2)所需的按压力小,在所述四个复合键的左方添置了两个标准键(ESC和SHIFT)。解决重码问题的方法是将编码元素尽量扩大至五十个之多。将全部字尽量均衡地分配在这首尾拼合而成的2500(50×50)组合内。以字汇为9000计,每取一字平均有3.6个重码字。但按实际情形本方法可做到每组重码字不超过5的占95%左右。本专利技术的汉字编码方法摒弃了笔划编码的缺点,尽量保留汉字优良传统的部首为编码基础。将传统的部首稍加改编,使之成为五十个可以编码而又容易记忆的部首,命名为一日码部首。利用计算机键盘上大小楷A-Y共计50个键位编码,不占用数字和符号键位。(见附附图说明图1-一日码检码表)。取码原则是摒弃位于字右边的和那些不规则部位出现的部首。只取位于字上方,左角和左边的。如遇到笔顺不一的,则以接近左边的为优先。本方法以字首和字尾笔形取码。这是本领域的技术人员公认的最容易的取码方式。因为没有拆字和笔顺的难题,取码时非常便利。一般首尾取码的输入法都有重码过多的难题,例如快速,轻松等。本方法有独特的设计,可使大部分待选字都不超过五个码。要打印的字排在第一待选位的机会占66.6%,第一或二位的占85%,第一至五位合计占95%以上。少过5%在第五位以外。需翻页选字的低于0.2%。本方法另备有高频字和词组共数百个,可以用一至两个键(HOTKEY)不换挡打出,更可利用相关字和词的方便,因此实际需要选字的几率少于10%。如果增加取码次数,常用词可达到一万个以上,选字几率还可降低。本专利技术的汉字编码法与简易法同属于首尾取码法,但需要选字的几率却有天壤之别。本法使用HOT KEY的方法是利用键盘上剩余的键设置高频字,因为编码只用了十个字母键(实际是代表数目字用,详情见后文的使用方法)。相信这种方法是本专利技术首创。本方法还有不需选字的一字三码模式输入,适应有需要的人士选择。(见后文的“一字三码模式”一节)。一般以字根编码的输入法都无法将数目众多的字根清晰明确地分类,并分配到相应的键上使学习者容易记忆,而只能依靠强本文档来自技高网...

【技术保护点】
一种适用于计算机输入的数码化汉字部首检索法,其特征在于,根据汉字的字形将汉字归类成50个不同的部首,分别赋予01-50的两位代码,每个汉字则分为字首和字尾,所述字首和字尾都用所述部首的代码取码。

【技术特征摘要】

【专利技术属性】
技术研发人员:刘全忠
申请(专利权)人:刘全忠
类型:发明
国别省市:HK[中国|香港]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1