当前位置: 首页 > 专利查询>麦世基专利>正文

一种将汉字输入计算机的方法技术

技术编号:2890913 阅读:259 留言:0更新日期:2012-04-11 18:40
一种将汉字输入计算机的方法。它是用0~9十个阿拉伯数字分别代表汉字的十类特征笔形;按照从上到下、从左至右、从外向内的采码顺序,对汉字进行直接编码,编制出由1~6个数字组成的数码,然后用计算机键盘上0~9的数字键输入计算机。本发明专利技术的编码方法直观、简单、十分易学,且重码率在2%以下。本汉字输入法只用数字键输入汉字,既便于盲打,也利于计算机的微型化。(*该技术在2016年保护过期,可自由使用*)

【技术实现步骤摘要】

本专利技术涉及一种汉字的计算机输入方法。现有的汉字的计算机输入方法有音码、形码、音形结合码、声码、数字码等。现有的形码输入法如五笔字形输入法存在着字根繁多难记,学习难度很大的缺点;音码输入法对于不精通汉语拼音或方言杂多的华东、华南地区的许多操作者来说也难适用;数字码是一种把汉字中的某些结构单元转化为阿拉伯数字的编码,例如CN1068667是用通用的电报码作为汉字输入的编码;CN1072783是将我国汉字检字法中的四角号码作为汉字输入的编码。这两种数字码输入法虽然编码方法简单、易学易记,但也存在着重码率较高的缺点。本专利技术的目的就是要充分发挥数字码的上述优点,采用新的采码规则和笔形编码规则,将汉字中部分或全部结构笔形转换为相应的阿拉伯数字,用一到六个数字将汉字输入计算机。本输入法的重码率在2%以下。本专利技术通过下述技术方案实现根据“汉字采码规则”和“汉字笔形编码规则”对汉字中的各个结构部分按从上到下、从左向右、从外向里的顺序采码并编制出该汉字相应的数字编码,再用计算机键盘上的0~9的数字键及“十”(或其它符号)键输入计算机。本专利技术还包括汉语词组的编码和快速输入方法。实施本专利技术的具体方法如下。一、汉字笔形编码规则本专利技术的汉字笔形编码规则是在现行的四角号码查字法的汉字笔形编码法的基础上发展起来的。本规则将汉字中的各个笔形分为单笔、复笔两种,其中单笔细分为四类分别为横笔、垂笔、点捺笔、角笔;分别用数字1、2、3、7作为它们的代码,其中复笔细分为叉笔、串笔、八笔、小笔、头笔六类分别用数字4、5、6、8、9、0作为它们的代码,有关每类笔形的详细情况见表一。当横笔中的“一”、叉笔中的“十”、方笔中的“口”、八笔中的“八”、小笔中的“小”作为单个汉字时,可直接用其代码输入,表一中其它笔形用作单个汉字时须拆开重新编码输入。例如“人”的输入编码为23,“入”的输入编码为32。二、汉字采码规则本专利技术认为汉字是由若干个可编码的笔形组合而成的,给这些组合的笔形编码应遵循下述采码规则依序采码。1.先采位置靠上的笔形;当各笔形间无上、下位置差别或者差别不明显时应先采靠左的笔形;对有包围或半包围结构的汉字,应由外向里采码。例如“龙”字按照上述采码顺序可采出ナ、 、乂、四种笔形,“囹”字按顺序可采出口、人、 、フ、 5种笔形。2.采码时根据编码规则尽可能采复笔。例如“木”应依序采出“十”、“八”两种笔形,而不是1、一、八、三种笔形。3.在采代码为6,7两类笔形及代码8中的、 厂笔形时,允许这些笔形借用其它已被编过码的笔形中的笔画;另一方面已经被编了码的上述笔形中的笔画也可以被其它笔形所借用。例如“甲”字可依序采出口、,其中笔形是借用了口中下面的一横;“由”字可依序采出、口,其中笔形口是借用了中的一横。4.每个汉字按下述规则来确定采码的位数(1).单元汉字,连续采最多六个码,但其中第六个码应该是该字的最后的一个码;不足六个码时有几个码采几个码。本专利技术把下述汉字定义为单元字A、本身就是在一般新华字典中被列为部首的汉字,例如“青”为单元字,其编码为5188。B、汉字中只能归属于丨、-、丿、 、乛、、二、亠部首的无其它偏旁的独体汉字是单元字。例如立、五、夫、手、丘。C、有匚、、 ㄅ、□偏旁的包围、半包围汉字,当除偏旁以外部分的笔画少于等于三画时作为单元汉字。例“凶”的编码为84。(2).三元字——本专利技术把由相等三部分重叠组成的汉字定义为三元字,各取每部分的第一码和第二码,共6个码。例如“品”为666,“矗”为484848。(3)双元字——除1,2所述的一元字、三元字以外的汉字为双元字,其中偏旁部分作为一元,其余部分作为另一元。例如“准”是由冫、隹两元组成,“匍”是由ㄅ、甫两元组成,对双元字采码时每元各采最多三个码,其中第三码应该是该元的最后一码。双元字前一元的码与后一元的码间用“十”或其它符号连接。例如“林”的编码为48+48。“匍”为8+538,但本专利技术对下述双元字的采码方法作如下补充规定A、裹、衷及类似字先将其拆分为界+衣两元和中+衣两元。分别对其各元编码,其中“衣”作为第2元。“衷”的编码为56+088。B、桑、叠、垒等字,其中一元出现重叠三小部分,该元采码时其中重叠的每一小部分均只取第一码,例如“桑”为777+48,“垒”为777+41。C、班、辨、器等字,把中间包夹部分作为第一元,其余部分为另一元,再按采码规则1,2,3,4采码。例如“班”为32+141,“器”为433+666。三、汉语词组输入方法先输入该词组的第一个汉字,然后按“×”键(或其它某个键)及第二个字的第一码,再按“×”键(或其它某个键)及第三个汉字的第一码……依此方法可输入二个字词及二字以上的多字词。例如,下述各词均可按上述方法输入中国按56×6即可输入中国人按56×6×2即可输入中国人民按56×6×2×2即可输入中国人民银行按56×6×2×2×8×8本专利技术由于采用了新的笔形编码规则和汉字采码规则,从而用一到六个数字组成的编码就能很好地从整体上表达出该汉字的结构特征,保证重码率在2%以下。而且从汉字转换成数字编码的过程简单、直观,限制性的规则少,有利于操作者理解和掌握,因此,本专利技术的汉字输入法很适用于那些使用五笔字形输入法和音码输入法有困难的操作者;由于仅用数字键和×、+键(十二个键)就可输入汉字,比用字母键(36个键)更便于盲打;同时本专利技术也为计算机(键盘)的微型化创造了条件。本专利技术的编码方法也可应用于信息检索,档案管理,字典查字等其它各类需要编码的领域。表一.汉字笔形的代码表 权利要求1.,其特征在于把汉字中全部或部分笔形转化为阿拉伯数字,形成该字的数字编码,再用计算机键盘上0~9的数字键把汉字输入计算机中,具体方法是<1>把汉字中的笔形分为十类,分别用0~9十个数字作为它们的代码,每类笔形相应的的数字代码及所包含的各种笔形如下笔形亠为“头笔”,代码为0;笔形一、 、乛为“横笔”,代码为1;笔形丿、 、 、丨为“垂笔”,代码为2;笔形 、~为“点捺笔”,代码为3;两笔相交的笔形+、ナ、 、乂、 为“叉笔”,代码为4;笔形扌、 、、 、丰及竖笔穿过两横笔以上的笔形为“串笔”,代码为5;笔形口为“方笔”,代码为6;单笔画构成的拐笔、、、 、ㄅ、 为角笔代码7;笔形八、入、人、亻、、冖、厂、二、ク、刀、勹、 、、丷、冫、 为“八笔,”代码为8;笔形小、 、个、、三、川、 、氵、 、巛、彡为“小笔”,代码为9。<2>对汉字按笔形进行分解采码时应遵循下述采码顺序先采最靠上的笔形,从上向下采码;当笔形间无上下差别或差别不明显时从左向右采码;对有包围或半包围结构的汉字应从外向里采码。采码后即建立了该汉字的数字编码。2.一种权利要求1所述的汉字输入法,其特征在于把群体汉字按结构划分为单元汉字、双元字、三元字三类。<1>单元字包括本身是部首的汉字;独体结构的汉字;有匚、、 ㄅ、□偏旁的包围、半包围汉字中偏旁以外部分笔画少于等于三画的汉字。单元汉字连续采最多六个码,但其中第六码应该是该字的最后一码。<2>三元字是指由相等三本文档来自技高网...

【技术保护点】
一种将汉字输入计算机的方法,其特征在于:把汉字中全部或部分笔形转化为阿拉伯数字,形成该字的数字编码,再用计算机键盘上0~9的数字键把汉字输入计算机中,具体方法是:把汉字中的笔形分为十类,分别用0~9十个数字作为它们的代码,每类笔形相应的的数字代码及所包含的各种笔形如下:笔形亠为“头笔”,、~为“点捺笔”,为“叉笔”,代码为4;、丰及竖笔穿过两横笔以上的笔形为“串笔”,代码为5;笔形口为“方笔”,代码为6;单笔画构成的拐笔、、、为角笔代码7;笔形八、入、人、亻、、冖、为、巛、彡为“小笔”,代码为9。对汉字按笔形进行分解采码时应遵循下述采码顺序:先采最靠上的笔形,从上向下采码;当笔形间无上下差别或差别不明显时从左向右采码;对有包围或半包围结构的汉字应从外向里采码。采码后即建立了该汉字的数字编码。2.一种权利要求1所述的汉字输入法,其特征在于把群体汉字按结构划分为单元汉字、双元字、三元字三类。ㄅ、□偏旁的包围、半包围汉字中偏旁以外部分笔画少于等于三画的汉字。单元汉字连续采最多六个码,但其中第六码应该是该字的最后一码。三元字是指由相等三部分重叠而成的汉字,其各小部分分别采前两个码,共六个码。除单元字和双元字以外的字均列为二元字,偏旁作为两元中的一元,其余部分作为另一元,每元连续采最多三个码,但第三码应该是该元的最后一码。前一元的码与后一元的码之间用“+”或其它符号连接。...

【技术特征摘要】

【专利技术属性】
技术研发人员:麦世基
申请(专利权)人:麦世基
类型:发明
国别省市:12[中国|天津]

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1