当前位置: 首页 > 专利查询>汪争平专利>正文

一种计算机汉字输入方法技术

技术编号:2890606 阅读:177 留言:0更新日期:2012-04-11 18:40
本发明专利技术涉及汉字编码法,尤其是音形结合的汉字编码法及其键盘。本发明专利技术将汉字的声母、韵母及汉字部件作为基本码元,并采用若干识别码来减少重码,将汉字字根在键盘上的定义排列尽可能地兼顾了在每个键位上所容纳的汉字和词组的均衡性,因而能够实现在编入国际一、二级汉字库的6763个汉字以及35000多条常用词组的情况下,其单个汉字和词组输入的绝对重码率降低到1‰以下。因此,本发明专利技术不仅编入词组多而且重码率低,汉字输入速度快。(*该技术在2016年保护过期,可自由使用*)

【技术实现步骤摘要】

本专利技术涉及汉字编码法尤其是音形结合的汉字编码方法及其所用键盘。中国专利申请号为93118140.2的“汉字形音输入法”公开了一种汉字编码方法“其特征为(1)汉字读音的第一个汉语拼音字母作为XY码的第一个字符。(2)汉字拆分后的首部件、次部件和末部件读音的第一个汉语拼音字母作为汉字XY码的第2、3、4个字符。(3)不认识的汉字、无法给出汉字读音,可以通过拆分的首部件、次部件、第三部件和末部件读音的第一个汉语拼音字母得到汉字XY码。”该编码法由于仅用汉字及其部件读音的第一个汉语拼音字母作汉字的编码,其重码率较高并限制了编入词组的数量。本专利技术的目的就是针对上述不足进而提供一种汉字输入重码率较低且能编入较多词组的汉字编码方法及其所用键盘。本专利技术的技术方案是,一种汉字编码方法,其要点是将汉字按其读音拆分成声母和韵母,并按其字型结构拆成汉字部件,使得每一汉字或词组由声母、韵母和/或汉字部件组拼而成,所述汉字部件包括整字字根部件、非整字字根部件、非字根整字部件,本编码法将声母、韵母作为汉字的音码,将汉字部件作为汉字的形码,汉字字根部件及其代码如下 而且,汉字拆成汉字部件的原则是(1)顺序拆字、尽量取大,(2)先取优先,(3)整字字根优先,(4)交叉优先。而且,汉字按声母、韵母、汉字部件顺序编码(1)单字的编码顺序为声母、韵母及作为识别码的汉字部件;(2)两字词组的编码顺序为第一个字的声母和韵母、第二个字的声母和韵母及作为识别码的汉字部件;(3)三字词组的编码顺序为三字词组识别码、词组各字的声母及汉字部件;(4)四字及四字以上词组的编码顺序为四字词组识别码、四字及四字以上词组第一、二、三字和末位字的声母。或者,汉字按汉字字根部件、声母、韵母顺序编码(1)单字的编码为汉字字根部件和识别码,识别码为该字的声母和韵母;(2)两字词组的编码顺序为第一个字的首部件。第二部件和第二字的首部件、第二部件及第一、第二字的声母;(3)多字词组的编码顺序为三字词组取第一字的首部件、第二部件和第二、第三字的首部件及三字词组识别码;四字及四字以上词组取各字的首部件及四字词组识别码或多字词组的第一个字或其后字的声母。而且,数字符号、标点符号、字根符号、日、俄文汉符号和其他特殊符号的编码依次为“IZFH”、“BDFH”、“ZEFH”、“RWZM”、“EWZM”和“TIFH”。本专利技术提供的键盘,包括A、B、C………X、Y、Z二十六个英文大写字母键及空格键,其特点是,汉字的声母、韵母及字根部件的键位如下安排 其中“A”键和“O”键分别为三字词组和四字以上词组的识别码。本专利技术由于将汉字的声母、韵母及汉字部件作为基本码元,并采用若干识别码来减少重码,将汉字字根在键盘上的排列尽可能兼顾了在每个键位上所容纳的汉字和词组的均衡性,在编入国际一、二级汉字库的6763个汉字以及35000条常用词组的情况下,其单个汉字和词组输入的绝对重码率降低到1‰以下,因此本专利技术不仅编入词组多而且重码率低。下面详细介绍本专利技术的键盘及其汉字输入方法。本专利技术可按前述对应关系将汉字的声母、韵母及字根部件定义在键盘上,并按下述方法输入汉字一、以音码为主输入汉字这种方法特别适合于用户在创作文稿时边想边打或边听边打时使用。单个汉字和两字、三字词组输入的标准编码长度为四码,极少数输入第四码后仍会出现重码的单字和两字、三字词组可以取第五码作为识别码输入。四字词组的标准编码长度为五码。但最常用的26个汉字只取一码可输入,约有600多个常用汉字和少量词组可以取两码输入,绝大多数的单个汉字和词组取三码或四码便可输入。因此,实际上只有少数词组才需取第五码作为识别码输入,为了照顾一些用户的习惯,偶尔遇到重码时也可以用数字键选择输入。1、单字 单个汉字输入的前两码为双拼音码,第一码为其声母,第二码为其韵母。例如要输入“方”字,先输入声母“F”对应字母键F,再输入韵母“ang”对应字母键G,即可在屏幕下方提示行出现“方”字。对于无声母汉字如“啊、安、爱、奥、昂、恩、儿、欧、哦”等,以E键作为其虚拟声母,例如要输入“安”字,先输入虚拟声母“E”,再输入韵母“an”对应的字母键F,“安”字即会出现在提示行。输入前两码后,所有的同音汉字都会出现在屏幕下方提示行,此时可通过数字键进行挑选,重码如果太多还可用“=”键或“-”键向后或向前翻页进行挑选。但完全用双拼输入法输入单个汉字很不方便而且很慢。因而本专利技术在输入双拼编码后,还可接着输入汉字的形码来输入用户所选择的汉字,即拆取汉字的部件并输入相应的形码,用户选择的汉字就可以马上出现在屏幕上。汉字部件的拆取及形码的确定如果对汉字的字型结构和人们识字的过程加以分析,我们可以发现,所有的汉字实际上都是由两类部件组成的一类是笔划较少的整字部件,例如“类”字就是由“米”字和“大”字组成的;另一类是非整字部件,包括单笔划部件和多笔划部件结合而成的偏旁部首,例如“斤”字是 和“”两个部件组成的。本专利技术形码就是拆取这两种类型的部件编成的。为了避免将汉字拆分得太细变得过于繁琐,同时又不能拆得太粗引起大量重码,本专利技术选取了100多个经常用来组成汉字的整字、偏旁部首和单笔划,将其规定为“字根”,并对这些字根加以科学的归类和排列,使其很容易便能全部记熟。因此,本专利技术实际上将所有的汉字部件分为整字字根(包括变形整字字根,例如整字字根“水”的变形字根“氺”“云”的变形字根 等),非整字字根和非字根整字三种类型,并对这三种类型和部件规定了特定的拆分和编码规则。本输入法拆取形码的规则非常简单,具体规定可归纳为四句话(1)顺序拆字,尽量取大。这一规则的含义是,拆取单个汉字的形码一般应按照汉字书写的笔顺规则拆取由连续笔划组成的尽可能较大的字根或整字部件。拆取第一个部件(首部件)后,接着再按同样的原则从余下的部分中拆取第二部件。例如“蝶”字的形码应取“虫”部为首部件,取“世”部为第二部件;“剑”字的首部件取 ,第二部件取“刂”。也就是说,形码的首部件不仅可以拆取字根,还可以拆取非字根的整字。但形码的第二部件能否取非字根整字部件则要视该整字部件是否为字根及拆取后是否还有余下的部件而定。如果第二部件拆取非字根整字后还有剩余部件,则可以取非字根整字作形码的第二部件。如果拆取后不再有剩余部件,则该整字部件还须再拆开。例如“腰”字的首部件“月”部拆取后,余下的部件为“要”字,但如果将其全部取为第二部件,就没有剩余的部件了。因此“要”字还必须再拆开。这时仍须按“顺序拆字,尽量取大”的原则,将“要”字拆分为“西”部和“女”部,所以应取“西”部作为“腰”字的第二部件。如果拆取形码首部件后仅剩一个字根部件,则不管它是整字字根或是非整字字根,一律不再拆开,例如“伟”字的首字根部件为“亻”,第二字根部件为“韦”。也就是说,字根是组成一个汉字的最小部件单位,遇到字根部件一律不拆。但对于字根整字应视同一个独立的整字拆开输入。例如“大”字应拆为“一”和“人”;“羊”字应拆为“”和“”,等等。拆出汉字部件后便可按该汉字的第一部件和第二部件输入形码部分的首码和第二码了。如果是规定的字根部件,则按字根在编码表中对应的代码输入形码;如果是非字根整字部件,则按该整字的声母输入形码。例如上例几个单字的编码即为DM本文档来自技高网...

【技术保护点】
一种汉字编码方法,尤其是音形结合的汉字编码方法,其特征是,将汉字按其读音拆分成声母和韵母,并按字型结构拆成汉字部件,使得每一汉字或词组由声母、韵母和/或汉字部件组拼而成,所述汉字部件包括整字字根部件、非整字字根部件和非字根整字部件,整字字根部件、非整字字根部件及其代码如下:***。

【技术特征摘要】

【专利技术属性】
技术研发人员:汪争平
申请(专利权)人:汪争平
类型:发明
国别省市:83[中国|武汉]

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1