当前位置: 首页 > 专利查询>郭汝嵩专利>正文

两笔画为一单元进行形码编码的音形码汉字编码输入法制造技术

技术编号:2882860 阅读:337 留言:0更新日期:2012-04-11 18:40
本发明专利技术涉及一种基于音形码的汉字计算机编码输入法。本汉字编码输入法的音码采用双拼方式,形码编码采用两个笔画为一个单元的编码方案,每个汉字的输入码长最长为四。这种编码方案一次对两个笔画进行编码,效率高而重码率低;对单一笔画编码的解决方法与众不同;同时可以解决笔画、部首、偏旁、部件的字符输入问题。本汉字编码输入法来严格遵守国家对汉字语言文字规范的规定,这是一种严谨而高效的汉字输入编码方案。(*该技术在2020年保护过期,可自由使用*)

【技术实现步骤摘要】

本专利技术涉及一种基于音形码的汉字编码输入法。现有的汉字编码输入方法种类很多,其中基于音形码的一类编码方案是在音码的基础上通过形码对重码进行选择。这一类方案充分结合了音码和形码两种编码的特点和优势,对汉字音形两方面的特征加以充分的利用,是一种效率较高、重码较低、较易使用的一类输入方法。但是各种基于音形码的汉字编码输入方法在音码和形码部分具体的编码规则又有所不同。(90107603)的“计算机汉字音形输入方法”的音码采用的是拼音方式,形码部分是在拼音输入的基础上再辅以一个字首先开始书写时的一个笔划、笔划组合或偏旁部首为字形特征;(97118831)的“音速码汉字输入系统及其输入键盘”的音码采用的也是拼音方式,而形码部分是按汉字四角笔形和结构取码。现有的基于音形码的汉字编码输入法中形码部分的编码都比较复杂甚至混乱,不易使用。针对上述问题,本编码输入法在形码部分独创性地采用了“以两个笔画为一个单元”的编码方案,相比来说是一种比较高效和易于使用的统一编码方法。同时现有的计算机汉字输入方法都没有对包括笔画、部首、偏旁和部件在内的字符输入提供有力的支持,而本编码输入方法则提供了与汉字类似的一种“以两个笔画为一个单元”的编码输入方案,从而解决了这类字符的输入难题。本汉字编码输入法中对汉字有明确的界定。具体来讲,本汉字编码输入法中所指的“汉字”是指《国家标准信息交换字符集(GB2312—80)》中的汉字,其读音以《新华字典》(1998年修订本)为准;而《国家标准信息交换字符集(GB2312—80)》中的字符(笔画、部首、偏旁、部件等)则按照本编码输入法对“字符”的编码方案进行编码;“汉字”或者“字符”的笔画顺序和类型都以《现代汉语通用字笔顺规范》(1998语文出版社)为准。本专利技术的具体编码规则和方案的说明如下1.编码规则1)对于汉字的编码规则·对于有读音且笔画数目为四画或四画以上的汉字首先按照2中所述的“双拼编码方案”输入音码的声韵两位编码作为该汉字的第一和第二位编码;然后按照3中所述的“对两个笔画所形成一个单元的编码方案”采用以两个笔画为一个单元编码的形码,以该汉字笔画的头两画编为第三位码,末两画编为第四位码;由这四位编码输入该汉字。·对于有读音但是笔画数目少于四画的汉字第一和第二位编码按照2中所述的“双拼编码方案”采用音码的声韵两位编码;然后按照3中所述的“对两个笔画所形成一个单元的编码方案”采用以两个笔画为一个单元编码的形码,接下来按照笔画的顺序每两个笔画编一位码;对单数笔画汉字的最后一画按照4中所述的“对单一笔画的编码方案”采用该单一笔画的代码编为该字符的最后一位编码。·对于部首“木”作为左边和上边偏旁的汉字采用如下特殊的处理方法以减少重码由部首“木”作为左边偏旁的汉字其第一和第二位编码采用音码双拼的两位编码,第三位形码编码事先规定为“d”,由这三位编码输入该汉字。这是由于在汉字中左边偏旁部首为“木”和“扌”、右边部分相同并且读音(不考虑音调)也相同的汉字有很多,比如“札”和“扎”,“朴”和“扑”等等。因此为了减少这种大量重码的特殊现象,本编码方案特别规定由部首“木”作为左边偏旁的汉字其第三位形码编码为“d”,由前两位音码和第三位形码“d”来确定该汉字。同时由部首“扌”作为左边偏旁的汉字编码则按照本编码方案通常的处理方式进行;部首“木”不是作为左边或上边偏旁的汉字,如“柔”、“案”等汉字的编码也按照本编码方案通常的处理方式进行。2)对于字符(笔画、非成字部首和非成字部件)的编码规则·对于笔画数目为八画以上字符(笔画、非成字部首和非成字部件)按照3中所述的“对两个笔画所形成一个单元的编码方案”按照笔画顺序进行编码。以该字符笔画的头两画编为第一位码,第三画和第四画编为第二位码,第五画和第六画编为第三位码,最后两画编为第四位码,由这四位编码输入该字符。并且在非汉字的编码最后加符号“`(撇号)”,以便与汉字编码区别。·对于笔画数目为八画和少于八画的字符(笔画、非成字部首和非成字部件)按照3中所述的“对两个笔画所形成一个单元的编码方案”按照笔画顺序进行编码,每两个笔画编一位码。但是对单数笔画字符的最后一画按照4中所述的“对单一笔画的编码方案”采用该单一笔画的代码编为该字符的最后一位编码。并且在非汉字的编码最后加符号“`”,以便与汉字编码区别。3)简码编码本汉字编码输入法对汉字的编码最长为四个码。为了提高输入效率,在具体实施中本汉字编码输入法还根据每个汉字出现的频繁程度分别编订了一级、二级和三级简码,其码长分别为一、二和三个字符。2.双拼编码方案本专利技术基于音形码的汉字编码输入法在音码方面采用“双拼”的拼音方式,由声母和韵母构成声、韵两个音码编码。其中声母和韵母代码的键盘排列分布见“说明书附图说明”部分的表1。对于没有声母的音节(即零声母音节)本汉字编码输入法采用虚拟声母作为声母的编码。其中将虚拟声母规定为该音节韵母的第一个英文字母。例如零声母音节“a”的虚拟声母应是字母“a”,零声母音节“an”的虚拟声母也是字母“a”,零声母音节“ou”的虚拟声母应是字母“o”。再加上韵母的编码(韵母“a”的编码是“a”,韵母“an”的编码是“f”,韵母“ou”的编码是“p”),则零声母音节“a”的音码应为“aa”,“an”的音码为“af”,“ou”的音码则为“op”等。3.对两个笔画所形成一个单元的编码方案本专利技术基于音形码的汉字编码输入法在形码方面采用一种以“两笔为一个单元”的编码方案。汉字的笔画一般分为横、竖、撇、点、折五种,将这五种笔画看作是一个集合A,则A可以表示为A=|折,一,丨,丿,丶|;另外一种为了说明方便的表示方法是用数字代表笔画,即用五进制的一位数“0、1、2、3、4”分别表示“折、一、丨、丿、丶”。这样表示笔画的集合A就可以表示表为A=|0,1,2,3,4|。在上面单一笔画的基础上,以两个笔画为一个元素所构成的集合——即集合A与集合A的笛卡儿积AxA就可以表示为AxA=|(折,折),(折,一),(折,丨),(折,丿),(折,丶),(一,折),(一,一),(一,丨),(一,丿),(一,丶),(丨,折),(丨,一),(丨,丨),(丨,丿),(丨,丶),(丿,折),(丿,一),(丿,丨),(丿,丿),(丿,丶),(丶,折),(丶,一),(丶,丨),(丶,丿),(丶,丶)|;同样的,另外一种为了说明方便的数字表示方法可以将AxA表示为五进制二位数的集合,即AxA=|00,01,02,03,04,10,11,12,13,14,20,21,22,23,24,30,31,32,33,34,40,41,42,43,44|。基于以上的思想和理论基础,AxA集合中的25个元素就与两个笔画所形成的单元达到了一一对应的关系。根据这种一一对应关系,本专利技术将两个笔画所形成单元编码如下AxA=|n,b,v,c,x,z,g,f,d,s,a,h,j,k,l,m,t,r,e,w,q,y,u,i,o|。对两个笔画所形成一个单元的编码方案在键盘上的分布和排列还可以参见“说明书附表说明”部分的表2。4.对单一笔画的编码方案本专利技术在对于有读音但是笔画数目少于四画的汉字和笔画数目为八画和少于八画的字符(笔画、非成字部首和非成字部件)这两种情况本文档来自技高网...

【技术保护点】
一种基于音形码的汉字计算机编码输入法,其特征在于:对于有读音的汉字,首先输入音码双拼的两位编码作为该汉字的第一和第二位编码,然后采用以两个笔画为一个单元编码的形码,以该汉字笔画的头两画编为第三位码,末两画编为第四位码,由这四位编码输入该汉字。

【技术特征摘要】

【专利技术属性】
技术研发人员:郭汝嵩
申请(专利权)人:郭汝嵩
类型:发明
国别省市:11[中国|北京]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1