当前位置: 首页 > 专利查询>罗彬专利>正文

计算机形声位全息汉字输入法制造技术

技术编号:2892489 阅读:197 留言:0更新日期:2012-04-11 18:40
本发明专利技术属于汉字信息处理范畴,计算机汉字编码技术。主要解决目前汉字编码输入技术存在的容易学的使用不便,而能快速输入的却比较难学、难记的缺点。其技术特征是:选取约三百二十个简单易识的字和部首作为编码码元,以声助记,充分利用汉字的形状和结构位置的各种信息以求有效地对汉字进行编码,三键一字。好学、好记,可以盲打和快速输入。除专业人员外,对非专业人员也很有效,并适合外国人和中小学生使用。(*该技术在2013年保护过期,可自由使用*)

【技术实现步骤摘要】

本专利技术属于汉字信息处理范畴,主要用於计算机汉字输入编码,并适用于其他需要进行汉字编码(如编纂词典、汉字检索等)的场合。根据汉字的结构可以拆分为各种字根和笔形,不同的笔形和字根可以组成不同的汉字,而且相同的笔形和字根因为相对位置的不同也可以组成不同的汉字,例如“杏”和“呆”字,但更典型的是“旱”、“旰”,这两个字的书写先后也一致。因此,利用汉字的形、位进行汉字编码是本专利技术的重要特征。目前的汉字编码技术大致可分为三类声码、形码或声形(形声)码,一般存在好学好记的使用起来却不太方便;而输入速度快适于专业人员使用的又比较难学;有的编码技术利用计算机键盘比较容易,但对一些见字就要编码的场合(如查字典)就比较困难。而且,新的字符集有两万多字,对于大多数人来说不可能利用声码来复盖整个的字集。本专利技术可以有效的克服上述的缺点,具有①见字识码,易学易用;②重码率低,计算机输入时可以盲打;③兼顾字典编纂、汉字信息检索等多方面的需要;④借用英文键盘可以方便外国人使用,广大的中小学生也容易掌握本技术。本技术的全称是“形声位全息汉字编码技术”,简称“罗码”。是一种非字根的编码方法,其特点是1.采用约三百个简单字和十三种笔划作为编码码元,这些简单字的选取原则是六笔以下容易认识的字;笔划虽多但不易拆分的字,如“革”,“鬼”等;《BG2312-80》中的大部分部首字。由於这些简单字的组合不能完全复盖整个汉字字集,又选择了十三种笔划作为编码码元。在笔划的选择上除传统的横、竖、撇、折、捺、点外,还定义了几种复笔笔划,具体解释如下①交和叉。交是纵笔或近似纵笔的斜笔和其他两笔或两笔以上的笔划相交者,叉是任何两笔相交者。注意交、叉与“丰”、“十”、“乂”等字的区别,遵循取码时先简单字后笔划的原则。②弯、勾、折、角。弯和勾的区别是取码位置的不同,从起笔处取码为弯笔,而在收笔处取码则为勾。“弯”是同方向弯曲者,而“折”是反向弯转如“乙”字形等。角是弯笔或两笔呈直角或小於直角的顶点。我们规定弯笔在转角处取码为“角”笔,而折笔无论在何处取码都为“折”。2.为了便于记忆,我们用上述的简单字(以下简称笔形)和笔划的读音声母的第一个拼音字母作为这些笔形、笔划的编码码元代码,如“木”的代码为m,“撇”的代码为p。有一个例外,“口”字的代码为o。并用I、U、V代表yi、wu、yu,这样用英文字母键和拼音字母相对应,用英文键盘输入汉字。简单字和笔划的代码见表1,表2。3.按位置顺序取码,充分提取汉字字形中形状和位置的信息,如前述的“旱”、“旰”二字尽管码元和落笔的先后顺序一样,但其相对位置不一样,其编码分别为rgh和rgs。具体说编码的方法是自左上角起顺时针方向依次取字的左上、右上、右下字角的码元代码为其编码,如“韶,ldo”。由于汉字结构复杂,应遵循以下的规则①不重复取码,如果这个码元已经取过,那么顺序取另一个字角的码元,如“敬”,其右下角的“反文”已经取过,因此第三码应取左下角的“句”,因此其码为cfj(“草字头”,“反文”,“句”)。②标准码长为三字符,若该字只有两个码元,那么第三码从第二个码元的相应位置取,如“码”字由码元“石、马”组成,该字的编码为smz,第三码Z在马字的右下角取,因该角为一折笔,其代码为Z。③最大取码的原则,即从这个取码的字角看以笔划最多的码元作为该角的代码,如“休”字,编码为rmx,它的右下角除已用过的码元“木”外,可以看作一捺或一个小字,按这个原则取码为x。④上、下结构的汉字若只有两个码元取第三码时,如下部可以分为两码则取左下角否则顺时针取下部结构的左上角。如“充,vep”,“宋,bms”。这就是顺时针螺旋定位取码的原则。⑤对于同一码元可有不同的代码,如十字也可以看成“叉”,因此规定取码时的次序是先繁后简,先笔形后笔划,先复笔后单笔,先曲笔(折、弯)后直笔。⑥其他规则可拆不断,即一个码元可从整个字中抽出来,但不能断任何笔划,如“难”的右下角可拆出一个“圭”但不能将一竖断开而成一个“王”;上上下侧,即在字的上部取码应侧重最上面的笔划,而在下部取码则应偏向一侧的笔划;先外后内,即先取外框的码再从内部结构取下一码;托笔后取,在下面有一笔(如“走之”等)的字,右下角应先取托笔以上的码元,如“这,zwi”。可以看出,本技术充分注意了汉字结构中码元所在的位置信息。取码口诀顺序循角,螺旋定位。最大取码,先繁后简。先外后内,上上下侧。可拆不断,托笔后取。4.为了便于取码,根据上面的原则和不同的汉字结构绘制了取码图,以便按图索骥。见附图说明图1。5.简码和四码。选取了二十六个以声母命名的高频简码字,这些字也作为码元。其它简单字以其代码和左上角的码元为其编码。如“是s”,“分fb”不足三码者输入空格键。对于三码有重码的字则应取第四码,其方法是①如存在第四角,在第四角取码,如“韶ldor”;②均衡取码,在顺时针的第二个码元与已取过码的相对位置再取一码如“剖ldog”,“傅rfck”;③全息取码,某一位置还存在没有取用的码元,也可作为第四码,如“寂byxs”。6.词组编码。①二字词,第一字取第一和第二码,第二字取第一码,如三码有重码,再加取第二字的第二码。如“安静bnq”,“客观boyj”。②三字词,第一字取一、二两码,第二、三字各取第一码。③多字词,第一、二、三字各取第一码,最后一个字取第一码。7.本专利技术的载体是计算机软磁盘或硬汉卡以及编码表和说明书。①运行环境硬件IBM-PC系列机及其兼容机;软件CCDOS2.13H;②输入方式利用英文键盘用英文字母键与相应的汉语拼音字母对应;③软件的特点高频字优先,即有重码时只要敲空格键高频字即会录入;第四码输入灵活,如“骏、梭”,“傅、俦”等字,它们区别所在的部位是不同的,前一组可以左下角区别,而后一组则可用第二码元的左下角来区别,因此它们的编码分别为“mvyt、mvyx”,“rfck、rfcj”这样就产生了二义性,用户可以从屏幕提示行来得到提示,熟练后就记住了并不须强记,而且提示行可以双重提示MVY1.骏b2.梭b3.骏t4.梭x即可屏幕选字,经过熟悉可以盲打。大多数的四码字第四码很明确。上面仅是为处理少数重码的方法。汉字中有许多字很冷僻,但对某一地区或某些行业却是高频字,软件中设置了用户词典可按用户的约定编码方便地输入汉字。实施例韶ldor领lyb树mcyj棉mbjr纸lsct纸张lsgc人r人民rmj人间rmr从rrn从前rred从而rreh健rvzz健全rvrw健康rvav中zj中国zjkd中华zjrq中国政府zkza中华人民共和国zrrk济dwd济南dwns权利要求1.一种用于计算机汉字词输入及其它进行汉字词编码检索(如编纂词典)的技术,其特征是①选取约三百二十个笔形简单、笔划少的易识汉字如弓、长、立、早等作为编码码元,为了弥补这些字复盖不全的问题,将十三种笔划也作为码元。②为了便于记忆,将这些简单字和笔划的读音声母的第一个字母作为该码元的代码。③编码时按码元的位置顺时针螺旋形方向循字角取码,不拆字只按该字角的外形表现取码。④取码的规则是顺序循角,螺旋定位,最大取码,先繁后简,先外后内,上上下侧,可拆不断,托笔后取。2.本专利技术以计算机软磁盘或汉卡为载体,包括编码表及说明书。①运行环本文档来自技高网...

【技术保护点】
一种用于计算机汉字词输入及其它进行汉字词编码检索(如编纂词典)的技术,其特征是:①选取约三百二十个笔形简单、笔划少的易识汉字如:弓、长、立、早等作为编码码元,为了弥补这些字复盖不全的问题,将十三种笔划也作为码元。②为了便于记忆,将这些简单字和笔划的读音声母的第一个字母作为该码元的代码。③编码时按码元的位置顺时针螺旋形方向循字角取码,不拆字只按该字角的外形表现取码。④取码的规则是:顺序循角,螺旋定位,最大取码,先繁后简,先外后内,上上下侧,可拆不断,托笔后取。

【技术特征摘要】

【专利技术属性】
技术研发人员:罗彬
申请(专利权)人:罗彬
类型:发明
国别省市:37[中国|山东]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1