当前位置: 首页 > 专利查询>李东升专利>正文

拼音双形识别码制造技术

技术编号:2890146 阅读:213 留言:0更新日期:2012-04-11 18:40
拼音双形识别码是一种可对计算机拼音输入法中的同音重字进行单字识别的字形识别码。该识别码为两位编码,可分别与全拼、简拼、双拼等拼音输入法挂接,挂接后的输入法完全兼容原来的拼音输入法,但解决了原拼音输入法中同音重码多的问题,基本不用选码,可实现汉字的盲打输入。该识别码简单易学,需特别记忆的字根较少,加挂在各种拼音输入法上后,是一种较为理想的普及型计算机汉字输入法。(*该技术在2017年保护过期,可自由使用*)

【技术实现步骤摘要】
拼音双形识别码是一种可对同音汉字进行单字识别的字形识别码。该识别码分别与全拼、简拼、双拼挂接后形成全拼双形、简拼双形、双拼双形输入法,挂接生成的输入法完全兼容原来的拼音输入法,但解决了原拼音输入法中同音重码多的问题,对3755个一级国标常用汉字的重码率为1.8%,对词组的输入与原拼音输入法完全一样。该识别码简单易学,需特别记忆的字根较少,加挂在各种拼音输入法上后,是一种较为理想的普及型计算机汉字输入法,尤其是对已熟悉各种拼音输入法的用户。该输入法源于我们日常生活中一种极为常见的现象两人初次见面自我介绍时常这样说我姓张,弓长张;我姓陈,耳东陈。我姓张,我姓陈,只是告知对方了一个音,但究竟是哪一个字,就只能凭想象来理解了。而弓长张或耳东陈,就将这个字唯一地确定下来了,这就是拼音双形识别码的实质。拼音双形识别码为两码编码,第一码为首笔划所在的字根,简称为首字根,第二码为末笔划所在的字根,简称为末字根或尾字根。拼音双形识别码简称为双形码。拼音双形识别码是以拼音为基础,即以全拼、简拼、双拼等拼音输入法对汉字进行音分,再以该字的首尾笔划所在的字根进行形分,从而达到对单个汉字进行识别目的的一种汉字输入方法。双形码只考虑首尾字根,不考虑汉字构成的中间过程。因而也就简化了拆分的方法和过程。对词组的输入与全拼、简拼、双拼等拼音输入法中的词组输入方法完全一致,不用考虑词组的字的结构,加快了录入的速度。我们知道,当一个汉字的拼音码输入后,就会出现许多重码,这对于汉字的录入很不方便,双形识别码的功能就是将某个字从这些重码中识别出来,达到汉字的盲打录入。下面我们先介绍双形识别码所用的三类字根1、基本笔划字根汉字是由五种最为基本的笔划构成的,即一(横)、丨(竖)、丿(提)、丶(捺)、乙(勾)这五种笔划。我们将这五种基本笔划结合其读音特点分别定位在五个键位Y,H,T,N,G上。横"一"即为数字一,数字一的声母为Y,我们就用Y来表示横"一";竖"丨"特别规定在字母H上;提"丿"为提字的声母T;捺"丶"为捺字的声母N;勾"乙"为勾字的声母G。再将之扩展到各自相临的键位上,即形成了拼音双形识别码的基本笔划字根,其分布见附图说明图1。2、部首字根这一类字根由汉字组成中最为常见的偏旁部首及个别常用汉字组成,其分布见图2。3、最小成字根这是一类由用户按规则可自行判断识别的字根,不用去死记硬背,只要见了能读出其读音就可以了。最小成字根的构成遵循最小成字原则、不可分原则、不相交原则这三个原则。最小成字原则最小成字是按汉字书写笔划的先后顺序,由与首尾笔划相连的若干笔划组成的最小汉语成字。这个字及这个字的汉语拼音的第一个字母被称为最小成字根,也即不分zh,ch,sh与z,c,s,即zh由z代替,ch由c代替,sh由s代替,并且也不分零声母。如哎字,其首字根为最小成字根口字即K,末字根为最小成字根艾字即A,哎字的双形码即为KA;臂字的首字根为最小成字根尸字即S,末字根为部首字根月即O,臂字的双形码为SO;效字其首字根为最小成字根六即L,而不是交,末字根为部首字根攵即I,效的双形码为LI;班字的首字根为最小成字根干即G,而不是王,末笔字根为最小成字根土即T,而不是王,班字的双形码为GT;颅字的首字根为最小成字根卜即B,而不是卢,末字根为最小成字根人即R,而不是贝或页,颅字的双形码为BR。不可分原则在拆分字根时,不能将其它笔划分开,或被其它笔划分开。如果按此原则,只能从某字拆出基本笔划字根,而不按此原则可将此字恰好拆为两部分,且含有部首字根或最小成字字根的字根来,则可不按此原则拆分,如小字按此原则只能拆出亅和丶,而不按此原则可拆成亅和成字根八,则小字的首字根为G,末字根为B,小的双形码为GB。如“座”字,其首字根为最小成字根“广”即G,其末字根为坐即Z,而不是土。不相交原则在拆分字根时,不能从相交的笔划内拆出字根来。如果按此原则只能拆成基本笔划字根,而不按此原则可将此字恰好拆分成两部分,且有部首字根或字根来,则可不按此原则,如“来”字按此原则只能拆成一和丶,而不按此原则可拆成一和米,则来字的首字根为一即Y,末字根为最小成字根米即M,“来”字的双形识别码为YM;如再字的首字根为基本笔划字根一即Y,末字根为最小成字根冉即R,而非土,再字的双形码为YR。有了以上三类字根的概念,我们就可介绍双形码的概念了。拼音双形识别码即根据汉字书写笔划的先后顺序,遵循最小成字原则、不可分原则、不相交原则这三个原则,首尾字根分别按照先最大部首字根、再最小成字根、后最大基本笔划字根的步骤,对汉字进行首尾双形编码的方法。最小成字根我们前面已经介绍过了,现在我们介绍一下最大部首字根和最大基本笔划字根的概念。最大部首字根也即在拆分字根时,尽可能大地按部首字根中的最大部首拆分。如革字,其首字根为廿即N,而不是艹;埃字的首字根为即T,而不是十。最大基本笔划字根即在拆分字根时,尽可能大地按基本笔划字根中的最大字根拆分。如仁和仨字,其首字根均为部首字根亻即F,仁字的末字根为二即U,而不是一,仨字的末字根为三即I,而不是二或一。又如耒字,既可拆成一和未,也可拆二和木,而按此规定则只能拆成二和木。对汉字组成中的几种特殊情况,我们做如下规定①部首字根中的成字,在作其它字的首末字根用时,不作进一步拆分。如“鞍”字的首字根是廿即N,而不是艹或革,末字根为女即J,而不是安,鞍字的双形码为NG;踏字的首字根为部首字根即N,而非口。当某字本身为部首字根中的成字时,须对其作进一步拆分,即按先最小成字根,再最大基本笔划的顺序进行拆分。如廿字作单字用时其首字根为部首字根艹即A,末字根为基本笔划字根一即Y;如“中”字,可分为口和丨,即KH;“月”字可分为丿和二即TU。②某字作为成字用且其又为基本笔划字根中的某个时,则首字根用该字根表示,末字根补以空格键。如乙字作单字用时,其双形码为G,二字作单字用时,其双拼码为U。③完全相含型字,特别规定其外框口为首字根即H,其框内部分当作末笔划再按规则进行拆分,如圆、园字,其首字根都为口即H,圆字的末字根为人即R,园字的末字根为儿即E,因此,圆字的双形码为HR,园字的双形码为HE。④对不是汉语成字的偏旁部首,也即没有读音的偏旁部首,我们规定以字母O为第一个编码,在偏旁部首字根中有键位安排的,其第二码为该旁部首所在的健位,第三、四码为该偏旁部首的第一和末单笔划所在的键名;若在部首字根中无键位安排的,其第一、二、末单笔划所在的键名为第二、三、四位编码,不足四码的补以空格。如钅的首位编码为O,第二位编码为钅所在的键位即R,第三、四码为T和G,钅的编码为ORTG;部首勹没有键位安排,则其首位编码为O,第二、三位编码为T和G,第四码补空格。我们现将各个键位上的常用最小成字根总结如下,其中,有些字只能作首字根,有些字只能作末字根,有些字首末字根都可作,按规则很容易就可区分这个字究竟是作什么字根。A艾B匕、不、卜、办、半、八、丙、本、布、北、巴、贝C寸、才、厂、出、虫、串、重、长、齿、册、次、囱D大、刀、旦、丁、弟、电、歹、冬、单、当、东、氐E耳、儿、而F丰、凡、飞、夫、发、风、弗、缶、甫、番、父、孚G干、戈、艮、冈、广、工、龟、国、鬼、革、骨、更、瓜、弓H回、黑、禾、曷、亥、或本文档来自技高网...

【技术保护点】
拼音双形识别码为两位编码,是一种可加挂在全拼、简拼、双拼等拼音输入法后的字形识别码。

【技术特征摘要】

【专利技术属性】
技术研发人员:李东升
申请(专利权)人:李东升
类型:发明
国别省市:41[中国|河南]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1