汉字拼音输入系统技术方案

技术编号:2890175 阅读:180 留言:0更新日期:2012-04-11 18:40
本发明专利技术涉及一种汉字拼音输入系统,是对拼音码重码率高而作的改进。本汉字拼音输入系统包括拼音输入键盘;汉字关系表,存储一汉字与预定拼音码的第二汉字的对应关系,第二汉字是拼音码相同的汉字中跟在前一汉字后的概率最大的一个汉字;选字装置,根据前次输入的汉字和当前输入的拼音码,从汉字关系表的对应关系中找到第二汉字,将第二汉字作为用户要输入的汉字。本发明专利技术的汉字拼音输入系统减少了由于重码而产生的选字次数,大大提高了汉字输入速度。(*该技术在2016年保护过期,可自由使用*)

【技术实现步骤摘要】

本专利技术涉及一种汉字输入系统,尤其涉及一种通过拼音来输入汉字的输入系统。汉字输入是在计算机中应用汉字所必不可少的技术。因此,人们研究开发了各种汉字输入方法,至今,已有不下千种,然而,实际应用的却不多。拼音输入法是目前计算机中使用较广泛的一种输入法,虽然拼音输入法存在着输入速度慢,重码率高的缺点,但它在众多的输入法中能占一席之地有其特点,即,拼音输入法不象某些输入法要记忆许多规则,它容易学习,只要会读,一般都能用这种方法进行输入,因此适合于非专业人员使用。但由于汉字中同音字很多,除去声调,汉字中的发音只有四百多个,而常用的汉字就有四五千个,因此,拼音输入法的重码率很高,输入者输入时要从多个同音字中进行选择,这大大限制了输入速度。本专利技术的目的在于提供一种汉字拼音输入系统,它能根据前次输入的汉字判别当前输入的拼音码为何汉字,减少选择次数,从而提高输入速度。本专利技术的汉字拼音输入系统是通过输入拼音码来输入汉字,它包括拼音输入键盘,还包括汉字关系表,存储一汉字与预定拼音码的第二汉字的对应关系,所述第二汉字是拼音码相同的汉字中跟在前一汉字后的概率最大的一个汉字;选字装置,根据前次输入的汉字和当前输入的拼音码,从所述汉字关系表的对应关系中找到所述第二汉字,将所述第二汉字作为用户要输入的汉字。本专利技术的汉字拼音输入系统还包括句首字表,所述句首字表存储一拼音码与对应于该拼音码的一组同码字中最有可能成为句首的汉字的对应关系;句首判别装置,判别当前输入的拼音码是否为句首字,如果是,则使所述选字装置从所述句首字表中选择与用户输入的拼音码对应的汉字作为用户要输入的汉字。本专利技术的汉字拼音输入系统还可包括字频表,所述字频表存储一拼音码与对应于该拼音码的一组同码汉字中使用频率最高的汉字的对应关系,所述选字装置在所述汉字关系表中未找到对应关系时,根据当前输入的拼音码从所述字频表中找到与该拼音码对应的汉字,作为要输入的汉字。本专利技术的汉字拼音输入系统还包括关系学习装置,在所述选字装置不能从所述汉字关系表中找到所述第二汉字,或者用户认为找到的第二汉字不正确而由用户重新选择时,所述关系学习装置把用户的选择存储到所述汉字关系表中,或者代替所述汉字关系表中原来的对应关系。如上所述,本专利技术的汉字拼音输入系统在传统的拼音输入法的基础上增加了汉字关系表和选字装置,能根据用户前次输入的汉字来判别目前输入的拼音码所对应的汉字,从而提高了拼音输入法的输入速度。下面结合附图详细描述本专利技术的实施例,相信通过下面的实施例能对本专利技术的特征和优点有进一步的了解。附图说明图1是本专利技术的汉字拼音输入系统的结构框图;图2是本专利技术的汉字拼音输入系统的工作程序图。通常,一段文字或者文章在一句句子中,前后汉字之间是有一定的搭配关系的。如,在汉字“我”后面如果输入的是guo的拼音码,该拼音码所对应的汉字在大多数情况下应为“国”,而不会是“过”、“锅”等相同拼音码的汉字。又如,在汉字“我”后面如果输入的是men的拼音码,该拼音码所对应的汉字在大多数情况下应为“们”,而不会是“门”、“闷”、“扪”等相同拼音码的汉字。在目前所用的拼音汉字输入系统中,如果要输入“我国”这两个汉字,则输入“wo”,从拼音码都为“wo”的可选汉字,“我”、“握”、“挝”、“蜗”、“涡”、“窝”、“斡”、“卧”等中选出“我”,然后输入“guo”,从拼音码都为“guo”的可选汉字,“国”、“过”、“果”、“蝈”、“锅”、“郭”、“裹”等中选出“国”,完成“我国”的输入。然而,如上所述,由于在汉语中在“我”字后面跟拼音码为“guo”的汉字的可能性最大的是“国”字,因此,如果在确认的前一汉字为“我”时,如果后一输入的汉字的拼音码为“guo”,则可基本上确定该拼音码所对应的汉字为“国”,而不是“过”、“果”、“蝈”等其它相同拼音码的汉字。在这种情况下,如果输入系统能自动将“国”字确定为用户输入的汉字而不用用户从众多的同拼音码的汉字中去选择,可大大提高汉字的输入速度,而且又具有较高的正确性。对于一些特殊的情况,系统仍允许用户进行纠正。本专利技术的汉字拼音输入系统就是基于上述理论来实现的。如图1所示,本专利技术的汉字拼音输入系统由句首判别装置1、选字装置2、汉字关系表3、句首表4、字频表5和关系学习装置6构成。在汉字关系表3中,存储着一汉字与预定拼音码的第二汉字的对应关系。如在汉字“我”后面,对于预定的拼音码“guo”,第二汉字为“国”;对于预定的拼音码“men”,第二汉字为“们”。依此类推,把所有汉字的这种对应关关系都存储在汉字关系表3中。对于一些没有对应关系的组合,如在“我”字后预定的拼音码为“fen”的组合,由于没有合理的对应关系,可以作一个标记,如“-1”,以示这种组合关系不存在。句首表4存储了某一拼音码与对应于该拼音码的一组同码字中最有可能成为句首的汉字的对应关系。例如,对于拼音码“wo”,由于该拼音码出现在句首时,它所表示的汉字为“我”的可能性大于“握”、“挝”、“蜗”、“涡”等同码字,因此把在句首表中,存储了“wo”与“我”的对应关系,而不是与“握”、“挝”、“蜗”等字的对应关系。字频表5存储了一拼音码与对应于该拼音码的一组同码汉字中使用频率最高的汉字的对应关系。在汉语中,如果除去声调的变化,汉字的发音总计只有四百多种。即,对于拼音码来说,只有四百多种码。因此,在字频表5中,存储了这四百多种拼音码与相应的使用频度最高的汉字对应关系。如,对于“wo”拼音码,由于在拼音码为“wo”的一组同码汉字,“我”、“握”、“挝”、“蜗”、“涡”、“窝”、“斡”等中,根据统计,“我”的使用频率最高,所以在字频表中存储了“wo”与“我”的对应关系。上述汉字关系表3、句首表4和字频表5中的对应关系可以根据对大量汉语文章进行统计得到。选字装置2是根据输入的拼音码,从上述的汉字关系表3、句首表4和字频表5中选择对应的汉字作为用户要输入的汉字的装置。在选字装置2之前还有一个句首判别装置1,它首先对输入进行识别,判别输入的汉字是否为句首,如果是句首,则控制其后的选字装置2从句首表4中去选择汉字,否则从汉字关系表3或字频表5中去选择。下面结合图2的本专利技术的汉字拼音输入系统的工作程序图来进一步描述本专利技术的汉字拼音输入系统。如图2所示,在用户输入了一个拼音码(S1)之后,首先由句首判别装置1判别输入的拼音码是否为句首(S2)。对于句首的判别,可以通过判别在当前输入行内这次输入的拼音码之前是否已输入汉字,如果没有,则判定这次输入的为句首字。程序进行S3,由选字装置2到句首表4中去寻找与该拼音码对应的汉字。假设,输入的拼音码为“wo”,则从句首表4中查得对应的汉字为“我”。然后程序进入S8,输出该汉字,然后,程序返回等待下一输入。如果在S2中,判别出在当前输入行内这次输入的拼音码之前已有汉字输入,则程序进行S4。在S4,由选字装置2取出前次输入的汉字。假设,前次输入的汉字为“我”,而本这次输入的拼音码为“guo”,则在S4,取出前一次输入的汉字“我”,然后,程序进入S5,选字装置2从汉字关系表3中进行查找,先找到汉字“我”,然后,根据拼音码“guo”,寻找到在汉字“我”后,拼音码为“guo”所对应的汉字。如果在S6,没有找到相应的汉字,本文档来自技高网...

【技术保护点】
一种汉字拼音输入系统,通过输入拼音来输入汉字,包括拼音输入键盘,其特征在于,还包括:汉字关系表,存储一汉字与预定拼音码的第二汉字的对应关系,所述第二汉字是拼音码相同的汉字中跟在前一汉字后的概率最大的一个汉字;选字装置,根据前次输入的 汉字和当前输入的拼音码,从所述汉字关系表的对应关系中找到所述第二汉字,将所述第二汉字作为用户要输入的汉字。

【技术特征摘要】

【专利技术属性】
技术研发人员:潘世雷
申请(专利权)人:上海欧姆龙计算机有限公司
类型:发明
国别省市:31[中国|上海]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1