当前位置: 首页 > 专利查询>微软公司专利>正文

一种汉字输入方法及其装置制造方法及图纸

技术编号:2883384 阅读:235 留言:0更新日期:2012-04-11 18:40
本发明专利技术涉及一种汉字输入方法及其装置。本发明专利技术提供的汉字输入方法包括:接收用户通过输入装置输入的汉字编码;根据输入的汉字编码,从编码-汉字映射库中查找出相应的汉字集;将所述汉字集显示在显示器上;在显示步骤中,以与一个汉字或汉字串相关的分数值的大小为顺序来显示所述汉字集,其中,所述汉字的分数值为:Score(A#-[1],A#-[2],A#-[3],…,A#-[N])=λ1     uni(Ai)+λ2     Bi(Ai/A#-[i-1])式中:λ1和λ2为加权系数;Uni(A#-[i])为汉字A#-[i]的使用频率;Bi(A#-[i]/A#-[i-1])为汉字A#-[i-1]后出现汉字A#-[i]的概率。本发明专利技术还提供了一种汉字输入装置。(*该技术在2020年保护过期,可自由使用*)

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及一种汉字输入方法及装置,尤其涉及一种适用于利用数字键盘来输入汉字的方法和装置。目前汉字输入技术正朝向面对普通使用者的方向发展,即可以让一般用户不经学习,或者稍加训练即能快速方便地输入汉字。然而,目前的各种汉字输入方法都存在着易学但不易用,或易用但不易学的问题。即,容易掌握的输入方法,一般都输入效率低,例如,五笔画(即利用笔画顺序进行输入的方法)和拼音输入法等,这些方法虽然易学(五笔画只要会写汉字,即可输入,拼音输入法只要会正确发音,即可输入),但输入效率低;而要提高输入效率,则其编码规则必将复杂,造成不易学习。另一方面,随着电子技术的飞速发展,各类电子产品功能不断增加,而体积却不断缩小。例如,目前有些手机(移动电话机)或遥控器都具备了汉字输入功能。但是,由于它们的体积小巧,不可能把标准英文键盘上的所有键都制作在其上,往往只有10个数字键以及一些功能键。因此,其输入汉字的编码方法必会存在这样的问题由于数字键较少,所以一个汉字的码长会较长,造成输入速度减慢。如果缩短码长,则会造成重码率高,同样会使输入速度减慢。因此,本专利技术的目的在于提供一种编码方法简单的汉字输入方法,这种方法能有效地提高汉字的输入效率,融合了易学易用的特点。本专利技术的另一个目的在于提供一种汉字输入装置,该装置利用了上述的汉字输入方法,同样具有易学和易用兼具的特点。本专利技术的汉字输入方法,包括下列步骤接收用户通过输入装置输入的汉字编码;根据输入的汉字编码,从编码-汉字映射库中查找出相应的汉字集;将所述汉字集显示在显示器上;在显示步骤中,以与一个汉字或汉字串相关的分数值的大小为顺序来显示所述汉字集,其中,所述汉字的分数值为Score(A1,A2,A3,...,AN)=λ1Σi=1NUni(Ai)+λ2Σi=2NBi(Ai/Ai-1)]]>式中λ1和λ2为加权系数;Uni(Ai)为汉字Ai的使用频率;Bi(Ai/Ai-1)为汉字Ai-1后出现汉字Ai的概率。本专利技术还提供了利用上述汉字输入方法的汉字输入装置,包含输入装置,用于输入汉字编码,编码-汉字映射库,用于存储编码与汉字的映射关系;查找装置,用于根据所述输入装置输入的汉字编码,从所述编码-汉字映射库中查找得到相应的汉字集;显示装置,用于显示所述汉字集;语言模型库,包含表示一个汉字的使用频率的使用频率库和表示一个汉字与其它汉字的组词概率的组词概率库;显示顺序运算装置,用于运算所述汉字集中每个汉字的分数值,并以所述汉字的分数值的大小为顺序向所述显示装置输出汉字,并在所述显示装置上以该顺序来显示汉字集,其中所述汉字的所述汉字的分数值为Score(A1,A2,A3,...,AN)=λ1Σi=1NUni(Ai)+λ2Σi=2NBi(Ai/Ai-1)]]>式中λ1和λ2为加权系数;Uni(Ai)为汉字Ai的使用频率;Bi(Ai/Ai-1)为汉字Ai-1后出现汉字Ai的概率。本专利技术的其它目的、特征和优点,通过下面结合附图对实施例的描述将变得更加明显。下面结合附图详细描述本专利技术的实施例。图中附图说明图1是本专利技术的汉字输入方法的流程图;图2是本专利技术的汉字输入系统的结构框图;图3是显示装置显示内容的一个例子。参见图1,图1示出了本专利技术的汉字输入方法的流程图。如图1所示,与传统的输入方法相同,首先是利用输入装置输入汉字的编码(S1)。然后,根据输入的汉字编码,从编码-汉字映射库中查找出相应的汉字集(S2)。对于这两步骤,基本上与传统的各类汉字输入方法相同。在步骤S1中采用的汉字编码方法可以利用各种已有的编码方法,例如,全拼音码、简拼音码、五笔画码等。步骤S2中的编码-汉字映射库随着使用不同的编码方式,其内容是不同的。本专利技术所作的改进点是在步骤S3,即在步骤S3,对在步骤S2中所找出的汉字集中的汉字进行排序,然后,在步骤S4,以在步骤S3所排的顺序进行显示汉字集中的汉字。步骤S3对汉字集进行排序的目的是把对应于输入的编码的汉字集中最常使用的(或者说最有可能的)汉字显示在前面,以方便用户选择要输入的汉字,从而减少码长,提高输入效率。步骤S3中对汉字进行排序的原则是以与一汉字相关的分数值的大小为顺序对汉字集中的汉字进行排序,即分数值大的先显示,分数值小的后显示。与汉字相关的分数值的计算方式如下Score(A1,A2,A3,...,AN)=λ1Σi=1NUni(Ai)+λ2Σi=2NBi(Ai/Ai-1)]]>式中λ1和λ2为加权系数;Uni(Ai)为汉字Ai的使用频率;Bi(Ai/Ai-1)为汉字Ai-1后出现汉字Ai的概率。下面以五笔画的汉字编码方法举一些例子来说明本专利技术。但是,应当理解,这只是一个例子,并不构成对本专利技术的限制,本专利技术同样可以采用其它的汉字编码方式。先简要描述一下五笔画的编码方式。所谓五笔画的汉字编码,就是将组成汉字的笔画分类成5种笔画,即分类成横、竖、撇、点、折,然后,用五个数字键来分别表示这五种笔画。其对应关系如下表。 编码时,按汉字的书写顺序进行编码。例如,汉字“北”,利用五笔画的编码方式进行编码,其编码为“21154”。假设,要输入汉字“北”,首先输入其第一个码“2”,表示其第一笔画“竖”。当输入了该码“2”后(步骤S1),在步骤S2,立即从编码-汉字映射集中查找出以该码“2”作为第一码的所有汉字,组成汉字集。即,将所有以“竖”为第一笔画的汉字都找出来,组成汉字集。例如“典”、“上”、“卜”、“旧”、“归”、“北”等等。传统的方式是将这些字以一定的规则进行排序,然后进行显示,例如按汉字的笔画数或者发音进行排序。但是,这种方式排序存在的缺点是,并不能把最常用的字排在前面,先显示出来。在上面的例子中,如按笔画数进行排序,则其显示的先后顺序为“卜”、“上”、“内”、“旧”、“归”、“北”、“典”。如果一屏显示的字数为5个汉字的话,则要输入的汉字“北”则要在第二屏上显示,这样每次输入该字都要翻屏。而该汉字“北”与显示在前的汉字“卜”、“内”、“旧”相比较,在汉语中更常用,使用频率较高。如果,能将使用频率较高的汉字显示在最前面,即按使用频率的高低来显示,则会大大减少翻屏次数。例如,如果在上例中,能按这几个汉字在汉语中的使用频率的高低来显示,则其显示顺序为“上”、“北”、“内”“旧”、“归”、“典”。这样,“北”字就可以在第一屏上显示,用户只要直接选择输入即可。从而降低汉字的输入码长,提高输入效率。上面解释了以汉字的使用频率为依据对汉字进行排序显示的情况。另一方面,还能以该汉字与前一已输入的汉字的组合可能性(或者组合概率)的大小进行排序显示。续上例,如果已输入了汉字“北”,用户要输入的后一汉字的第一个编码为“4”,则在传统的情况下,将从编码-汉字映射集中查找编码以“4”为第一编码的所有汉字组成汉字集,例如查找到的汉字集包括“为”、“亲”、“头”、“永”、“必”、“良”、“心”、“京”等汉字。然后,根据上面所述的本文档来自技高网...

【技术保护点】
一种汉字输入方法,包括下列步骤: 接收用户通过输入装置输入的汉字编码; 根据输入的汉字编码,从编码-汉字映射库中查找出相应的汉字集; 将所述汉字集显示在显示器上; 其特征在于,在显示步骤中,以与一汉字或汉字串相关的分数值的大小为顺序来显示所述汉字集,其中,所述汉字的分数值为: Score(A↓[1],A↓[2],A↓[3],…,A↓[N])=λ1*Uni(A↓[i])+λ2*Bi(A↓[i]/A↓[i-1]) 式中:λ1和λ2为加权系数;Uni(A↓[i])为汉字A↓[i]的使用频率;Bi(A↓[i]/A↓[i-1])为汉字A↓[i-1]后出现汉字A↓[i]的概率。

【技术特征摘要】
【国外来华专利技术】

【专利技术属性】
技术研发人员:唐涤飞李东张湘辉
申请(专利权)人:微软公司
类型:发明
国别省市:US[美国]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1