一种输入纠错方法和装置、一种用于输入纠错的装置制造方法及图纸

技术编号:17733619 阅读:32 留言:0更新日期:2018-04-18 11:13
本发明专利技术实施例提供了一种输入纠错方法和装置、一种用于输入纠错的装置,其中的方法具体包括:获取输入过程中的输入串;对所述输入串进行纠错处理,以得到所述输入串对应的纠错候选;依据所述输入串对应的纠错候选和上下文,在用户多元词库中进行查找,以得到对应的查找结果;所述用户多元词库用于记录用户输入过的多元词组;依据所述查找结果,对所述输入串对应的纠错候选进行排序;向用户展现排序后的纠错候选。本发明专利技术实施例可以向符合提供符合个性化输入习惯的纠错候选,因此能够提高纠错候选的质量,同时提高纠错的准确率。

A device for input and error correction, a device for input error correction

The embodiment of the invention, an input error correction method and device, a device for correcting input is provided, the method includes: obtaining input in the input string; string correction is performed on the input, the input error correction candidate string corresponding to obtain the candidate; according to the error and the context the input string corresponding to the search in multi user thesaurus, to obtain the corresponding search results; the multiple user dictionary is used for recording user input over multiple phrases; according to the search result, the input error correction candidate string corresponding to sort the display to the user; correcting the sorted candidate. The embodiment of the invention can conform to the error correction candidate that provides the habit of meeting the personalized input habits, so that it can improve the quality of error correction candidates and improve the accuracy of error correction.

【技术实现步骤摘要】
一种输入纠错方法和装置、一种用于输入纠错的装置
本专利技术涉及计算机信息输入
,特别是涉及一种输入纠错方法和装置、一种用于输入纠错的装置。
技术介绍
目前,涉及交互的设备,通常需要用户通过输入法系统将自己的操作意图与设备交互识别。例如,用户可以通过键盘键入输入串,然后由输入法系统依据其预置的标准映射规则将该输入串转换为相应语言的候选项并展示,进而将用户选择的候选项上屏。在实际应用中,用户很有可能因为按错键(PC上)或者点错屏幕位置(智能终端上)等原因而导致键入错误的输入串。输入纠错,正是针对上述错误的一种输入法系统解决方案,它能够主动识别用户的输入错误,并将错误的输入串纠正成正确的输入串,使用户在不需要修改输入串的前提下就能够输入正确的文字。现有的输入纠错方案具体可以包括:基于编辑距离的纠错方案和基于统计的纠错方案;其中,基于编辑距离的纠错方案可以对输入串的每个位置进行如下纠错尝试:插入一个字符、删除一个字符、替换一个字符等,以产生该输入串对应的纠错候选;基于统计的纠错方案可以通过大数据挖掘生成纠错模型,该纠错模型可用于学习纠错候选被错输为输入串的概率。专利技术人在实施例本专利技术的过程中发现,上述基于编辑距离的纠错方案和基于统计的纠错方案往往针对不同用户提供相同的纠错候选,并没有能力实现个性化的纠错,因此容易影响纠错的准确率。
技术实现思路
鉴于上述问题,本专利技术实施例提出了一种克服上述问题或者至少部分地解决上述问题的输入纠错方法、输入纠错装置及用于输入纠错的装置,本专利技术实施例可以向符合提供符合个性化输入习惯的纠错候选,因此能够提高纠错候选的质量,同时提高纠错的准确率。为了解决上述问题,本专利技术公开了一种输入纠错方法,包括:获取输入过程中的输入串;对所述输入串进行纠错处理,以得到所述输入串对应的纠错候选;依据所述输入串对应的纠错候选和上下文,在用户多元词库中进行查找,以得到对应的查找结果;所述用户多元词库用于记录用户输入过的多元词组;依据所述查找结果,对所述输入串对应的纠错候选进行排序;向用户展现排序后的纠错候选。可选地,所述在用户多元词库中查找的查找结果包括:命中的纠错候选、或者未命中的纠错候选,则所述依据所述查找结果,对所述输入串对应的纠错候选进行排序的步骤,包括:依据所述查找结果,确定所述纠错候选的第二得分;其中,命中的纠错候选的第二得分大于零,未命中的纠错候选的第二得分为零;将所述纠错候选的第二得分与所述纠错候选的第一得分进行相加处理,以得到第三得分;其中,所述第一得分依据所述纠错候选的属性特征得到;依据所述第三得分对所述输入串对应的纠错候选进行排序。可选地,所述在用户多元词库中查找的查找结果包括:命中的纠错候选、或者未命中的纠错候选,则所述依据所述查找结果,对所述输入串对应的纠错候选进行排序的步骤,包括:依据所述查找结果,确定所述纠错候选的第四得分;其中,命中的纠错候选的第四得分大于1,未命中的纠错候选的第四得分小于1;将所述纠错候选的第四得分与所述纠错候选的第一得分进行相乘处理,以得到第五得分;其中,所述第一得分依据所述纠错候选的属性特征得到;依据所述第五得分对所述输入串对应的纠错候选进行排序。可选地,所述方法还包括:将预设值分别作为所述纠错候选对应的第二得分和/或第四得分;或者依据所述用户多元词库中记录的多元词组的属性特征,确定所述纠错候选对应的第二得分和/或第四得分。可选地,所述用户多元词组的属性特征包括如下特征中的至少一种:输入次数、历史输入时间和历史输入环境信息,则所述依据用户多元词库中记录的多元词组的属性特征,确定所述纠错候选对应的第二得分和/或第四得分的步骤,包括:依据所述输入次数、所述历史输入时间与当前时间的差值、以及所述历史输入环境信息与当前输入环境信息之间的匹配度中的至少一种,确定所述纠错候选对应的第二得分和/或第四得分。可选地,所述纠错候选的属性特征包括如下特征中的至少一种:所述纠错候选对应纠错串与所述输入串之间的编辑距离、所述纠错候选所对应词库的类型和所述纠错候选的词频。可选地,当所述在用户多元词库中查找的查找结果包括:多个命中的纠错候选时,所述方法还包括:依据所述用户多元词库中记录的多元词组的属性特征,对多个命中的纠错候选进行排序;依据所述多个命中的纠错候选的排序结果,展现对应的纠错候选。可选地,在所述对所述输入串进行纠错处理的步骤之前,所述方法还包括:依据所述输入串对应的普通候选和上下文,在用户多元词库中进行查找;当所述输入串对应的普通候选和上下文命中所述用户多元词库时,不执行所述对所述输入串进行纠错处理的步骤。可选地,通过如下步骤建立所述用户多元词库:记录用户的上屏内容;从一次上屏内容或者连续的多次上屏内容中选择用户多元词组;将所述用户多元词组及其对应的属性特征保存至用户多元词库。可选地,所述从一次上屏内容或者连续的多次上屏内容中选择用户多元词组的步骤,包括:从一次上屏内容或者连续的多次上屏内容中选择相邻的词组,作为用户多元词组;或者从一次上屏内容或者连续的多次上屏内容中选择符合预置搭配条件的词组,作为用户多元词组。另一方面,本专利技术公开了一种输入纠错装置,包括:输入串获取模块,用于获取输入过程中的输入串;输入串纠错模块,用于对所述输入串进行纠错处理,以得到所述输入串对应的纠错候选;多元词库查找模块,用于依据所述输入串对应的纠错候选和上下文,在用户多元词库中进行查找,以得到对应的查找结果;所述用户多元词库记录有用户输入过的多元词组;纠错候选排序模块,用于依据所述查找结果,对所述输入串对应的纠错候选进行排序;以及纠错候选展现模块,用于向用户展现排序后的纠错候选。可选地,所述在用户多元词库中查找的查找结果包括:命中的纠错候选、或者未命中的纠错候选,则所述纠错候选排序模块包括:第二得分确定子模块,用于依据所述查找结果,确定所述纠错候选的第二得分;其中,命中的纠错候选的第二得分大于零,未命中的纠错候选的第二得分为零;相加处理子模块,用于将所述纠错候选的第二得分与所述纠错候选的第一得分进行相加处理,以得到第三得分;其中,所述第一得分依据所述纠错候选的属性特征得到;第一排序子模块,用于依据所述第三得分对所述输入串对应的纠错候选进行排序。可选地,所述在用户多元词库中查找的查找结果包括:命中的纠错候选、或者未命中的纠错候选,则所述纠错候选排序模块包括:第四得分确定子模块,用于依据所述查找结果,确定所述纠错候选的第四得分;其中,命中的纠错候选的第四得分大于1,未命中的纠错候选的第四得分小于1;相乘处理子模块,用于将所述纠错候选的第四得分与所述纠错候选的第一得分进行相乘处理,以得到第五得分;其中,所述第一得分依据所述纠错候选的属性特征得到;第一排序子模块,用于依据所述第五得分对所述输入串对应的纠错候选进行排序。可选地,所述装置还包括:得分预设模块,用于将预设值分别作为所述纠错候选对应的第二得分和/或第四得分;或者得分确定模块,用于依据所述用户多元词库中记录的多元词组的属性特征,确定所述纠错候选对应的第二得分和/或第四得分。可选地,所述多元词组的属性特征包括如下特征中的至少一种:输入次数、历史输入时间和历史输入环境信息,则所述得分确定模块包括:匹配计算子模块,用于依据所述输入次数、所本文档来自技高网...
一种输入纠错方法和装置、一种用于输入纠错的装置

【技术保护点】
一种输入纠错方法,其特征在于,包括:获取输入过程中的输入串;对所述输入串进行纠错处理,以得到所述输入串对应的纠错候选;依据所述输入串对应的纠错候选和上下文,在用户多元词库中进行查找,以得到对应的查找结果;所述用户多元词库用于记录用户输入过的多元词组;依据所述查找结果,对所述输入串对应的纠错候选进行排序;向用户展现排序后的纠错候选。

【技术特征摘要】
1.一种输入纠错方法,其特征在于,包括:获取输入过程中的输入串;对所述输入串进行纠错处理,以得到所述输入串对应的纠错候选;依据所述输入串对应的纠错候选和上下文,在用户多元词库中进行查找,以得到对应的查找结果;所述用户多元词库用于记录用户输入过的多元词组;依据所述查找结果,对所述输入串对应的纠错候选进行排序;向用户展现排序后的纠错候选。2.根据权利要求1所述的方法,其特征在于,所述在用户多元词库中查找的查找结果包括:命中的纠错候选、或者未命中的纠错候选,则所述依据所述查找结果,对所述输入串对应的纠错候选进行排序的步骤,包括:依据所述查找结果,确定所述纠错候选的第二得分;其中,命中的纠错候选的第二得分大于零,未命中的纠错候选的第二得分为零;将所述纠错候选的第二得分与所述纠错候选的第一得分进行相加处理,以得到第三得分;其中,所述第一得分依据所述纠错候选的属性特征得到;依据所述第三得分对所述输入串对应的纠错候选进行排序。3.根据权利要求1所述的方法,其特征在于,所述在用户多元词库中查找的查找结果包括:命中的纠错候选、或者未命中的纠错候选,则所述依据所述查找结果,对所述输入串对应的纠错候选进行排序的步骤,包括:依据所述查找结果,确定所述纠错候选的第四得分;其中,命中的纠错候选的第四得分大于1,未命中的纠错候选的第四得分小于1;将所述纠错候选的第四得分与所述纠错候选的第一得分进行相乘处理,以得到第五得分;其中,所述第一得分依据所述纠错候选的属性特征得到;依据所述第五得分对所述输入串对应的纠错候选进行排序。4.根据权利要求2或3所述的方法,其特征在于,所述方法还包括:将预设值分别作为所述纠错候选对应的第二得分和/或第四得分;或者依据所述用户多元词库中记录的多元词组的属性特征,确定所述纠错候选对应的第二得分和/或第四得分。5.根据权利要求4所述的方法,其特征在于,所述用户多元词组的属性特征包括如下特征中的至少一种:输入次数、历史输入时间和历史输入环境信息,则所述依据用户多元词库中记录的多元词组的属性特征,确定所述纠错候选对应的第二得分和/或第四得分的步骤,包括:依据所述输入次数、所述历史输入时间与当前时间的差值、以及所述历史输入环境信息与当前输入环境信息之间的匹配度中的至少一种,确定所述纠错候选对应的第二得分和/或第四得分。6.根据权利要求2所述的方法,其特征在于,所述纠错候选的属性特征包括如下特征中的至少一种:所述纠错候选对应纠错串与所述输...

【专利技术属性】
技术研发人员:费腾
申请(专利权)人:北京搜狗科技发展有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1