The embodiment of the invention, an input error correction method and device, a device for correcting input is provided, the method includes: obtaining input in the input string; string correction is performed on the input, the input error correction candidate string corresponding to obtain the candidate; according to the error and the context the input string corresponding to the search in multi user thesaurus, to obtain the corresponding search results; the multiple user dictionary is used for recording user input over multiple phrases; according to the search result, the input error correction candidate string corresponding to sort the display to the user; correcting the sorted candidate. The embodiment of the invention can conform to the error correction candidate that provides the habit of meeting the personalized input habits, so that it can improve the quality of error correction candidates and improve the accuracy of error correction.
【技术实现步骤摘要】
一种输入纠错方法和装置、一种用于输入纠错的装置
本专利技术涉及计算机信息输入
,特别是涉及一种输入纠错方法和装置、一种用于输入纠错的装置。
技术介绍
目前,涉及交互的设备,通常需要用户通过输入法系统将自己的操作意图与设备交互识别。例如,用户可以通过键盘键入输入串,然后由输入法系统依据其预置的标准映射规则将该输入串转换为相应语言的候选项并展示,进而将用户选择的候选项上屏。在实际应用中,用户很有可能因为按错键(PC上)或者点错屏幕位置(智能终端上)等原因而导致键入错误的输入串。输入纠错,正是针对上述错误的一种输入法系统解决方案,它能够主动识别用户的输入错误,并将错误的输入串纠正成正确的输入串,使用户在不需要修改输入串的前提下就能够输入正确的文字。现有的输入纠错方案具体可以包括:基于编辑距离的纠错方案和基于统计的纠错方案;其中,基于编辑距离的纠错方案可以对输入串的每个位置进行如下纠错尝试:插入一个字符、删除一个字符、替换一个字符等,以产生该输入串对应的纠错候选;基于统计的纠错方案可以通过大数据挖掘生成纠错模型,该纠错模型可用于学习纠错候选被错输为输入串的概率。专利技术人在实施例本专利技术的过程中发现,上述基于编辑距离的纠错方案和基于统计的纠错方案往往针对不同用户提供相同的纠错候选,并没有能力实现个性化的纠错,因此容易影响纠错的准确率。
技术实现思路
鉴于上述问题,本专利技术实施例提出了一种克服上述问题或者至少部分地解决上述问题的输入纠错方法、输入纠错装置及用于输入纠错的装置,本专利技术实施例可以向符合提供符合个性化输入习惯的纠错候选,因此能够提高纠错候选的质量 ...
【技术保护点】
一种输入纠错方法,其特征在于,包括:获取输入过程中的输入串;对所述输入串进行纠错处理,以得到所述输入串对应的纠错候选;依据所述输入串对应的纠错候选和上下文,在用户多元词库中进行查找,以得到对应的查找结果;所述用户多元词库用于记录用户输入过的多元词组;依据所述查找结果,对所述输入串对应的纠错候选进行排序;向用户展现排序后的纠错候选。
【技术特征摘要】
1.一种输入纠错方法,其特征在于,包括:获取输入过程中的输入串;对所述输入串进行纠错处理,以得到所述输入串对应的纠错候选;依据所述输入串对应的纠错候选和上下文,在用户多元词库中进行查找,以得到对应的查找结果;所述用户多元词库用于记录用户输入过的多元词组;依据所述查找结果,对所述输入串对应的纠错候选进行排序;向用户展现排序后的纠错候选。2.根据权利要求1所述的方法,其特征在于,所述在用户多元词库中查找的查找结果包括:命中的纠错候选、或者未命中的纠错候选,则所述依据所述查找结果,对所述输入串对应的纠错候选进行排序的步骤,包括:依据所述查找结果,确定所述纠错候选的第二得分;其中,命中的纠错候选的第二得分大于零,未命中的纠错候选的第二得分为零;将所述纠错候选的第二得分与所述纠错候选的第一得分进行相加处理,以得到第三得分;其中,所述第一得分依据所述纠错候选的属性特征得到;依据所述第三得分对所述输入串对应的纠错候选进行排序。3.根据权利要求1所述的方法,其特征在于,所述在用户多元词库中查找的查找结果包括:命中的纠错候选、或者未命中的纠错候选,则所述依据所述查找结果,对所述输入串对应的纠错候选进行排序的步骤,包括:依据所述查找结果,确定所述纠错候选的第四得分;其中,命中的纠错候选的第四得分大于1,未命中的纠错候选的第四得分小于1;将所述纠错候选的第四得分与所述纠错候选的第一得分进行相乘处理,以得到第五得分;其中,所述第一得分依据所述纠错候选的属性特征得到;依据所述第五得分对所述输入串对应的纠错候选进行排序。4.根据权利要求2或3所述的方法,其特征在于,所述方法还包括:将预设值分别作为所述纠错候选对应的第二得分和/或第四得分;或者依据所述用户多元词库中记录的多元词组的属性特征,确定所述纠错候选对应的第二得分和/或第四得分。5.根据权利要求4所述的方法,其特征在于,所述用户多元词组的属性特征包括如下特征中的至少一种:输入次数、历史输入时间和历史输入环境信息,则所述依据用户多元词库中记录的多元词组的属性特征,确定所述纠错候选对应的第二得分和/或第四得分的步骤,包括:依据所述输入次数、所述历史输入时间与当前时间的差值、以及所述历史输入环境信息与当前输入环境信息之间的匹配度中的至少一种,确定所述纠错候选对应的第二得分和/或第四得分。6.根据权利要求2所述的方法,其特征在于,所述纠错候选的属性特征包括如下特征中的至少一种:所述纠错候选对应纠错串与所述输...
【专利技术属性】
技术研发人员:费腾,
申请(专利权)人:北京搜狗科技发展有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。