一种输入纠错方法和装置制造方法及图纸

技术编号:21570531 阅读:35 留言:0更新日期:2019-07-10 15:10
本申请实施例公开了一种输入纠错方法和装置,该方法包括:获取用户输入的、尚未提交到交互会话中的输入字符串;从所述交互会话中已上屏的字符串中确定出对应所述输入字符串的目标字符串;根据所述目标字符串确定所述输入字符串中是否具有错误字符串;若具有,根据所述目标字符串确定出针对所述错误字符串的纠错候选项。这种根据交互上文确定交互下文中输入错误的方式,可以在输入字符串整体语义通顺的情况下,依然能够找出可能与交互上文无关的输入错误并提供纠错候选项,不仅提高了输入纠错的适用范围,还提高了用户的输入体验。

A Method and Device for Input Error Correction

【技术实现步骤摘要】
一种输入纠错方法和装置
本申请涉及输入法领域,特别是涉及一种输入纠错方法和装置。
技术介绍
在通过输入法输入字符时,输入法可以针对用户输入字符进行纠错,在纠错时,可以根据输入内容的语句中字符间的语义关系、关联程度等判断是否有输错的字符,从而可以针对有可能输出的字符提供纠错候选项以帮助用户纠错。这种传统的纠错方式虽然可以使得输入语句变得通顺,但是,并不适用于所有输入场景。一种常见的输入场景是交互类型的输入场景,例如在线聊天、论坛跟帖、留言等。这种交互类型的输入场景中用户会与其他用户进行交流、讨论、问答等,也就是说,用户输入的内容可能与所在输入场景中已经出现的内容相关。在这类输入场景中,虽然有可能用户输入的内容在语义上没有问题,但是依然属于输入错误,例如图1所示的社交软件聊天界面中,用户a和用户b在进行交互,用户a发送的信息为“你想我了吗?”,用户b的输入内容是“我不像你”,若采用上述传统纠错方式,用户b所输入的内容并无问题,是不会向用户b提示纠错候选项的,但是若结合已输入上文,即用户a发送的“你想我了吗?”,显然用户b作为交互性的回复,实际应该输入“我不想你”,而不是输入与上文毫无关系的“我不像你”,可见,用户b在输入时,将“想”错输入为“像”,但是通过前述传统纠错方式并不能发现这一输错行为。
技术实现思路
为了解决上述技术问题,本申请提供了一种输入纠错方法和装置,能够在输入字符串整体语义通顺的情况下,依然可以找出与交互上文无关的输入错误并提供纠错候选项,从而提高输入纠错的适用范围和用户的输入体验。本申请实施例公开了如下技术方案:第一方面,本申请实施例提供了一种输入纠错方法,所述方法包括:获取用户输入的、尚未提交到交互会话中的输入字符串;从所述交互会话中已上屏的字符串中确定出对应所述输入字符串的目标字符串;根据所述目标字符串确定所述输入字符串中是否具有错误字符串;若具有,根据所述目标字符串确定出针对所述错误字符串的纠错候选项。可选的,所述目标字符串为以下任意一种或多种的组合:所述交互会话中上屏时间距所述输入字符串的输入时间较近的已上屏的字符串中的一个;所述交互会话中尚未被回复的已上屏的字符串;所述交互会话中语义通顺的已上屏的字符串。可选的,所述根据所述目标字符串确定所述输入字符串中是否具有错误字符串,包括:判断所述输入字符串与所述目标字符串间的语义相关性;若所述语义相关性低于预设条件,确定所述输入字符串中具有错误字符串。可选的,在所述确定所述输入字符串中具有错误字符串之后,所述方法还包括:若得到所述输入字符串所输入编码中的子输入编码与所述目标字符串对应编码中的子编码符合编码相似条件,将所述子输入编码对应的字符确定为所述错误字符串;或者,若所述输入字符串的子输入字符与所述目标字符串的子字符符合组成相似条件,将所述子输入字符确定为所述错误字符串。可选的,所述根据所述目标字符串确定出针对所述错误字符串的纠错候选项,包括:根据所述子编码对应的字符确定出所述错误字符串对应的纠错候选项;或者,根据所述子字符确定出所述错误字符串对应的纠错候选项。可选的,所述根据所述子编码对应的字符确定出所述错误字符串对应的纠错候选项,包括:确定将所述错误字符串替换为待定字符的输入字符串的语言模型得分,所述待定字符为所述子编码对应的字符;确定所述待定字符与所述目标字符串的相关概率;若所述语言模型得分和所述相关概率确定所述待定字符满足纠错条件,将所述待定字符确定为所述纠错候选项;或者,所述根据所述子字符确定出所述错误字符串对应的纠错候选项,包括:确定将所述错误字符串替换为待定字符的输入字符串的语言模型得分,所述待定字符为所述子字符;确定所述待定字符与所述目标字符串的相关概率;若所述语言模型得分和所述相关概率确定所述待定字符满足纠错条件,将所述待定字符确定为所述纠错候选项。可选的,所述根据所述目标字符串确定所述输入字符串中是否具有错误字符串,包括确定所述目标字符串对应的智能回复内容;若所述输入字符串与所述智能回复内容的相似度符合回复相似条件,确定所述输入字符串中具有错误字符串。可选的,在所述确定所述输入字符串中具有错误字符串之后,所述方法还包括:若得到所述输入字符串所输入编码中的子输入编码与所述智能回复内容对应编码中的子编码符合编码相似条件,将所述子输入编码对应的字符确定为所述错误字符串;或者,若所述输入字符串的子输入字符与所述智能回复内容的子字符符合组成相似条件,将所述子输入字符确定为所述错误字符串。可选的,所述根据所述目标字符串确定出针对所述错误字符串的纠错候选项,包括:根据所述子编码对应的字符确定出所述错误字符串对应的纠错候选项;或者,根据所述子字符确定出所述错误字符串对应的纠错候选项。第二方面,本申请实施例提供了一种输入纠错装置,所述方法包括:输入字符串获取单元,用于获取用户输入的、尚未提交到交互会话中的输入字符串;目标字符串确定单元,用于从所述交互会话中已上屏的字符串中确定出对应所述输入字符串的目标字符串;错误字符串确定单元,用于根据所述目标字符串确定所述输入字符串中是否具有错误字符串;纠错候选项确定单元,用于当所述输入字符串中具有错误字符串时,根据所述目标字符串确定出针对所述错误字符串的纠错候选项。可选的,所述目标字符串为以下任意一种或多种的组合:所述交互会话中上屏时间距所述输入字符串的输入时间较近的已上屏的字符串中的一个;所述交互会话中尚未被回复的已上屏的字符串;所述交互会话中语义通顺的已上屏的字符串。可选的,所述错误字符串确定单元,包括:语义相关性判断子单元,用于判断所述输入字符串与所述目标字符串间的语义相关性;第一错误字符串确定子单元,用于若所述语义相关性低于预设条件,确定所述输入字符串中具有错误字符串。可选的,所述装置还包括:第一错误字符串确定单元,用于若得到所述输入字符串所输入编码中的子输入编码与所述目标字符串对应编码中的子编码符合编码相似条件,将所述子输入编码对应的字符确定为所述错误字符串;或者,第二错误字符串确定单元,用于若所述输入字符串的子输入字符与所述目标字符串的子字符符合组成相似条件,将所述子输入字符确定为所述错误字符串。可选的,所述纠错候选项确定单元,包括:第一纠错候选项确定子单元,用于根据所述子编码对应的字符确定出所述错误字符串对应的纠错候选项;或者,第二纠错候选项确定子单元,用于根据所述子字符确定出所述错误字符串对应的纠错候选项。可选的,所述第一纠错候选项确定子单元,包括:第一语言模型得分确定子模块,用于确定将所述错误字符串替换为待定字符的输入字符串的语言模型得分,所述待定字符为所述子编码对应的字符;第一相关概率确定子模块,用于确定所述待定字符与所述目标字符串的相关概率;第一纠错候选项确定子模块,用于若所述语言模型得分和所述相关概率确定所述待定字符满足纠错条件,将所述待定字符确定为所述纠错候选项;或者,所述第二纠错候选项确定子单元,包括:第二语言模型得分确定子模块,用于确定将所述错误字符串替换为待定字符的输入字符串的语言模型得分,所述待定字符为所述子字符;第二相关概率确定子模块,用于确定所述待定字符与所述目标字符串的相关概率;第二纠错候选项确定子模块,用于若所述语言模型得分和所述相关概率确定本文档来自技高网...

【技术保护点】
1.一种输入纠错方法,其特征在于,所述方法包括:获取用户输入的、尚未提交到交互会话中的输入字符串;从所述交互会话中已上屏的字符串中确定出对应所述输入字符串的目标字符串;根据所述目标字符串确定所述输入字符串中是否具有错误字符串;若具有,根据所述目标字符串确定出针对所述错误字符串的纠错候选项。

【技术特征摘要】
1.一种输入纠错方法,其特征在于,所述方法包括:获取用户输入的、尚未提交到交互会话中的输入字符串;从所述交互会话中已上屏的字符串中确定出对应所述输入字符串的目标字符串;根据所述目标字符串确定所述输入字符串中是否具有错误字符串;若具有,根据所述目标字符串确定出针对所述错误字符串的纠错候选项。2.根据权利要求1所述的方法,其特征在于,所述目标字符串为以下任意一种或多种的组合:所述交互会话中上屏时间距所述输入字符串的输入时间较近的已上屏的字符串中的一个;所述交互会话中尚未被回复的已上屏的字符串;所述交互会话中语义通顺的已上屏的字符串。3.根据权利要求1所述的方法,其特征在于,所述根据所述目标字符串确定所述输入字符串中是否具有错误字符串,包括:判断所述输入字符串与所述目标字符串间的语义相关性;若所述语义相关性低于预设条件,确定所述输入字符串中具有错误字符串。4.根据权利要求3所述的方法,其特征在于,在所述确定所述输入字符串中具有错误字符串之后,所述方法还包括:若得到所述输入字符串所输入编码中的子输入编码与所述目标字符串对应编码中的子编码符合编码相似条件,将所述子输入编码对应的字符确定为所述错误字符串;或者,若所述输入字符串的子输入字符与所述目标字符串的子字符符合组成相似条件,将所述子输入字符确定为所述错误字符串。5.根据权利要求4所述的方法,其特征在于,所述根据所述目标字符串确定出针对所述错误字符串的纠错候选项,包括:根据所述子编码对应的字符确定出所述错误字符串对应的纠错候选项;或者,根据所述子字符确定出所述错误字符串对应的纠错候选项。6.根据权利要求5所述的方法,其特征在于,所述根据所述子编码对应的字符确定出所述错误字符串对应的纠错候选项,包括:确定将所述错误字符串替换为待定字符的输入字符串的语言模型得分,所述待定字符为所述子编码对应的字符;确定所述待定字符与所述目标字符串的相关概率;若所述语言模型得分和所述相关概率确定所述待定字符满足纠错条件,将所述待定字符确定为所述纠错候选项;或者,所述根据所述子字符确定出所述错误字符串对应的纠错候选项,包括:确定将所述错误字符串替换为待定字符的输入字符串的语言模型得分,所述待定字符为所述子字符;确定所述待定字符与所述目标字符串的相关概率;若所述语言模型得分和所述...

【专利技术属性】
技术研发人员:陈小帅臧娇娇
申请(专利权)人:北京搜狗科技发展有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1