用于语音对话的纠正方法及系统技术方案

技术编号:25273962 阅读:23 留言:0更新日期:2020-08-14 23:06
本发明专利技术实施例提供一种用于语音对话的纠正方法。该方法包括:识别用户输入的对话语音的第一文本信息,其中,第一文本信息包括:由多个候选词确定的第一语义关键字;基于第一文本信息向用户反馈带有第一语义关键字的第一结果;响应于用户对第一结果内第一语义关键字的选择,将多个候选词向用户反馈;接收用户输入的第二语义关键字,基于第二语义关键字对第一文本信息进行纠正,确定纠正后的第二文本信息,基于第二文本信息向用户反馈带有第二语义关键字的第二结果。本发明专利技术实施例还提供一种用于语音对话的纠正系统。本发明专利技术实施例能够解决客观存在的真歧义问题,同时也提升了对话系统的对应错误的容忍与处理能力。

【技术实现步骤摘要】
用于语音对话的纠正方法及系统
本专利技术涉及智能语音领域,尤其涉及一种用于语音对话的纠正方法及系统。
技术介绍
随着智能语音的发展,用户与智能设备的沟通更加便捷,智能设备对用户输入的语音进行语义理解以及识别,从而获取用户的意图,进而向用户反馈相应的操作。如果识别错误时,用户通常可以对其进行纠正,例如:用户语音的识别结果:打电话给林永凯。聊天机器人回复:为你找到林永凯的电话是否拔打。用户语音的识别结果:是楷模的楷。聊天机器人回复:为你找到林永楷的电话是否拔打。又如:用户语音的识别结果:导航去精英公寓。聊天机器人回复:抱歉没有找到精英公寓。用户语音的识别结果:是草字头的菁英。聊天机器人回复:即将为您导航到菁英公寓。又如:用户语音的识别结果:我要去西藏。聊天机器人回复:即将为您导航到西藏。用户语音的识别结果:是站台的站。聊天机器人回复:好的,即将为您导航到西站。在实现本专利技术过程中,专利技术人发现相关技术中至少存在如下问题:通过语音主动纠正上一轮或前几轮的说法,在使用纠正时通常需要描述清楚错误的文字,以及需要纠正后的文字,当文本比较长时,或者文本有重复时容易导致用户的表述比较困难。比如:“我想买一张从北京西站去西藏的票”当出现识别错误时可能会变成,“我想买一张从北京新站去西站的票”,当用户想要纠正时需要说“不是北京新站是北京西站,而且也不是西站是西藏自治区的西藏”一则说法比较复杂,另外也可能无法处理纠正说法本身带来的识别错误,比如上句纠正的说法仍然可能会被误识别为“不是北京新站是北京西站,而且也不是新站是西藏自治区的西藏”。或者是由于语言模型的原因,在上述对话中,即使用户再度重复n次“xierqi”,也仍然会被识别成“西二奇”而不是“西二旗”。受限于语音识别的本身的误识别,进行纠正时的说法识别结果也仍然是错误的。进行语音纠正时,虽然用户发音正确,但是用户想要输入的词语刚好仍然不是置信度最高的那个词,仍然会被识别成其他词语。在识别内容比较长时,容易出现多个发音相似的词语,又或者当多个语义槽识别的内容发音比较接近时,将导致不容易准确地确定需要进行纠正的词语的位置。
技术实现思路
为了至少解决现有技术中由于语言模型的原因,使得识别错误或识别出其他词语,对内容比较长的句子,或发音比较接近的句子,确定需要纠正词语的位置不容易确定的问题。第一方面,本专利技术实施例提供一种用于语音对话的纠正方法,包括:识别用户输入的对话语音的第一文本信息,其中,所述第一文本信息包括:由多个候选词确定的第一语义关键字;基于所述第一文本信息向所述用户反馈带有所述第一语义关键字的第一结果;响应于所述用户对所述第一结果内第一语义关键字的选择,将所述多个候选词向所述用户反馈;接收所述用户输入的第二语义关键字,基于所述第二语义关键字对所述第一文本信息进行纠正,确定纠正后的第二文本信息,基于所述第二文本信息向所述用户反馈带有所述第二语义关键字的第二结果。第二方面,本专利技术实施例提供一种用于语音对话的纠正系统,包括:语音识别程序模块,用于识别用户输入的对话语音的第一文本信息,其中,所述第一文本信息包括:由多个候选词确定的第一语义关键字;结果反馈程序模块,用于基于所述第一文本信息向所述用户反馈带有所述第一语义关键字的第一结果;候选词反馈程序模块,用于响应于所述用户对所述第一结果内第一语义关键字的选择,将所述多个候选词向所述用户反馈;纠正程序模块,用于接收所述用户输入的第二语义关键字,基于所述第二语义关键字对所述第一文本信息进行纠正,确定纠正后的第二文本信息,基于所述第二文本信息向所述用户反馈带有所述第二语义关键字的第二结果。第三方面,提供一种电子设备,其包括:至少一个处理器,以及与所述至少一个处理器通信连接的存储器,其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行本专利技术任一实施例的用于语音对话的纠正方法的步骤。第四方面,本专利技术实施例提供一种存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现本专利技术任一实施例的用于语音对话的纠正方法的步骤。本专利技术实施例的有益效果在于:在对话系统中引入本方法的主动纠错功能后将能提高对话系统的实用性,并且能够解决客观存在的真歧义问题(在人与人的对话中同样存在),同时也提升了对话系统的对应错误的容忍与处理能力,有助于对话系统在智能语音产品上,尤其是带屏设备,为用户提供更加优异的用户体验。对语音识别输入法中,尤其在智能终端上,识别错误的问题一直是不可避免的。当前市场主流的产品并没有对纠错提供用户体验良好的设计,只能使用光标定位到特定位置后手动删除内容再使用文本输入法编写出正确的文本。可以遇见当语音输入法引入了基于多模态的主动纠错后,在进行纠错时就能够基于上下文直接点击或者选中词语,接着从系统反馈的高置信度的候选词中选择对应正确的词语,可以避免每次纠错都需要使用键盘进行修改,这将极大的提升语音输入法的性能瓶颈与用户体验。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1是本专利技术一实施例提供的一种用于语音对话的纠正方法的流程图;图2是本专利技术一实施例提供的一种用于语音对话的纠正方法的软件实现流程图;图3是本专利技术一实施例提供的一种用于语音对话的纠正系统的结构示意图。具体实施方式为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。如图1所示为本专利技术一实施例提供的一种用于语音对话的纠正方法的流程图,包括如下步骤:S11:识别用户输入的对话语音的第一文本信息,其中,所述第一文本信息包括:由多个候选词确定的第一语义关键字;S12:基于所述第一文本信息向所述用户反馈带有所述第一语义关键字的第一结果;S13:响应于所述用户对所述第一结果内第一语义关键字的选择,将所述多个候选词向所述用户反馈;S14:接收所述用户输入的第二语义关键字,基于所述第二语义关键字对所述第一文本信息进行纠正,确定纠正后的第二文本信息,基于所述第二文本信息向所述用户反馈带有所述第二语义关键字的第二结果。在本实施方式中,在对话系统开发过程中,工程师更多的是面对单轮对话,在单轮对话中,普遍本文档来自技高网
...

【技术保护点】
1.一种用于语音对话的纠正方法,包括:/n识别用户输入的对话语音的第一文本信息,其中,所述第一文本信息包括:由多个候选词确定的第一语义关键字;/n基于所述第一文本信息向所述用户反馈带有所述第一语义关键字的第一结果;/n响应于所述用户对所述第一结果内第一语义关键字的选择,将所述多个候选词向所述用户反馈;/n接收所述用户输入的第二语义关键字,基于所述第二语义关键字对所述第一文本信息进行纠正,确定纠正后的第二文本信息,基于所述第二文本信息向所述用户反馈带有所述第二语义关键字的第二结果。/n

【技术特征摘要】
1.一种用于语音对话的纠正方法,包括:
识别用户输入的对话语音的第一文本信息,其中,所述第一文本信息包括:由多个候选词确定的第一语义关键字;
基于所述第一文本信息向所述用户反馈带有所述第一语义关键字的第一结果;
响应于所述用户对所述第一结果内第一语义关键字的选择,将所述多个候选词向所述用户反馈;
接收所述用户输入的第二语义关键字,基于所述第二语义关键字对所述第一文本信息进行纠正,确定纠正后的第二文本信息,基于所述第二文本信息向所述用户反馈带有所述第二语义关键字的第二结果。


2.根据权利要求1所述的方法,其中,所述由多个候选词中确定的第一语义关键字包括:
从所述多个候选词中选取识别置信度最高的候选词确定为第一语义关键字;
所述将所述多个候选词向所述用户反馈包括:
将所述多个候选词按照识别置信度排序,向所述用户反馈所述多个候选词的列表窗口。


3.根据权利要求1所述的方法,其中,所述接收所述用户输入的第二语义关键字包括:
当所述用户从所述多个候选词中选择词语时,将所选词语确定为所述第二语义关键字;
当所述用户输入纠正对话语音时,识别所述纠正对话语音,根据识别结果确定所述第二语义关键字;
当所述用户输入纠正文本时,根据所述纠正文本确定所述第二语义关键字。


4.根据权利要求3所述的方法,其中,所述接收所述用户输入的第二语义关键字还包括:
当所述用户输入图像信息时,识别所述图像信息内的纠正文本,根据所述纠正文本确定所述第二语义关键字。


5.根据权利要求1所述的方法,其中,所述方法还包括:
记录每一轮向所述用户反馈带有语义关键字的多轮结果;
响应于所述用户对任一轮结果内语义关键字的选择,将与所述语义关键字对应的多个候选词向所述用户反馈。


6.根据权利要求1所述的方法,其中,所述基于所述第一文本信息向所述用户反馈带有所述第一语...

【专利技术属性】
技术研发人员:林永楷樊帅
申请(专利权)人:苏州思必驰信息科技有限公司
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1