语音交互处理方法、装置、计算机设备及存储介质制造方法及图纸

技术编号:20122469 阅读:35 留言:0更新日期:2019-01-16 12:53
本发明专利技术公开了语音交互处理方法、装置、计算机设备及存储介质,其中方法包括:当智能语音设备处于正常工作状态时,获取来自用户的对话语音;提取获取到的对话语音的声纹信息;根据提取出的声纹信息确定对话语音是否为噪音;若不为噪音,则对对话语音进行应答处理。应用本发明专利技术所述方案,能够提高语音交互的准确性等。

Voice Interactive Processing, Devices, Computer Equipment and Storage Media

The invention discloses a voice interactive processing method, device, computer equipment and storage medium. The methods include: acquiring voice from a user when the intelligent voice device is in normal working state; extracting voiceprint information of the acquired voice; determining whether the voice of a conversation is noise according to the extracted voiceprint information; and entering the voice of a conversation if it is not noise. Line response processing. The scheme of the invention can improve the accuracy of voice interaction, etc.

【技术实现步骤摘要】
语音交互处理方法、装置、计算机设备及存储介质
本专利技术涉及计算机应用技术,特别涉及语音交互处理方法、装置、计算机设备及存储介质。
技术介绍
随着语音识别等技术的不断发展,具备语音交互功能的智能语音设备的应用越来越普及,比如,带有答疑和指导功能的智能机器人不断受到市场热捧。这类智能机器人通常都服务于比较嘈杂的环境,比如,服务于机场这种高流量、高密度环境。这种环境下,智能机器人很容易受到噪音的干扰。图1为现有噪音干扰方式示意图。如图1所示,用户1唤醒智能机器人后,询问智能机器人自己的航班信息,当用户1问完“我的航班在哪值机”后,智能机器人询问用户1的航班号,这时用户2的噪音传来“今天天气怎么样”,智能机器人可能会响应用户2的噪音,回答“今天天气晴...”,从而打断用户1的对话,对于用户1来说给出错误的应答。用户2可能为路过的用户,比如用户2和用户3从用户1旁边路过,用户2和用户3在用较大的声音谈话,用户2询问用户3“今天天气怎么样”,对于用户1来说,“今天天气怎么样”就成了噪音。目前,智能机器人并没有对声源进行筛选,是一种“有问就答”的模式,只要语音(声音)的分贝数达到阵列的收声要求就会进行应答处理。这种模式非常不利于在嘈杂环境下使用,很可能导致上述的应答错误,从而降低了语音交互的准确性。
技术实现思路
有鉴于此,本专利技术提供了语音交互处理方法、装置、计算机设备及存储介质。具体技术方案如下:一种语音交互处理方法,包括:当智能语音设备处于正常工作状态时,获取来自用户的对话语音;提取获取到的对话语音的声纹信息;根据提取出的声纹信息确定所述对话语音是否为噪音;若不为噪音,则对所述对话语音进行应答处理。根据本专利技术一优选实施例,所述根据提取出的声纹信息确定所述对话语音是否为噪音包括:将提取出的声纹信息与获取到的基准声纹信息进行匹配;若匹配成功,则确定所述对话语音不为噪音,若匹配失败,则确定所述对话语音为噪音。根据本专利技术一优选实施例,所述基准声纹信息的获取方式包括:根据来自用户的唤醒语音唤醒所述智能语音设备,使得所述智能语音设备进入所述正常工作状态;提取所述唤醒语音的声纹信息,将所述唤醒语音的声纹信息作为所述基准声纹信息。根据本专利技术一优选实施例,所述基准声纹信息的获取方式包括:根据来自用户的唤醒语音唤醒所述智能语音设备,使得所述智能语音设备进入所述正常工作状态;提取所述唤醒语音的声纹信息;将提取出的所述唤醒语音的声纹信息与提取出的所述智能语音设备被唤醒之后首次获取到的对话语音的声纹信息进行匹配;若匹配成功,则根据两次提取出的声纹信息确定出所述基准声纹信息。根据本专利技术一优选实施例,所述根据两次提取出的声纹信息确定出所述基准声纹信息包括:将所述唤醒语音的声纹信息或所述首次获取到的对话语音的声纹信息作为所述基准声纹信息。一种语音交互处理装置,包括:预处理单元以及应答单元;所述预处理单元,用于当智能语音设备处于正常工作状态时,获取来自用户的对话语音,提取获取到的对话语音的声纹信息,根据提取出的声纹信息确定所述对话语音是否为噪音;所述应答单元,用于当所述预处理单元确定所述对话语音不为噪音时,对所述对话语音进行应答处理。根据本专利技术一优选实施例,所述预处理单元将提取出的声纹信息与获取到的基准声纹信息进行匹配,若匹配成功,则确定所述对话语音不为噪音,若匹配失败,则确定所述对话语音为噪音。根据本专利技术一优选实施例,所述预处理单元进一步用于,根据来自用户的唤醒语音唤醒所述智能语音设备,使得所述智能语音设备进入所述正常工作状态,提取所述唤醒语音的声纹信息,将所述唤醒语音的声纹信息作为所述基准声纹信息。根据本专利技术一优选实施例,所述预处理单元进一步用于,根据来自用户的唤醒语音唤醒所述智能语音设备,使得所述智能语音设备进入所述正常工作状态,提取所述唤醒语音的声纹信息,并将提取出的所述唤醒语音的声纹信息与提取出的所述智能语音设备被唤醒之后首次获取到的对话语音的声纹信息进行匹配,若匹配成功,则根据两次提取出的声纹信息确定出所述基准声纹信息。根据本专利技术一优选实施例,若匹配成功,则所述预处理单元将所述唤醒语音的声纹信息或所述首次获取到的对话语音的声纹信息作为所述基准声纹信息。一种计算机设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述程序时实现如以上所述的方法。一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时实现如以上所述的方法。基于上述介绍可以看出,采用本专利技术所述方案,当智能语音设备处于正常工作状态时,获取来自用户的对话语音,并提取获取到的对话语音的声纹信息,进而根据提取出的声纹信息确定对话语音是否为噪音,当确定不为噪音时,才会进行应答处理,从而排除了噪音干扰,提高了语音交互的准确性等。【附图说明】图1为现有噪音干扰方式示意图。图2为本专利技术所述语音交互处理方法第一实施例的流程图。图3为本专利技术所述语音交互处理方法第二实施例的流程图。图4为本专利技术所述语音交互处理装置实施例的组成结构示意图。图5示出了适于用来实现本专利技术实施方式的示例性计算机系统/服务器12的框图。【具体实施方式】为了使本专利技术的技术方案更加清楚、明白,以下参照附图并举实施例,对本专利技术所述方案进行进一步说明。显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本专利技术保护的范围。图2为本专利技术所述语音交互处理方法第一实施例的流程图。如图2所示,包括以下具体实现方式。在201中,当智能语音设备处于正常工作状态时,获取来自用户的对话语音。在202中,提取获取到的对话语音的声纹信息。在203中,根据提取出的声纹信息确定对话语音是否为噪音。在204中,若不为噪音,则对对话语音进行应答处理。当智能语音设备处于正常工作状态时,获取到的对话语音可能来自于与智能语音设备进行正常交互的用户,也可能来自于噪音用户。本实施例中,在对每次获取到的对话语音进行应答处理之前,可先提取对话语音的声纹信息,并根据提取出的声纹信息确定对话语音是否为噪音,只有当不为噪音时,才会进行应答处理,从而排除了噪音干扰,进而提高了语音交互的准确性等。声纹是指能唯一识别一个人的声音特征,声纹虽然不像人脸、指纹的个体差异那样直观可见,但由于每个人的声道、口腔和鼻腔等具有个体的差异性,反映到声音上也具有差异性。现代科学研究表明,声纹不仅具有特定性,而且有相对稳定性的特点,成年以后,人的声音可保持长期相对稳定不变,实验证明,无论讲话者是故意模仿他人声音和语气,还是耳语轻声讲话,即使模仿得惟妙惟肖,其声纹也会不同。本实施例中,可采用现有的各种声纹提取方式来进行声纹提取,具体方式不作限制。在根据提取出的声纹信息确定对话语音是否为噪音时,可将提取出的声纹信息与获取到的基准声纹信息进行匹配,若匹配成功,则可确定对话语音不为噪音,若匹配失败,则可确定对话语音为噪音。获取基准声纹信息的方式可至少包括以下两种。1)方式一根据来自用户的唤醒语音唤醒智能语音设备,使得智能语音设备进入正常工作状态,提取唤醒语音的声纹信息,将唤醒语音的声纹信息作为基准声纹信息。为节省资源消耗等,智能语音设本文档来自技高网...

【技术保护点】
1.一种语音交互处理方法,其特征在于,包括:当智能语音设备处于正常工作状态时,获取来自用户的对话语音;提取获取到的对话语音的声纹信息;根据提取出的声纹信息确定所述对话语音是否为噪音;若不为噪音,则对所述对话语音进行应答处理。

【技术特征摘要】
1.一种语音交互处理方法,其特征在于,包括:当智能语音设备处于正常工作状态时,获取来自用户的对话语音;提取获取到的对话语音的声纹信息;根据提取出的声纹信息确定所述对话语音是否为噪音;若不为噪音,则对所述对话语音进行应答处理。2.根据权利要求1所述的方法,其特征在于,所述根据提取出的声纹信息确定所述对话语音是否为噪音包括:将提取出的声纹信息与获取到的基准声纹信息进行匹配;若匹配成功,则确定所述对话语音不为噪音,若匹配失败,则确定所述对话语音为噪音。3.根据权利要求2所述的方法,其特征在于,所述基准声纹信息的获取方式包括:根据来自用户的唤醒语音唤醒所述智能语音设备,使得所述智能语音设备进入所述正常工作状态;提取所述唤醒语音的声纹信息,将所述唤醒语音的声纹信息作为所述基准声纹信息。4.根据权利要求2所述的方法,其特征在于,所述基准声纹信息的获取方式包括:根据来自用户的唤醒语音唤醒所述智能语音设备,使得所述智能语音设备进入所述正常工作状态;提取所述唤醒语音的声纹信息;将提取出的所述唤醒语音的声纹信息与提取出的所述智能语音设备被唤醒之后首次获取到的对话语音的声纹信息进行匹配;若匹配成功,则根据两次提取出的声纹信息确定出所述基准声纹信息。5.根据权利要求4所述的方法,其特征在于,所述根据两次提取出的声纹信息确定出所述基准声纹信息包括:将所述唤醒语音的声纹信息或所述首次获取到的对话语音的声纹信息作为所述基准声纹信息。6.一种语音交互处理装置,其特征在于,包括:预处理单元以及应答单元;所述预处理单元,用于当智能语音设备处于正常工作状态时,获取来自用户的对话语音,提取获取到...

【专利技术属性】
技术研发人员:李财瑜李志平孙雅杰金良雨
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1