语音交互处理方法、装置、计算机设备及存储介质制造方法及图纸

技术编号：20122469 阅读：35 留言：0更新日期：2019-01-16 12:53

本发明专利技术公开了语音交互处理方法、装置、计算机设备及存储介质，其中方法包括：当智能语音设备处于正常工作状态时，获取来自用户的对话语音；提取获取到的对话语音的声纹信息；根据提取出的声纹信息确定对话语音是否为噪音；若不为噪音，则对对话语音进行应答处理。应用本发明专利技术所述方案，能够提高语音交互的准确性等。

Voice Interactive Processing, Devices, Computer Equipment and Storage Media

The invention discloses a voice interactive processing method, device, computer equipment and storage medium. The methods include: acquiring voice from a user when the intelligent voice device is in normal working state; extracting voiceprint information of the acquired voice; determining whether the voice of a conversation is noise according to the extracted voiceprint information; and entering the voice of a conversation if it is not noise. Line response processing. The scheme of the invention can improve the accuracy of voice interaction, etc.

全部详细技术资料下载

【技术实现步骤摘要】
语音交互处理方法、装置、计算机设备及存储介质
本专利技术涉及计算机应用技术，特别涉及语音交互处理方法、装置、计算机设备及存储介质。
技术介绍
随着语音识别等技术的不断发展，具备语音交互功能的智能语音设备的应用越来越普及，比如，带有答疑和指导功能的智能机器人不断受到市场热捧。这类智能机器人通常都服务于比较嘈杂的环境，比如，服务于机场这种高流量、高密度环境。这种环境下，智能机器人很容易受到噪音的干扰。图1为现有噪音干扰方式示意图。如图1所示，用户1唤醒智能机器人后，询问智能机器人自己的航班信息，当用户1问完“我的航班在哪值机”后，智能机器人询问用户1的航班号，这时用户2的噪音传来“今天天气怎么样”，智能机器人可能会响应用户2的噪音，回答“今天天气晴...”，从而打断用户1的对话，对于用户1来说给出错误的应答。用户2可能为路过的用户，比如用户2和用户3从用户1旁边路过，用户2和用户3在用较大的声音谈话，用户2询问用户3“今天天气怎么样”，对于用户1来说，“今天天气怎么样”就成了噪音。目前，智能机器人并没有对声源进行筛选，是一种“有问就答”的模式，只要语音(声音)的分贝数达到阵列的收声要求就会进行应答处理。这种模式非常不利于在嘈杂环境下使用，很可能导致上述的应答错误，从而降低了语音交互的准确性。
技术实现思路
有鉴于此，本专利技术提供了语音交互处理方法、装置、计算机设备及存储介质。具体技术方案如下：一种语音交互处理方法，包括：当智能语音设备处于正常工作状态时，获取来自用户的对话语音；提取获取到的对话语音的声纹信息；根据提取出的声纹信息确定所述对话语音是否为...

【技术保护点】
1.一种语音交互处理方法，其特征在于，包括：当智能语音设备处于正常工作状态时，获取来自用户的对话语音；提取获取到的对话语音的声纹信息；根据提取出的声纹信息确定所述对话语音是否为噪音；若不为噪音，则对所述对话语音进行应答处理。

【技术特征摘要】
1.一种语音交互处理方法，其特征在于，包括：当智能语音设备处于正常工作状态时，获取来自用户的对话语音；提取获取到的对话语音的声纹信息；根据提取出的声纹信息确定所述对话语音是否为噪音；若不为噪音，则对所述对话语音进行应答处理。2.根据权利要求1所述的方法，其特征在于，所述根据提取出的声纹信息确定所述对话语音是否为噪音包括：将提取出的声纹信息与获取到的基准声纹信息进行匹配；若匹配成功，则确定所述对话语音不为噪音，若匹配失败，则确定所述对话语音为噪音。3.根据权利要求2所述的方法，其特征在于，所述基准声纹信息的获取方式包括：根据来自用户的唤醒语音唤醒所述智能语音设备，使得所述智能语音设备进入所述正常工作状态；提取所述唤醒语音的声纹信息，将所述唤醒语音的声纹信息作为所述基准声纹信息。4.根据权利要求2所述的方法，其特征在于，所述基准声纹信息的获取方式包括：根据来自用户的唤醒语音唤醒所述智能语音设备，使得所述智能语音设备进入所述正常工作状态；提取所述唤醒语音的声纹信息；将提取出的所述唤醒语音的声纹信息与提取出的所述智能语音设备被唤醒之后首次获取到的对话语音的声纹信息进行匹配；若匹配成功，则根据两次提取出的声纹信息确定出所述基准声纹信息。5.根据权利要求4所述的方法，其特征在于，所述根据两次提取出的声纹信息确定出所述基准声纹信息包括：将所述唤醒语音的声纹信息或所述首次获取到的对话语音的声纹信息作为所述基准声纹信息。6.一种语音交互处理装置，其特征在于，包括：预处理单元以及应答单元；所述预处理单元，用于当智能语音设备处于正常工作状态时，获取来自用户的对话语音，提取获取到...

【专利技术属性】
技术研发人员：李财瑜，李志平，孙雅杰，金良雨，
申请(专利权)人：北京百度网讯科技有限公司，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人