语音交互方法、装置和系统制造方法及图纸

技术编号:19145876 阅读:27 留言:0更新日期:2018-10-13 09:34
本申请实施例公开了语音交互方法、装置和系统。该方法的一具体实施方式包括:基于输入的声音,生成语音输入信号,其中,输入的声音包括用户声音和环境声音;对语音输入信号进行降噪处理以提取出由用户发出的目标语音信号;将目标语音信号发送给目标语音处理终端,其中,目标语音处理终端对目标语音信号进行解析得到解析结果,以及执行与解析结果相关的操作。该实施方式可以提高针对语音信号的降噪率,进一步提高操作执行的准确率。

Speech interaction method, device and system

The application embodiment discloses a voice interaction method, device and system. One specific embodiment of the method includes: generating a speech input signal based on the input sound, in which the input sound includes the user's voice and the environment's voice; denoising the speech input signal to extract the target speech signal emitted by the user; and transmitting the target speech signal to the target speech processing terminal. Among them, the target speech processing terminal parses the target speech signal to get the parsing result, and performs the operation related to the parsing result. The implementation method can improve the noise reduction rate for speech signal and further improve the accuracy of operation execution.

【技术实现步骤摘要】
语音交互方法、装置和系统
本申请实施例涉及计算机
,具体涉及语音交互方法、装置和系统。
技术介绍
目前,随着智能语音交互技术的快速普及,越来越多的用户使用语音交互设备,语音交互技术给用户的生活带来了极大的便捷。在一些场景下(例如,室外环境下、用户移动中),语音交互设备自身所产生的噪声信号通常会对由用户发出的语音信号产生很大的干扰,如何对语音信号进行降噪处理对于语音交互设备具有重要的意义。
技术实现思路
本申请实施例提出了语音交互方法、装置和系统。第一方面,本申请实施例提供了一种语音交互方法,包括:基于输入的声音,生成语音输入信号,其中,输入的声音包括用户声音和环境声音;对语音输入信号进行降噪处理以提取出由用户发出的目标语音信号;将目标语音信号发送给目标语音处理终端,其中,目标语音处理终端对目标语音信号进行解析得到解析结果,以及执行与解析结果相关的操作。在一些实施例中,基于输入的声音,生成声音输入信号,包括:将输入的声音转为音频信号;以预设的第一采样速率对音频信号进行采样得到语音输入信号。在一些实施例中,对语音输入信号进行降噪处理以提取出由用户发出的目标语音信号,包括:对语音输入信号进行波束成形处理得到合成信号;对合成信号进行噪声抑制处理;对噪声抑制处理后的信号进行去混响处理和语音增强处理,得到由用户发出的目标语音信号。在一些实施例中,在基于输入的声音,生成语音输入信号之前,该方法还包括:响应于接收到目标语音处理终端发送的配对请求,建立与目标语音处理终端的配对关系。第二方面,本申请实施例提供了一种语音交互装置,包括:生成单元,被配置成基于输入的声音,生成语音输入信号,其中,输入的声音包括用户声音和环境声音;降噪单元,被配置成对语音输入信号进行降噪处理以提取出由用户发出的目标语音信号;发送单元,被配置成将目标语音信号发送给目标语音处理终端,其中,目标语音处理终端对目标语音信号进行解析得到解析结果,以及执行与解析结果相关的操作。在一些实施例中,生成单元进一步被配置成按照如下步骤基于输入的声音,生成语音输入信号:将输入的声音转为音频信号;以预设的第一采样速率对音频信号进行采样得到语音输入信号。在一些实施例中,降噪单元进一步被配置成按照如下步骤对语音输入信号进行降噪处理以提取出由用户发出的目标语音信号:对语音输入信号进行波束成形处理得到合成信号;对合成信号进行噪声抑制处理;对噪声抑制处理后的信号进行去混响处理和语音增强处理,得到由用户发出的目标语音信号。在一些实施例中,该装置还包括:建立单元,被配置成响应于接收到目标语音处理终端发送的配对请求,建立与目标语音处理终端的配对关系。第三方面,本申请实施例提供了一种语音交互方法,包括:接收降噪耳机发送的目标语音信号,其中,目标语音信号是降噪耳机对语音输入信号进行降噪处理以提取出的由用户发出的语音信号,语音输入信号是基于输入的声音所生成的;对目标语音信号进行解析得到解析结果;执行与解析结果相关的操作。在一些实施例中,执行与解析结果相关的操作,包括:响应于确定出解析结果包括命令执行设备的设备标识和针对命令执行设备的控制命令,向设备标识所指示的命令执行设备发送控制命令,以供命令执行设备执行与控制命令相关的操作。第四方面,本申请实施例提供了一种语音交互装置,包括:接收单元,被配置成接收降噪耳机发送的目标语音信号,其中,目标语音信号是降噪耳机对语音输入信号进行降噪处理以提取出的由用户发出的语音信号,语音输入信号是基于输入的声音所生成的;解析单元,被配置成对目标语音信号进行解析得到解析结果;执行单元,被配置成执行与解析结果相关的操作。在一些实施例中,执行单元进一步被配置成按照如下步骤执行与解析结果相关的操作:响应于确定出解析结果包括命令执行设备的设备标识和针对命令执行设备的控制命令,向设备标识所指示的命令执行设备发送控制命令,以供命令执行设备执行与控制命令相关的操作。第五方面,本申请实施例提供了一种语音交互系统,包括语音处理终端和降噪耳机,该系统包括:降噪耳机,被配置成基于输入的声音,生成语音输入信号,对语音输入信号进行降噪处理以提取出由用户发出的目标语音信号,以及将目标语音信号发送给语音处理终端,其中,输入的声音包括用户声音和环境声音;语音处理终端,被配置成对目标语音信号进行解析得到解析结果,执行与解析结果相关的操作。在一些实施例中,降噪耳机,被配置成将输入的声音转为音频信号,以预设的第一采样速率对音频信号进行采样得到语音输入信号。在一些实施例中,降噪耳机,被配置成对语音输入信号进行波束成形处理得到合成信号,对合成信号进行噪声抑制处理,对噪声抑制处理后的信号进行去混响处理和语音增强处理,得到由用户发出的目标语音信号。在一些实施例中,语音处理终端,被配置成向降噪耳机发送配对请求;降噪耳机,被配置成建立与语音处理终端的配对关系。在一些实施例中,该系统还包括命令执行设备;语音处理终端,被配置成响应于确定出解析结果包括命令执行设备的设备标识和针对命令执行设备的控制命令,向命令执行设备发送控制命令;命令执行设备,被配置成执行与控制命令相关的操作。第六方面,本申请实施例提供了一种降噪耳机,包括:一个或多个处理器;存储装置,其上存储有一个或多个程序,当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现如语音交互方法中任一实施例的方法。第七方面,本申请实施例提供了一种语音处理终端,包括:一个或多个处理器;存储装置,其上存储有一个或多个程序,当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现如语音交互方法中任一实施例的方法。第八方面,本申请实施例提供了一种计算机可读介质,其上存储有计算机程序,该程序被处理器执行时实现如语音交互方法中任一实施例的方法。第九方面,本申请实施例提供了一种计算机可读介质,其上存储有计算机程序,该程序被处理器执行时实现如语音交互方法中任一实施例的方法。本申请实施例提供的语音交互方法、装置和系统,降噪耳机首先基于输入的声音,生成语音输入信号,之后降噪耳机对上述语音输入信号进行降噪处理以提取出由用户发出的目标语音信号,以及将上述目标语音信号发送给语音处理终端,语音处理终端对上述目标语音信号进行解析得到解析结果,以及执行与上述解析结果相关的操作。从而可以在降噪耳机端对生成的语音信号进行降噪以提取出由用户发出的目标语音信号,将目标语音信号发送给语音处理终端进行解析从而执行相应的操作,这种语音交互方式可以提高针对语音信号的降噪率,进一步提高操作执行的准确率。附图说明通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:图1是本申请可以应用于其中的示例性系统架构图;图2是根据本申请的语音交互方法的一个实施例的流程图;图3是根据本申请的语音交互方法的一个应用场景的示意图;图4是根据本申请的语音交互方法的另一个实施例的流程图;图5是根据本申请的语音交互方法的再一个实施例的流程图;图6是根据本申请的语音交互系统的一实施例的时序图;图7是根据本申请的语音交互装置的一个实施例的结构示意图;图8是根据本申请的语音交互装置的另一个实施例的结构示意图;图9是适于用来实现本申请实施例的降噪耳机的计算机系统的结构示本文档来自技高网...

【技术保护点】
1.一种语音交互方法,包括:基于输入的声音,生成语音输入信号,其中,所述输入的声音包括用户声音和环境声音;对所述语音输入信号进行降噪处理以提取出由用户发出的目标语音信号;将所述目标语音信号发送给目标语音处理终端,其中,所述目标语音处理终端对所述目标语音信号进行解析得到解析结果,以及执行与所述解析结果相关的操作。

【技术特征摘要】
1.一种语音交互方法,包括:基于输入的声音,生成语音输入信号,其中,所述输入的声音包括用户声音和环境声音;对所述语音输入信号进行降噪处理以提取出由用户发出的目标语音信号;将所述目标语音信号发送给目标语音处理终端,其中,所述目标语音处理终端对所述目标语音信号进行解析得到解析结果,以及执行与所述解析结果相关的操作。2.根据权利要求1所述的方法,其中,所述基于输入的声音,生成声音输入信号,包括:将输入的声音转为音频信号;以预设的第一采样速率对所述音频信号进行采样得到语音输入信号。3.根据权利要求1所述的方法,其中,所述对所述语音输入信号进行降噪处理以提取出由用户发出的目标语音信号,包括:对所述语音输入信号进行波束成形处理得到合成信号;对所述合成信号进行噪声抑制处理;对噪声抑制处理后的信号进行去混响处理和语音增强处理,得到由用户发出的目标语音信号。4.根据权利要求1-3之一所述的方法,其中,在所述基于输入的声音,生成语音输入信号之前,所述方法还包括:响应于接收到所述目标语音处理终端发送的配对请求,建立与所述目标语音处理终端的配对关系。5.一种语音交互装置,包括:生成单元,被配置成基于输入的声音,生成语音输入信号,其中,所述输入的声音包括用户声音和环境声音;降噪单元,被配置成对所述语音输入信号进行降噪处理以提取出由用户发出的目标语音信号;发送单元,被配置成将所述目标语音信号发送给目标语音处理终端,其中,所述目标语音处理终端对所述目标语音信号进行解析得到解析结果,以及执行与所述解析结果相关的操作。6.根据权利要求5所述的装置,其中,所述生成单元进一步被配置成按照如下步骤基于输入的声音,生成语音输入信号:将输入的声音转为音频信号;以预设的第一采样速率对所述音频信号进行采样得到语音输入信号。7.根据权利要求5所述的装置,其中,所述降噪单元进一步被配置成按照如下步骤对所述语音输入信号进行降噪处理以提取出由用户发出的目标语音信号:对所述语音输入信号进行波束成形处理得到合成信号;对所述合成信号进行噪声抑制处理;对噪声抑制处理后的信号进行去混响处理和语音增强处理,得到由用户发出的目标语音信号。8.根据权利要求5-7之一所述的装置,其中,所述装置还包括:建立单元,被配置成响应于接收到所述目标语音处理终端发送的配对请求,建立与所述目标语音处理终端的配对关系。9.一种语音交互方法,包括:接收降噪耳机发送的目标语音信号,其中,所述目标语音信号是所述降噪耳机对语音输入信号进行降噪处理以提取出的由用户发出的语音信号,所述语音输入信号是基于输入的声音所生成的;对所述目标语音信号进行解析得到解析结果;执行与所述解析结果相关的操作。10.根据权利要求9所述的方法,其中,所述执行与所述解析结果相关的操作,包括:响应于确定出所述解析结果包括命令执行设备的设备标识和针对所述命令执行设备的控制命令,向所述设备标识所指示的命令执行设备发送所述控制命令,以供所述命...

【专利技术属性】
技术研发人员:耿雷
申请(专利权)人:百度在线网络技术北京有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1