语音增强方法、电子设备和存储介质技术

技术编号:29079152 阅读:33 留言:0更新日期:2021-06-30 09:38
本申请提出了一种语音增强方法、电子设备和存储介质,涉及语音处理技术领域。其中,上述语音增强方法包括:首先,获取到麦克风阵列采集的语音信号。然后,根据各个声区的声区参数,分别对语音信号进行预增强,得到各个声区分别对应的预增强语音信号。其次,从各个预增强语音信号中确定包含唤醒词的目标语音信号。将目标语音信号对应的声区确定为产生语音信号的声源所在的目标声区。最后,在目标声区对产生语音信号的声源进行定位,并根据声源的定位信息对语音信号进行定向增强。通过在唤醒阶段使用声区预增强后的语音信号,可提升唤醒性能。从而,可在多个声源干扰的情况下,准确定位目标声源的位置,并提高识别阶段语音增强性能。并提高识别阶段语音增强性能。并提高识别阶段语音增强性能。

【技术实现步骤摘要】
语音增强方法、电子设备和存储介质


[0001]本申请涉及语音处理
,尤其涉及一种语音增强方法、电子设备和存储介质。

技术介绍

[0002]在一些涉及语音交互的场景中,如智能音箱、智能汽车以及智能机器人等,通常需要先对用户输入的语音信号进行语音信号处理。语音信号处理主要包括确定目标声源的来波方向,以及利用波束形成技术对来波方向上的语音信号进行波束增强,从而达到增强有效信号、抑制噪声和干扰的目的。
[0003]目前,在确定目标声源的来波方向时,主要是通过波达方向估计技术实现目标声源定位。但是,当环境中存在多个声源干扰时,目前的技术无法准确定位目标声源所在方向,导致语音增强过程中生成的波束发散,影响后续的语音交互服务。

技术实现思路

[0004]本申请实施例提供了一种语音增强方法、电子设备和存储介质,以实现在多个声源干扰的情况下,准确定位目标声源的位置,提高唤醒与识别阶段语音增强性能。
[0005]第一方面,本申请实施例提供一种语音增强方法,所述方法包括:获取到麦克风阵列采集的语音信号;根据各个声区的声区参数,分别对所述语音信号进行预增强,得到所述各个声区分别对应的预增强语音信号;其中,所述各个声区是根据所述麦克风阵列包含的各个麦克风的方位信息预先划分的;从各个所述预增强语音信号中确定包含唤醒词的目标语音信号;将所述目标语音信号对应的声区确定为产生所述语音信号的声源所在的目标声区;在所述目标声区对产生所述语音信号的声源进行定位,并根据所述声源的定位信息对所述语音信号进行定向增强。
[0006]其中一种可能的实现方式中,麦克风的方位信息包括:麦克风在所述麦克风阵列中的相对位置参数;根据所述麦克风阵列包含的各个麦克风的方位信息预先划分所述各个声区,包括:根据所述麦克风阵列包含的各个麦克风在所述麦克风阵列中的相对位置参数,将所述麦克风阵列的信号采集区域划分为多个声区,并且根据所述声区的中心线位置,确定所述声区的声区参数。
[0007]其中一种可能的实现方式中,从各个所述预增强语音信号中确定包含唤醒词的目标语音信号,包括:利用神经网络模型,对各个所述预增强语音信号的信号特征与预设信号特征的相似度进行打分;其中,所述预设信号特征是唤醒词对应的唤醒语音信号的信号特征;根据打分结果确定目标语音信号。
[0008]其中一种可能的实现方式中,根据打分结果确定目标语音信号,包括:将各个所述预增强语音信号中分值高于预设阈值且分值最高的预增强语音信号确定为目标语音信号。
[0009]其中一种可能的实现方式中,如果各个所述预增强语音信号的分值均低于所述预设阈值,则所述方法还包括:通过所述麦克风阵列获取新的语音信号,直至生成的各个预增
强语音信号中至少一个预增强语音信号的分值高于所述预设阈值。
[0010]其中一种可能的实现方式中,根据所述声源的定位信息对所述语音信号进行定向增强之后,所述方法还包括:将定向增强后的语音信号发送给云端服务器,以使所述云端服务器根据所述定向增强后的语音信号进行语音识别,并根据语音识别结果进行语音交互。
[0011]第二方面,本申请实施例提供一种语音增强装置,所述装置包括:获取模块,用于获取到麦克风阵列采集的语音信号;预增强模块,用于根据各个声区的声区参数,分别对所述语音信号进行预增强,得到所述各个声区分别对应的预增强语音信号;其中,所述各个声区是根据所述麦克风阵列包含的各个麦克风的方位信息预先划分的;第一确定模块,用于从各个所述预增强语音信号中确定包含唤醒词的目标语音信号;第二确定模块,用于将所述目标语音信号对应的声区确定为产生所述语音信号的声源所在的目标声区;执行模块,用于在所述目标声区对产生所述语音信号的声源进行定位,并根据所述声源的定位信息对所述语音信号进行定向增强。
[0012]其中一种可能的实现方式中,所述执行模块根据所述声源的定位信息对所述语音信号进行定向增强之后,还用于:将定向增强后的语音信号发送给云端服务器,以使所述云端服务器根据所述定向增强后的语音信号进行语音识别,并根据语音识别结果进行语音交互。
[0013]第三方面,本申请实施例提供一种电子设备,包括:至少一个处理器;以及与所述处理器通信连接的至少一个存储器,其中:所述存储器存储有可被所述处理器执行的程序指令,所述处理器调用所述程序指令能够执行如第一方面所述的方法。
[0014]第四方面,本申请实施例提供一种计算机可读存储介质,所述计算机可读存储介质存储计算机指令,所述计算机指令使所述计算机执行如第一方面所述的方法。
[0015]以上技术方案中,首先,获取到麦克风阵列采集的语音信号。然后,根据各个声区的声区参数,分别对语音信号进行预增强,得到各个声区分别对应的预增强语音信号。其次,从各个预增强语音信号中确定包含唤醒词的目标语音信号。将目标语音信号对应的声区确定为产生语音信号的声源所在的目标声区。最后,在目标声区对产生语音信号的声源进行定位,并根据声源的定位信息对语音信号进行定向增强。本方案对唤醒与识别阶段均做了波束增强,且基于预设声区范围的声源定位,使得定位结果可靠性提高。
【附图说明】
[0016]为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
[0017]图1为本申请实施例提供的一种语音增强系统的结构图;
[0018]图2为本申请实施例提供的另一种语音增强系统的结构图;
[0019]图3为本申请实施例提供的一种语音增强方法的流程图;
[0020]图4为本申请实施例提供的一种语音增强方法的结构示意图;
[0021]图5为本申请实施例提供的另一种语音增强方法的结构示意图;
[0022]图6为本申请实施例提供的另一种语音增强方法的流程图;
[0023]图7为本申请实施例提供的一种语音增强装置的结构示意图;
[0024]图8为本申请实施例提供的一种电子设备的示意图。
【具体实施方式】
[0025]为了更好的理解本申请的技术方案,下面结合附图对本申请实施例进行详细描述。
[0026]应当明确,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本申请保护的范围。
[0027]在本申请实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本申请。在本申请实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。
[0028]本申请实施例可提供一种语音增强系统,该语音增强系统可位于具备语音交互功能的终端设备内,如智能音箱、智能汽车、智能机器人等。本申请实施例提供的语音增强系统可用于执行本申本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种语音增强方法,其特征在于,包括:获取到麦克风阵列采集的语音信号;根据各个声区的声区参数,分别对所述语音信号进行预增强,得到所述各个声区分别对应的预增强语音信号;其中,所述各个声区是根据所述麦克风阵列包含的各个麦克风的方位信息预先划分的;从各个所述预增强语音信号中确定包含唤醒词的目标语音信号;将所述目标语音信号对应的声区确定为产生所述语音信号的声源所在的目标声区;在所述目标声区对产生所述语音信号的声源进行定位,并根据所述声源的定位信息对所述语音信号进行定向增强。2.根据权利要求1所述的方法,其特征在于,麦克风的方位信息包括:麦克风在所述麦克风阵列中的相对位置参数;根据所述麦克风阵列包含的各个麦克风的方位信息预先划分所述各个声区,包括:根据所述麦克风阵列包含的各个麦克风在所述麦克风阵列中的相对位置参数,将所述麦克风阵列的信号采集区域划分为多个声区,并且根据所述声区的中心线位置,确定所述声区的声区参数。3.根据权利要求1所述的方法,其特征在于,从各个所述预增强语音信号中确定包含唤醒词的目标语音信号,包括:利用神经网络模型,对各个所述预增强语音信号的信号特征与预设信号特征的相似度进行打分;其中,所述预设信号特征是唤醒词对应的唤醒语音信号的信号特征;根据打分结果确定目标语音信号。4.根据权利要求3所述的方法,其特征在于,根据打分结果确定目标语音信号,包括:将各个所述预增强语音信号中分值高于预设阈值且分值最高的预增强语音信号确定为目标语音信号。5.根据权利要求4所述的方法,其特征在于,如果各个所述预增强语音信号的分值均低于所述预设阈值,则所述方法还包括:通过所述麦克风阵列获取新的语音信号,直至生成的各个预增强语音信号中至少一个预增强...

【专利技术属性】
技术研发人员:夏洁方思敏罗丽云李开
申请(专利权)人:锐迪科微电子上海有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1