一种估计声源波达方向的方法、电子设备及芯片系统技术方案

技术编号:31724896 阅读:13 留言:0更新日期:2022-01-05 15:49
本申请实施例提供一种估计声源波达方向的方法、电子设备及芯片系统,涉及音频处理技术领域,可以应用于多声源的声学环境中,且能够获得较纯净的声源信号。该方法包括:电子设备获取音频信号,音频信号包括噪声、一个或多个目标声源的声源信号、混响信号;电子设备对音频信号执行联合处理,得到一个或多个目标声源的声源信号和一个或多个目标声源的声源信号的波达方向,联合处理包括:去混响处理、盲源分离处理和波达方向估计处理。分离处理和波达方向估计处理。分离处理和波达方向估计处理。

【技术实现步骤摘要】
一种估计声源波达方向的方法、电子设备及芯片系统


[0001]本申请实施例涉及音频处理领域,尤其涉及一种估计声源波达方向的方法、电子设备及芯片系统。

技术介绍

[0002]波达方向(Direction of Arrival,DOA)估计是阵列信号处理的研究热点,通过DOA估计能够确定声源所在的方向,从而能够更好的拾取目标声音。因此,DOA估计成为手机、智能音箱、远程会议大屏等人机交互设备的关键技术。
[0003]由于,设备采集到的音频信号通常由声源信号和噪声混合而成,在进行DOA估计时,首先,将噪声作为干扰信号,从音频信号中筛选出不包含噪声或噪声影响较小的频点数据。然后,对这些筛选出的频点数据进行DOA估计。然而,这种DOA估计的方法在应用时,无法应用在包含多个声源的场景中,并且在复杂的声学环境中筛除出的频点数据较少且筛选出的频点数据可能包含了其他干扰成分,使得DOA估计时的精度较低。

技术实现思路

[0004]本申请实施例提供一种估计声源波达方向的方法、电子设备及芯片系统,可以应用于多声源的声学环境中,且能够提高复杂声学环境中DOA估计的精度。
[0005]为达到上述目的,本申请采用如下技术方案:
[0006]第一方面,本申请实施例提供一种估计声源波达方向的方法,包括:电子设备获取音频信号,音频信号包括:噪声、一个或多个目标声源的声源信号、混响信号;电子设备对音频信号进行第N次去混响处理,得到第N预测矩阵和第N去混响信号,第N去混响信号包括音频信号中除第N混响信号以外的信号,第N混响信号为第N次去混响处理中去除的混响信号;电子设备对第N去混响信号进行第N次盲源分离处理,得到第N解混矩阵和第N去噪声信号,第N去噪声信号为音频信号中去除了第N次盲源分离处理得到的噪声的信号;电子设备继续对第N去噪声信号执行去混响处理和盲源分离处理;在N为预设值或者第N预测矩阵收敛且第N解混矩阵收敛时,电子设备根据第N解混矩阵和第N去混响信号,得到一个或多个目标声源的声源信号;其中,N为从1开始的正整数;电子设备确定一个或多个目标声源的声源信号的波达方向。
[0007]电子设备对获取的音频信号执行去混响和盲源分离的联合迭代处理后,可以将噪声、混响信号和声源信号分离开。即当音频信号中包含一个或多个目标声源的声源信号时,在电子设备对音频信号执行去混响和盲源分离的联合迭代处理后,可以获得每个目标声源的声源信号。因此,电子设备可以估计每个目标声源的声源信号的波达方向,使得可以应用在多声源的声学环境中;混响信号是目标声源的声源信号经过反射后被麦克风延时采集的信号,所以混响信号的方向已经改变了;噪声的方向是四面八方的,因此,联合迭代处理后获得的每个目标声源的声源信号几乎不包含影响DOA估计精度的噪声和混响信号,或者包含了很少量的影响DOA估计精度的噪声和混响信号。因此,电子设备在估计目标声源的声源
信号的波达方向时,具有较高的DOA估计精度;并且即使音频信号的采集环境为高噪声高混响的声学环境,依然具有较高的DOA估计精度。
[0008]在第一方面的一种可能的实施方式中,对于第一目标声源,第一目标声源为一个或多个目标声源中的任一个,第一目标声源的声源信号的波达方向包括:第一目标声源的声源信号在不同频点上的第一方向信息。
[0009]为了便于描述,可以将一个或多个目标声源中的任一个目标声源记为第一目标声源。
[0010]在第一方面的一种可能的实现方式中,电子设备根据第一目标声源的声源信号在不同频点上的第一方向信息,对第一目标声源的声源信号执行声源分离和波达方向估计的联合处理,得到第一目标声源的声源信号在不同频点上的第二方向信息,其中,声源分离处理包括:去混响和盲源分离的联合迭代处理。
[0011]去混响和盲源分离都是一种估计算法,音频信号经过去混响和盲源分离的联合迭代处理后获得的目标声源的声源信号中可能还会包含噪声和/或混响信号,而电子设备基于包含噪声和/或混响信号的声源信号获得的第一方向信息可能不太精确;因此,电子设备可以基于当前获得的第一目标声源的声源信号在不同频点上的第一方向信息继续对第一目标声源执行声源分离处理和DOA估计处理,由于再次进行声源分离处理时通过第一目标声源的声源信号在不同频点上的第一方向信息约束声源分离处理的过程,因此电子设备执行声源分离后能够获得更精确的第一目标声源的声源信号、解混矩阵以及混合矩阵,电子设备根据更精确的第一目标声源的声源信号、解混矩阵或混合矩阵能够获得更精确的第一目标声源的声源信号在不同频点上的第二方向信息。当然,获得的第一目标声源的声源信号在不同频点上的第二方向信息比第一目标声源的声源信号在不同频点上的第一方向信息更精确。
[0012]在第一方面的一种可能的实现方式中,电子设备对第一目标声源的声源信号在不同频点上的第一方向信息执行平滑滤波处理或核密度估计处理,得到第一目标声源在不同频点上的第三方向信息;电子设备将第一目标声源在不同频点上的第三方向信息融合,获得第一目标声源的方向。
[0013]本申请实施例中,平滑滤波处理和核密度估计处理是为了将第一目标声源的声源信号中的一些干扰去除,从而能够根据去除一些干扰后的第三方向信息获得第一目标声源的声源信号的方向。
[0014]在第一方面的一种可能的实现方式中,电子设备继续对第N去噪声信号执行去混响处理和盲源分离处理包括:
[0015]若第p次去混响处理得到的第p预测矩阵收敛且第p次盲源分离处理得到的第p解混矩阵不收敛,则电子设备执行第p+i次盲源分离处理,直到第p+i解混矩阵收敛,或,电子设备交替执行第p+i次去混响处理和第p+i次盲源分离处理,直到第p+i预测矩阵和第p+i解混矩阵同时收敛,其中,p为正整数,i为从1开始的正整数;
[0016]若第q次去混响处理得到的第q预测矩阵不收敛且第q次盲源分离处理得到的第q解混矩阵收敛,则电子设备执行第q+i次去混响处理,直到第q+i预测矩阵收敛,或,电子设备交替执行第q+i次去混响处理和第q+i次盲源分离处理,直到第q+i预测矩阵和第q+i解混矩阵同时收敛,其中,q为正整数,i为从1开始的正整数。
[0017]在实施例中,电子设备在执行去混响处理和盲源分离处理时,除了可以循环执行去混响处理和盲源分离处理直到预测矩阵和解混矩阵均收敛,也可以在其中一个矩阵收敛时,独立迭代不收敛的矩阵,直到预测矩阵和解混矩阵均收敛,从而避免了收敛的矩阵重复运算的过程,提高处理效率。
[0018]在第一方面的一种可能的实现方式中,电子设备执行第j次去混响处理包括m次更新预测矩阵的过程,电子设备执行第j次盲源分离处理包括n次更新解混矩阵的过程,其中,j、m和n均为正整数。
[0019]电子设备在每一次执行去混响处理和盲源分离处理过程中可以包括独立迭代矩阵的过程,降低运算量,提高处理效率。
[0020]在第一方面的一种可能的实现方式中,采用上次去混响处理获得的去混响信号作为盲源分离的处理信号,采用音频信号作为去混响的处理信号;或本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种估计声源波达方向的方法,其特征在于,包括:电子设备获取音频信号,所述音频信号包括:噪声、一个或多个目标声源的声源信号、混响信号;所述电子设备对所述音频信号进行第N次去混响处理,得到第N预测矩阵和第N去混响信号,所述第N去混响信号包括所述音频信号中除第N混响信号以外的信号,所述第N混响信号为所述第N次去混响处理中去除的混响信号;所述电子设备对所述第N去混响信号进行第N次盲源分离处理,得到第N解混矩阵和第N去噪声信号,所述第N去噪声信号为所述音频信号中去除了第N次盲源分离处理得到的噪声的信号;所述电子设备继续对第N去噪声信号执行去混响处理和盲源分离处理;在N为预设值或者第N预测矩阵收敛且第N解混矩阵收敛时,所述电子设备根据第N解混矩阵和第N去混响信号,得到所述一个或多个目标声源的声源信号;其中,N为从1开始的正整数;所述电子设备确定所述一个或多个目标声源的声源信号的波达方向。2.如权利要求1所述的方法,其特征在于,对于第一目标声源,所述第一目标声源为所述一个或多个目标声源中的任一个,所述第一目标声源的声源信号的波达方向包括:所述第一目标声源的声源信号在不同频点上的第一方向信息。3.根据权利要求2所述的方法,其特征在于,所述方法还包括:所述电子设备根据所述第一目标声源的声源信号在所述不同频点上的第一方向信息,对所述第一目标声源的声源信号执行声源分离和波达方向估计的联合处理,得到所述第一目标声源的声源信号在所述不同频点上的第二方向信息,其中,所述声源分离处理包括:所述去混响和盲源分离的联合迭代处理。4.如权利要求2所述的方法,其特征在于,所述方法还包括:所述电子设备对所述第一目标声源的声源信号在所述不同频点上的第一方向信息执行平滑滤波处理或核密度估计处理,得到所述第一目标声源的声源信号在所述不同频点上的第三方向信息;所述电子设备将所述第一目标声源的声源信号在所述不同频点上的第三方向信息融合,获得所述第一目标声源的方向。5.如权利要求1所述的方法,其特征在于,所述电子设备继续对第N去噪声信号执行去混响处理和盲源分离处理包括:若第p次去混响处理得到的第p预测矩阵收敛且第p次盲源分离处理得到的第p解混矩阵不收敛,则所述电子设备执行第p+i次盲源分离处理,直到第p+i解混矩阵收敛,或,所述电子设备交替执行第p+i次去混响处理和第p+i次盲源分离处理,直到第p+i预测矩阵和第p+i解混矩阵同时收敛,其中,p为正整数,i为从1开始的正整数;若第q次去混响处理得到的第q预测矩阵不收敛且第q次盲源分离处理得到的第q解混矩阵收敛,则所述电子设备执行第q+i次去混响处理,直到第q+i预测矩阵收敛,或,所述电子设备交替执行第q+i次去混响处理和第q+i次盲源分离处理,直到第q+i预测矩阵和第q+i解混矩阵同时收敛,其中,q为正整数,i为从1开始的正整数。6.如权利要求1所述的方法,其特征在于,所述电子设备执行第j次去混响处理包括m次
更新预测矩阵的过程,所述电子设备执行第j次盲源分离处理包括n次更新解混矩阵的过程,其中,j、m和n均为正整数。7.如权利要求1所述的方法,其特征在于,所述电子设备获取音频信号包括:所述电子设备通过所述电子设备上的声学矢量传感器采集音频信号;或,所述电子设备接收其他设备上的声学矢量传感器采集的音频信号。8.如权利要求7所述的方法,其特征在于,所述电子设备确定第二目标声源的声源信号的波达方向,包括:所述电子设备根据所述第二目标声源的声源信号在多个通道上的幅值、所述一个或多个目标声源的声源信号的解混矩阵和混合矩阵中的一个或多个,得到所述第二目标声源的声源信号的波达方向,所述第二目标声源为所述一个或多个目标声源中的任一个;其中,所述解混矩阵表示所述音频信号分离为所述一个或多个目标声源的声源信号时的转换关系,所述混合矩阵表示所述音频信号中的所述一个或多个目标声源的声源信号混合为所述音频信号时的转换关系。9.如权利要求8所述的方法,其特征在于,所述电子设备根据所述一个或多个目标声源的声源信号...

【专利技术属性】
技术研发人员:朱梦尧刘志韬施栋刘鑫
申请(专利权)人:华为技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1