一种声源数量的估计方法及系统技术方案

技术编号:34111583 阅读:14 留言:0更新日期:2022-07-12 01:28
本发明专利技术公开了一种声源数量的估计方法及系统,涉及信号处理技术领域,所述方法包括:通过麦克风阵列接收获得第一信号y

【技术实现步骤摘要】
一种声源数量的估计方法及系统


[0001]本专利技术涉及信号处理
,尤其涉及一种声源数量的估计方法及系统。

技术介绍

[0002]声源数量的估计问题一直都是语音信号处理领域中的一个热点,很多经典的信号处理方法都需要知道声源的个数。举例如波达方向(DOA)估计中的多信号分类方法(MUSIC),其工作前提即声源个数已知,进而MUSIC方法会根据声源个数来划分信号子空间和噪声子空间从而计算出空间谱,最后通过寻找空间谱上极值点的位置来确定多个声源的方位。然而,如果估计的声源个数和实际声源个数存在误差,那么MUSIC方法的DOA估计性能会显著下降。因此,如何快速、准确地估计出声源个数,在语音信号处理领域中具有重要的研究价值。
[0003]然而,现有方法的局限性在于信号模型中仅考虑了高斯白噪声和无混响的情况,在环境中混响比较强、或背景噪声不符合足高斯白噪声要求时,存在声源个数的估计误差大,进而影响后续语音信号处理效果的技术问题。

技术实现思路

[0004]本专利技术的目的是提供一种声源数量的估计方法及系统,用以解决现有技术中在环境中混响比较强、或背景噪声不符合足高斯白噪声要求时,存在的声源个数的估计误差大,进而影响后续语音信号处理效果的技术问题。
[0005]鉴于上述问题,本专利技术提供了一种声源数量的估计方法及系统。
[0006]第一方面,本专利技术提供了一种声源数量的估计方法,所述方法通过一种声源数量的估计系统实现,其中,所述方法包括:通过麦克风阵列接收获得第一信号y
m
(t);对所述第一信号进行短时傅里叶变换,获得变换域信号Y
m
(k,l);在所述变换域信号内的多个频点上分别进行单声源DOA估计,获得估计结果;在所述估计结果内,统计获得预设时间周期内不同声源方位被估计获得的频率,获得统计频率结果Q(θ);查找获得所述统计频率结果Q(θ)内的峰值点,获取被估计获得的频率大于门限值τ1的多个声源方位,获得声源数量估计结果;基于所述声源数量估计结果,更新当前活跃的声源个数。
[0007]另一方面,本专利技术还提供了一种声源数量的估计系统,用于执行如第一方面所述的一种声源数量的估计方法,其中,所述系统包括:第一获得单元:所述第一获得单元用于通过麦克风阵列接收获得第一信号y
m
(t);第二获得单元:所述第二获得单元用于对所述第一信号进行短时傅里叶变换,获得变换域信号Y
m
(k,l);第三获得单元:所述第三获得单元用于在所述变换域信号内的多个频点上分别进行单声源DOA估计,获得估计结果;第四获得单元:所述第四获得单元用于在所述估计结果内,统计获得预设时间周期内不同声源方位被估计获得的频率,获得统计频率结果Q(θ);第五获得单元:所述第五获得单元用于查找获得所述统计频率结果Q(θ)内的峰值点,获取被估计获得的频率大于门限值τ1的多个声源方位,获得声源数量估计结果;第一更新单元:所述第一更新单元用于基于所述声源数量估计
结果,更新当前活跃的声源个数。
[0008]第三方面,一种电子设备,其中,包括处理器和存储器;
[0009]该存储器,用于存储;
[0010]该处理器,用于通过调用,执行上述第一方面中任一项所述的方法。
[0011]第四方面,一种计算机程序产品,包括计算机程序和/或指令,该计算机程序和/或指令被处理器执行时实现上述第一方面中任一项所述方法的步骤。
[0012]本专利技术中提供的一个或多个技术方案,至少具有如下技术效果或优点:
[0013]1.通过麦克风阵列接收第一信号y
m
(t)并进行短时傅里叶变换,获得变换域信号Y
m
(k,l),然后在变换域信号内的多个频点上分别进行单声源DOA估计,并获得对应的估计结果,进一步的,对预设时间周期内不同声源方位被估计获得的频率进行统计,得到对应统计频率结果Q(θ),最后筛选统计频率结果Q(θ)内峰值点频率大于门限值τ1的多个声源方位,确定声源数量估计结果。此外,对声源数量估计结果中活跃的声源个数进行实时更新。通过对短时傅里叶变换后的变换域信号中各频点依次进行单声源DOA估计,进而统计分析后估计得到声源个数,达到了快速、准确地估计复杂声学环境中的声源个数,降低声源数量估计误差的技术效果。
[0014]2.通过对短时傅里叶变换后的变换域信号中各频点依次进行单声源DOA估计,进而统计分析后估计得到声源个数,避免对协方差矩阵进行特征值分解,实现了降低计算复杂度、提高声源数量估计速度的技术目标。
[0015]上述说明仅是本专利技术技术方案的概述,为了能够更清楚了解本专利技术的技术手段,而可依照说明书的内容予以实施,并且为了让本专利技术的上述和其它目的、特征和优点能够更明显易懂,以下特举本专利技术的具体实施方式。
附图说明
[0016]为了更清楚地说明本专利技术或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是示例性的,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
[0017]图1为本专利技术一种声源数量的估计方法的流程示意图;
[0018]图2为本专利技术一种声源数量的估计方法中激活、保持和中止策略的流程示意图;
[0019]图3为本专利技术一种声源数量的估计系统的结构示意图;
[0020]图4为本专利技术示例性电子设备的结构示意图;
[0021]附图标记说明:
[0022]第一获得单元11,第二获得单元12,第三获得单元13,第四获得单元14,第五获得单元15,第一更新单元16,总线300,接收器301,处理器302,发送器303,存储器304,总线接口305。
具体实施方式
[0023]本专利技术通过提供一种声源数量的估计方法及系统,解决了现有技术中在环境中混响比较强、或背景噪声不符合足高斯白噪声要求时,存在的声源个数的估计误差大,进而影
响后续语音信号处理效果的技术问题。通过对短时傅里叶变换后的变换域信号中各频点依次进行单声源DOA估计,进而统计分析后估计得到声源个数,达到了快速、准确地估计复杂声学环境中的声源个数,降低声源数量估计误差的技术效果。
[0024]本专利技术技术方案中对数据的获取、存储、使用、处理等均符合国家法律法规的相关规定。
[0025]下面,将参考附图对本专利技术中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本专利技术的一部分实施例,而不是本专利技术的全部实施例,应理解,本专利技术不受这里描述的示例实施例的限制。基于本专利技术的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。另外还需要说明的是,为了便于描述,附图中仅示出了与本专利技术相关的部分而非全部。
[0026]本专利技术提供了一种声源数量的估计方法,所述方法应用于一种声源数量的估计系统,其中,所述方法包括:通过麦克风阵列接收本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种声源数量的估计方法,其特征在于,所述方法包括:通过麦克风阵列接收获得第一信号y
m
(t);对所述第一信号进行短时傅里叶变换,获得变换域信号Y
m
(k,l);在所述变换域信号内的多个频点上分别进行单声源DOA估计,获得估计结果;在所述估计结果内,统计获得预设时间周期内不同声源方位被估计获得的频率,获得统计频率结果Q(θ);查找获得所述统计频率结果Q(θ)内的峰值点,获取被估计获得的频率大于门限值τ1的多个声源方位,获得声源数量估计结果;基于所述声源数量估计结果,更新当前活跃的声源个数。2.根据权利要求1所述的方法,其特征在于,所述短时傅里叶变换,通过下式进行计算:其中,m为所述麦克风阵列内第m个麦克风,k为频率索引,l为帧索引,w(n)为一窗函数,N为窗长,L为跳跃长度。3.根据权利要求1所述的方法,其特征在于,所述单声源DOA估计包括:计算:P
k,l
(θ)=d
H
(θ)y(k,l)y(k,l)
H
d(θ),其中,d(θ)为所述麦克风阵列的流型矢量,θ∈{θ1,θ2,


D
},θ为声源可能会出现的方位;计算:y(k,l)=[Y1(k,l) Y2(k,l)

Y
M
(k,l)]
T
,其中,M为所述麦克风阵列中麦克风的个数;寻找出现最大峰值点的角度,如下式:点的角度,如下式:即为在第l帧、第k个频点上的单声源波达方位估计结果;计算获得全部时间内,多个所述频点上的全部单声源波达方位估计结果,获得所述估计结果。4.根据权利要求3所述的方法,其特征在于,所述统计获得预设时间周期内不同声源方位被估计获得的频率,包括:根据所述估计结果,获得全部时间内,多个所述频点上的全部所述单声源波达方位估计结果;基于全部所述单声源波达方位估计结果,统计获得全部单声源波达方位被估计获得的频率Q(θ),其中,θ∈{θ1,θ2,


D
}。5.根据权利要求1所述的方法,其特征在于,所述查找获得所述统计频率结果Q(θ)内的峰值点,获取被估计获得的频率大于门限值τ1的多个声源方位,包括:查找获取所述统计频率结果Q(θ)内所有的峰值点;选取大于所述门限值τ1的全部所述峰值点,记作θ
i1

i2
,


iI
;构建获得第一向...

【专利技术属性】
技术研发人员:潘超赵旭东陈景东
申请(专利权)人:西北工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1