适用于球面麦克风阵列声源定向的球谐波阶数自适应选择方法技术

技术编号:21889492 阅读:15 留言:0更新日期:2019-08-17 13:37
本发明专利技术公开了一种适用于球面麦克风阵列声源定向的球谐波阶数自适应选择方法,包括如下步骤:借助离散球傅里叶变换和模式强度补偿将声场信息由时频域变换成球谐波域的模式强度补偿特征波束形式,由声场的各阶特征波束计算声场的各阶特征波束的功率;根据声场各阶间的特征波束功率相似性检测因子衡量各阶特征波束的功率相似性;根据设定门限参数值对平均特征波束功率相似性检测因子进行可靠阶数选择处理;根据可靠阶数进行时频点掩蔽,利用满足条件的时频点对应的可靠阶声场特征波束进行声场定位,得出方位角估计值。本发明专利技术对混响噪声具有更高的鲁棒性,声源方位估计精度也较高。

Spherical Harmonic Order Adaptive Selection Method for Spherical Microphone Array Source Orientation

【技术实现步骤摘要】
适用于球面麦克风阵列声源定向的球谐波阶数自适应选择方法
本专利技术涉及球面麦克风阵列,适用于球谐波域声源定向方法,可用于视频会议系统、机器人听觉、助听器、人机语音交互系统、以及音频监控等诸多领域。
技术介绍
球面麦克风阵列具有三维空间对称性,在整个空间上具有相同的空间分辨率,并且可以将采集到的声场信息变换到球谐波域中进行表示,具有声场信息与阵列分布无关的优点,这为三维声场分析带来了方便。近年来人们提出了一些在球谐波域中进行声源定向的算法,特别是利用模式强度补偿的特征波束进行定位的算法,如PWD-SRP(见文献[1]B.Rafaely,Phase-modeversusdelay-and-sumsphericalmicrophonearrayprocessing,IEEESignalProcess.Lett.2005,12(10):713-716.)、SH-MUSIC(见文献[2]O.NadiriandB.Rafaely.Localizationofmultiplespeakersunderhighreverberationusingasphericalmicrophonearrayandthedirect-pathdominancetest.IEEE/ACMTransactionsonAudioSpeechandLanguageProcessing.2014,22(10):1494-1505.)、PIV(见文献[3]D.P.Jarrett,E.A.P.Habets,andP.A.Naylor.3Dsourcelocalizationinthesphericalharmonicdomainusingapseudointensityvector.EuropeanSignalProcessingConference.2010,442-446.)、球谐波域最大似然算法(见参考文献[4]S.TervoandA.Politis.Directionofarrivalestimationofreflectionsfromroomimpulseresponsesusingasphericalmicrophonearray.IEEE/ACMTransactionsonAudioSpeechandLanguageProcessing.2015,23(10):1539-1551.)等,根据球谐波域中导向矢量与频率关系解耦优点,这些算法可以很简便的扩展到宽带声源定向中,从而得到了人们的关注。但是在模式强度补偿过程中产生的噪声放大作用使得高阶特征波束易受噪声影响,特别是在低频段,阶数越高则更易受噪声影响,特别是对于噪声较大的时频点,其高阶特征波束中的噪声部分会超过乃至淹没信号部分,若贸然将其用于声源定向中将会产生错误定位结果,从而影响最终结果。而将受噪声影响较小的高阶特征波束用于声源定向中有助于提高定向方法的空间分辨率和定位精度。为了解决这一问题,本专利技术提出了一种根据每个时频点的噪声大小,自适应的将受噪声影响较小的可靠高阶特征波束筛选出来用于声源定向的方法,同时根据可靠特征波束的阶数进行时频点筛选,减小了定向算法的计算量,并且所提出的方法不受频带的限制。
技术实现思路
本专利技术的目的是针对上述现有技术中的不足,提供一种适用于球面麦克风阵列声源定向的球谐波阶数自适应选择方法,对噪声和混响具有鲁棒性,并且所提出的方法不受频带的限制,包含时频点筛选,减小了定向算法的计算量。为实现上述目的,本专利技术采用以下技术方案:一种适用于球面麦克风阵列声源定向的球谐波阶数自适应选择方法,包括如下步骤:步骤1,借助离散球傅里叶变换和模式强度补偿将声场信息由时频域变换成球谐波域的模式强度补偿特征波束形式,由声场的各阶特征波束计算声场的各阶特征波束的功率;步骤2,根据声场各阶间的特征波束功率相似性检测因子衡量各阶特征波束的功率相似性;步骤3,根据设定门限参数值对平均阶间特征波束功率相似性检测因子进行可靠阶数选择处理;步骤4,根据可靠阶数进行时频点掩蔽,利用满足条件的时频点对应的可靠阶声场特征波束进行声场定位,得出方位角估计值。所述步骤1的具体步骤为:将球面麦克风阵列采集的每个时频点的声场信息根据离散球傅里叶变换由时频域变换到球谐波域,并进行模式强度补偿,得到每个时频点的球谐波域特征波束根据语音信号的稀疏性,若时频点(t,k)只含有来自第l个声源的声场信息,则特征波束表示为:上式中,n为阶数,m为维度;t表示第t时间帧,k表示第k个频点;r为球面阵半径;vnm(t,k)为阵列传感器噪声的球傅里叶变换;sl(t,k)表示阵列采集的第l个声源的声场幅值;表示n阶m度球谐波函数,(·)*表示取共轭,下标l表示第l个声源,Ω=(θ,φ)为角度坐标;bn(kr)为第n阶模式强度;由于每阶bn(kr)的幅值不同,导致噪声对每阶的特征波束的影响不同,为综合衡量噪声由于模式强度补偿对n阶共2m+1项特征波束的影响,定义n阶特征波束的功率为:上式中,|·|表示二阶范数,Re(·)表示取实部;若无噪声,则各阶特征波束功率一致;而噪声必然存在,因此各阶特征波束功率不一致,尤其在低频段随着阶数n的增大模式强度bn(kr)的幅值越小,使得高阶特征波束功率大于低阶特征波束功率。所述步骤2中,若噪声越大则高阶特征波束功率与低阶特征波束功率之间的差异越大,为衡量噪声对各阶特征波束功率影响大小,定义第n阶和第n'阶的阶间特征波束功率相似性检测因子:上式中,表示的平方,表示的平方;若和相等时,则Rnn′(t,k)有最大值1;随着和差别的增大则Rnn′(t,k)的值越小,进而反映噪声的影响程度。所述步骤3中,用平均阶间特征波束功率相似性检测因子来综合衡量噪声对阶数小于等于Q阶的所有特征波束的影响程度:上式中,q和q'为阶数,表示组合数;根据设定门限参数值ηth选择满足条件的最大Q值作为该时频点的可靠阶数,若时频点(t,k)的噪声越小则该时频点的可靠阶数Q越大,说明可用的可靠特征波束越多。所述步骤4中,根据设定阶数门限参数值Nth将满足可靠阶数Q≥Nth条件的时频点筛选出来作为受噪声影响较小的可靠时频点,形成可靠时频点集Λ,用可靠时频点的可靠特征波束进行声源定向。本专利技术的有益效果为:相比现有技术,本专利技术对混响和噪声具有更高的鲁棒性,方位估计精度和空间分辨率也较高,尤其在低信噪比条件下,具体为:(1)由于模式强度补偿对噪声的放大作用,使得高阶特征波束易受噪声影响,阶数越高对噪声的鲁棒性越差,尤其在低频段。若将受噪声影响较大的高阶特征波束用于声源定向算法中,必然会产生较大的方位估计误差,从而影响最后的方位估计精度和空间分辨率。为此,本专利技术巧妙的通过平均阶间特征波束功率相似性检测因子来选取受噪声影响较小的可靠高阶特征波束进行定位,有效克服了噪声对高阶特征波束的影响带来的声源方位估计性能下降的问题。(2)本专利技术克服了球谐波域中利用特征波束进行声源定向的算法对噪声鲁棒性较差的缺陷,一方面在信噪比降低时也能保持较高的定向精度和空间分辨率,另一方面通过可靠特征波束和时频点的筛选,减小了算法的计算量。(3)相比现有的方法,本专利技术适用于球谐波域利用特征波束定向的算法,对噪声具有较高的鲁棒性,在混响噪声环境下的方位本文档来自技高网
...

【技术保护点】
1.一种适用于球面麦克风阵列声源定向的球谐波阶数自适应选择方法,其特征在于:包括如下步骤:步骤1,借助离散球傅里叶变换和模式强度补偿将声场信息由时频域变换成球谐波域的模式强度补偿特征波束形式,由声场的各阶特征波束计算声场的各阶特征波束的功率;步骤2,根据声场各阶间特征波束功率相似性检测因子衡量各阶特征波束的功率相似性;步骤3,根据设定门限参数值对平均阶间特征波束功率相似性检测因子进行可靠特征波束选择处理;步骤4,根据可靠阶数进行时频点掩蔽,利用满足条件的时频点对应的可靠阶声场特征波束进行声场定位,得出方位角估计值。

【技术特征摘要】
1.一种适用于球面麦克风阵列声源定向的球谐波阶数自适应选择方法,其特征在于:包括如下步骤:步骤1,借助离散球傅里叶变换和模式强度补偿将声场信息由时频域变换成球谐波域的模式强度补偿特征波束形式,由声场的各阶特征波束计算声场的各阶特征波束的功率;步骤2,根据声场各阶间特征波束功率相似性检测因子衡量各阶特征波束的功率相似性;步骤3,根据设定门限参数值对平均阶间特征波束功率相似性检测因子进行可靠特征波束选择处理;步骤4,根据可靠阶数进行时频点掩蔽,利用满足条件的时频点对应的可靠阶声场特征波束进行声场定位,得出方位角估计值。2.如权利要求1所述的适用于球面麦克风阵列声源定向的球谐波阶数自适应选择方法,其特征在于:所述步骤1的具体步骤为:将球面麦克风阵列采集的每个时频点的声场信息根据离散球傅里叶变换由时频域变换到球谐波域,并进行模式强度补偿,得到每个时频点的球谐波域特征波束根据语音信号的稀疏性,若时频点(t,k)只含有来自第l个声源的声场信息,则特征波束表示为:上式中,n为阶数,m为维度;t表示第t时间帧,k表示第k个频点;r为球面阵半径;vnm(t,k)为阵列传感器噪声的球傅里叶变换;sl(t,k)表示阵列采集的第l个声源的声场幅值;表示n阶m度球谐波函数,(·)*表示取共轭,下标l表示第l个声源,Ω=(θ,φ)为角度坐标;bn(kr)为第n阶模式强度;由于每阶bn(kr)的幅值不同,导致每阶的受到的噪声影响不同,为综合衡量噪声由于模式强度补偿对n阶共2m+1项特征波束的影响,定义n阶特征...

【专利技术属性】
技术研发人员:高伟霞陈华伟
申请(专利权)人:南京航空航天大学
类型:发明
国别省市:江苏,32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1