一种时频-空域联合加权的圆谐域伪声强声源定位方法技术

技术编号:18971401 阅读:107 留言:0更新日期:2018-09-19 03:13
本发明专利技术公开了一种时频‑空域联合加权的圆谐域伪声强声源定位方法,在该方法中,用先设计的六元圆形麦克风阵列采集语音信号;考虑到语音信号具有短时平稳特性,将采集到的语音信号变换到时频域,利用时频域PHAT加权进行滤波处理,降低噪声和混响对定位性能的影响;利用归一化后零阶特征波束、一阶特征波束,并由时频域PHAT加权的圆谐伪声强声源定位方法进行粗估计角度;利用粗估计角度构造空域波束指向性函数,得到归一化后时频域PHAT加权联合指向性加权零阶特征波束,再利用时频‑空域联合加权的圆谐域伪声强方法求解得到精确声源估计角度。

A time frequency spatial joint weighted circular harmonic domain pseudo sound source localization method

The invention discloses a method for locating a circular harmonic-domain pseudo-sound source weighted jointly by time-frequency and space-domain. In this method, a six-element circular microphone array is designed to collect speech signals; considering the short-time stationary characteristics of the speech signals, the collected speech signals are transformed into the time-frequency domain, and the time-frequency domain PHAT weighted advance is used. The influence of noise and reverberation on localization performance is reduced by filtering. The normalized zero-order characteristic beams and first-order characteristic beams are used to estimate the angle roughly, and the normalized time-frequency domain PHAT weighted circular harmonic pseudo-sound source localization method is used to estimate the angle roughly. The weighted joint directivity weighted zero-order characteristic beams are used to obtain the accurate source estimation angle by using the time-frequency_space joint weighted circular harmonic pseudo-sound intensity method.

【技术实现步骤摘要】
一种时频-空域联合加权的圆谐域伪声强声源定位方法
本专利技术涉及声源定位
,特别是一种时频-空域联合加权的圆谐域伪声强声源定位方法。
技术介绍
在音频与语音信号处理中,采用麦克风阵列的声源定位技术是中的一个重要研究方向,线性麦克风阵列因其简单且易于理解、实现已经在声源定位中得到广泛的应用,如声呐(见文献:王燕,邹男,梁国龙.强多途环境下水听器阵列位置近场有源校正方法[J].物理学报,2015,64(2):0243041-10)、视频电话会议(见文献:BarbaraRauch,FriedrichFaubel,DietrichKlakow.Ananalysisofnonstationaryvarianceestimatesinthemaximumnegentropybeamformer[C].JointWorkshoponHands-freeSpeechCommunicationandMicrophoneArrays,2011:201-206)、人工智能(见文献:梁瑞宇,周健,王青云,奚吉,赵力.仿人耳听觉的助听器双耳声源定位算法.声学学报,2015;40(3):446-454)、地震研究(见文献:吴晓平,顾治华,舒红波,冯海林.一种线性最小二乘法的声源目标精确定位方法.声学学报,2016;41(1):87-93)、声源定位与追踪(见文献:DespoinaPavlidi,AnthonyGriffin,MatthieuPuigt,AthanasiosMouchtaris.Real-TimeMultipleSoundSourceLocalizationandCountingUsingaCircularMicrophoneArray.IEEETransactionsonAudio,Speech,andLanguageProcessing,2013;21(10):2193-2206)、监控系统(见文献:林志斌,徐柏龄.基于传声器阵列的声源定位.电声技术,2004;28(5):19-23)等。目前常用的声源定位的方法主要有三类:基于可控波束形成器的声源定位法,主要是将各阵元采集到的信号加权求和,通过调控权值(权值取决于阵元信号的相位延迟,主要利用波达方向等方法进行调控),使阵列输出信号功率最大,从而进行声源定位;基于高分辨率谱估计的声源定位法,主要运用最小方差估计法、子空间法,如MUSIC法、ESPRIT法等进行声源定位;基于到达时间差(TDOA)的声源定位法,主要结合自适应、广义互相关等进行声源定位。(见文献:居太亮.基于麦克风阵列声源定位算法研究[D].博士学位论文(成都:电子科技大学),2006)。现有定位技术中,主要是利用一维线性阵列、二维十字阵列进行声源定位,与圆形麦克风阵列相比,这些阵列由于自身结构所限制,在二维空间中的定位角度范围只能在0~180°,然而圆形麦克风阵列因其自身优势其定位角度范围在0~360°,能进行全方位声场分析。另外,在噪声与混响同时干扰下,现有声源定位方法的性能的提升往往以增加麦克风个数或阵列尺寸为代价,但是定位精确度提高甚微。如何解决现有技术的不足已成为声源定位领域亟待解决的一大难题。
技术实现思路
本专利技术所要解决的技术问题是克服现有技术的不足,而提供一种时频-空域联合加权的圆谐域伪声强声源定位方法,本专利技术方法实时、有效地解决声源定位问题,在一定程度上降低了噪声、混响等对语音信号的干扰,提高了定位的精确性和鲁棒性。本专利技术为解决上述技术问题采用以下技术方案:根据本专利技术提出的一种适用于圆形麦克风阵列的时频-空域联合加权的圆谐域伪声强声源定位方法,具体如下:构建六元圆形麦克风阵列,采用构建的六元圆形麦克风阵列采集语音信号;将采集到的语音信号变换到时频域,利用时频域PHAT加权进行滤波处理;利用归一化后零阶特征波束、一阶特征波束,并由时频域PHAT加权的圆谐伪声强声源定位方法进行粗估计角度;最后用粗估计角度构造空域波束指向性函数,得到归一化后时频域PHAT加权联合指向性加权零阶特征波束,并利用时频-空域联合加权的圆谐域伪声强方法求解得到精确声源估计角度。作为本专利技术所述的一种适用于圆形麦克风阵列的时频-空域联合加权的圆谐域伪声强声源定位方法进一步优化方案,包括如下步骤:步骤一:采用Q个相同的全向性麦克风等间距的排列成半径为r的圆形麦克风阵列;步骤二:对麦克风阵列采集到的声压信号Pq(t,ω)进行短时傅里叶变换,然后利用时频域PHAT加权对短时傅里叶变换后的声压信号进行预滤波,得到时频域PHAT加权后的n阶特征波束F′n(t,ω);具体如下:(201)、对声源发出的信号s(t)进行采样,得到第q个麦克风采集到的声压信号其中,hq(t)表示声源到第q个麦克风间的脉冲响应,nq(t)表示第q个麦克风接收到的加性噪声信号,符号表示线性卷积运算,q=1,…,Q;(202)、将(201)中采集到的声压信号pq(t)变换到时频域处理,经短时傅里叶变换得Pq(t,ω)=Hq(t,ω)·S(t,ω)+Nq(t,ω)其中,Pq(t,ω)、S(t,ω)、Hq(t,ω)以及Nq(t,ω)分别表示麦克风接收声压信号pq(t)、声源信号s(t)、脉冲响应hq(t)和加性噪声信号nq(t)的短时傅里叶变换,(t,ω)表示时频率单元,t表示时间,ω表示频率;(203)、利用PHAT加权对(202)中经短时傅里叶变换后的声压信号Pq(t,ω)进行预滤波,得到经过时频域PHAT加权后的n阶特征波束其中,n表示阶数,表示第1个麦克风与第q个麦克风之间按逆时针方向的夹角,表示虚数单位,e表示自然指数;步骤三:对步骤二中的n阶特征波束F′n(t,ω)进行归一化处理,得到归一化后时频域PHAT加权的零阶特征波束D′0(t,ω)、加权的一阶特征波束的两个正交分量D′x(t,ω)和D′y(t,ω),然后用时频域PHAT加权的圆谐伪声强声源定位方法求解得到粗估计角度具体如下:(301)、对步骤二中的n阶特征波束F′n(t,ω)进行归一化处理,取阶数n=0时得到归一化后时频域PHAT加权的零阶特征波束其中,b0(t,ω)表示不同时频点的0阶贝塞尔函数;取阶数n=1时特征波束x轴和y轴的两个正交分量得到归一化后时频域PHAT加权的一阶特征波束的两个正交分量D′x(t,ω)和Dy′(t,ω),其中,b1(t,ω)表示不同时频点的1阶贝塞尔函数,γx,1=ei·1·0表示一阶特征波束的x轴旋转系数,表示一阶特征波束的y轴旋转系数,F′x(t,ω)表示1阶特征波束x轴分量,F′y(t,ω)表示1阶特征波束y轴分量;(302)、将(301)中得到加权的零阶特征波束D′0(t,ω)、加权的一阶特征波束的两个正交分量D′x(t,ω)和D′y(t,ω),采用时频域PHAT加权的圆谐伪声强声源定位方法求解得到粗估计角度其中,tα和ωβ表示第α个时间单元和第β个频率单元,*表示取共轭运算,Re表示取实部运算,arctan表示反正切运算,I′x(tα,ωβ)和I′y(tα,ωβ)分别表示时频域PHAT加权后各时频点处的瞬时伪声强的x轴分量和y轴分量;步骤四:利用步骤三中求得的粗估计角度构造空域波束指向性函数结合步骤三中求得的归一化后时频域PHAT加权本文档来自技高网
...

【技术保护点】
1.一种适用于圆形麦克风阵列的时频‑空域联合加权的圆谐域伪声强声源定位方法,其特征在于,具体如下:构建六元圆形麦克风阵列,采用构建的六元圆形麦克风阵列采集语音信号;将采集到的语音信号变换到时频域,利用时频域PHAT加权进行滤波处理;利用归一化后零阶特征波束、一阶特征波束,并由时频域PHAT加权的圆谐伪声强声源定位方法进行粗估计角度;最后用粗估计角度构造空域波束指向性函数,得到归一化后时频域PHAT加权联合指向性加权零阶特征波束,并利用时频‑空域联合加权的圆谐域伪声强方法求解得到精确声源估计角度。

【技术特征摘要】
1.一种适用于圆形麦克风阵列的时频-空域联合加权的圆谐域伪声强声源定位方法,其特征在于,具体如下:构建六元圆形麦克风阵列,采用构建的六元圆形麦克风阵列采集语音信号;将采集到的语音信号变换到时频域,利用时频域PHAT加权进行滤波处理;利用归一化后零阶特征波束、一阶特征波束,并由时频域PHAT加权的圆谐伪声强声源定位方法进行粗估计角度;最后用粗估计角度构造空域波束指向性函数,得到归一化后时频域PHAT加权联合指向性加权零阶特征波束,并利用时频-空域联合加权的圆谐域伪声强方法求解得到精确声源估计角度。2.根据权利要求1所述的一种适用于圆形麦克风阵列的时频-空域联合加权的圆谐域伪声强声源定位方法,其特征在于,包括如下步骤:步骤一:采用Q个相同的全向性麦克风等间距的排列成半径为r的圆形麦克风阵列;步骤二:对麦克风阵列采集到的声压信号Pq(t,ω)进行短时傅里叶变换,然后利用时频域PHAT加权对短时傅里叶变换后的声压信号进行预滤波,得到时频域PHAT加权后的n阶特征波束Fn′(t,ω);具体如下:(201)、对声源发出的信号s(t)进行采样,得到第q个麦克风采集到的声压信号其中,hq(t)表示声源到第q个麦克风间的脉冲响应,nq(t)表示第q个麦克风接收到的加性噪声信号,符号表示线性卷积运算,q=1,…,Q;(202)、将(201)中采集到的声压信号pq(t)变换到时频域处理,经短时傅里叶变换得Pq(t,ω)=Hq(t,ω)·S(t,ω)+Nq(t,ω)其中,Pq(t,ω)、S(t,ω)、Hq(t,ω)以及Nq(t,ω)分别表示麦克风接收声压信号pq(t)、声源信号s(t)、脉冲响应hq(t)和加性噪声信号nq(t)的短时傅里叶变换,(t,ω)表示时频率单元,t表示时间,ω表示频率;(203)、利用PHAT加权对(202)中经短时傅里叶变换后的声压信号Pq(t,ω)进行预滤波,得到经过时频域PHAT加权后的n阶特征波束其中,n表示阶数,表示第1个麦克风与第q个麦克风之间按逆时针方向的夹角,表示虚数单位,e表示自然指数;步骤三:对步骤二中的n阶特征波束Fn′(t,ω)进行归一化处理,得到归一化后时频域PHAT加权的零阶特征波束D0′(t,ω)、加权的一阶特征波束的两个正交分量Dx′(t,ω)和Dy′(t,ω),然后用时频域PHAT加权的圆谐伪声强声源定位方法求解得到粗估计角度具体如下:(301)、对步骤二中的n阶特征波束Fn′(t,ω)进行归一化处理,取阶数n=0时得到归一化后时频域PHAT加权的零阶特征波束其中,b0(t,ω)表示不同时频点的0阶贝塞尔函数;取阶数n=1时特征波束x轴和y轴的...

【专利技术属性】
技术研发人员:宋宫琨琨陈华伟吕中兴张普芬
申请(专利权)人:南京航空航天大学
类型:发明
国别省市:江苏,32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1