The invention discloses a method for locating a circular harmonic-domain pseudo-sound source weighted jointly by time-frequency and space-domain. In this method, a six-element circular microphone array is designed to collect speech signals; considering the short-time stationary characteristics of the speech signals, the collected speech signals are transformed into the time-frequency domain, and the time-frequency domain PHAT weighted advance is used. The influence of noise and reverberation on localization performance is reduced by filtering. The normalized zero-order characteristic beams and first-order characteristic beams are used to estimate the angle roughly, and the normalized time-frequency domain PHAT weighted circular harmonic pseudo-sound source localization method is used to estimate the angle roughly. The weighted joint directivity weighted zero-order characteristic beams are used to obtain the accurate source estimation angle by using the time-frequency_space joint weighted circular harmonic pseudo-sound intensity method.
【技术实现步骤摘要】
一种时频-空域联合加权的圆谐域伪声强声源定位方法
本专利技术涉及声源定位
,特别是一种时频-空域联合加权的圆谐域伪声强声源定位方法。
技术介绍
在音频与语音信号处理中,采用麦克风阵列的声源定位技术是中的一个重要研究方向,线性麦克风阵列因其简单且易于理解、实现已经在声源定位中得到广泛的应用,如声呐(见文献:王燕,邹男,梁国龙.强多途环境下水听器阵列位置近场有源校正方法[J].物理学报,2015,64(2):0243041-10)、视频电话会议(见文献:BarbaraRauch,FriedrichFaubel,DietrichKlakow.Ananalysisofnonstationaryvarianceestimatesinthemaximumnegentropybeamformer[C].JointWorkshoponHands-freeSpeechCommunicationandMicrophoneArrays,2011:201-206)、人工智能(见文献:梁瑞宇,周健,王青云,奚吉,赵力.仿人耳听觉的助听器双耳声源定位算法.声学学报,2015;40(3):446-454)、地震研究(见文献:吴晓平,顾治华,舒红波,冯海林.一种线性最小二乘法的声源目标精确定位方法.声学学报,2016;41(1):87-93)、声源定位与追踪(见文献:DespoinaPavlidi,AnthonyGriffin,MatthieuPuigt,AthanasiosMouchtaris.Real-TimeMultipleSoundSourceLocalizationand ...
【技术保护点】
1.一种适用于圆形麦克风阵列的时频‑空域联合加权的圆谐域伪声强声源定位方法,其特征在于,具体如下:构建六元圆形麦克风阵列,采用构建的六元圆形麦克风阵列采集语音信号;将采集到的语音信号变换到时频域,利用时频域PHAT加权进行滤波处理;利用归一化后零阶特征波束、一阶特征波束,并由时频域PHAT加权的圆谐伪声强声源定位方法进行粗估计角度;最后用粗估计角度构造空域波束指向性函数,得到归一化后时频域PHAT加权联合指向性加权零阶特征波束,并利用时频‑空域联合加权的圆谐域伪声强方法求解得到精确声源估计角度。
【技术特征摘要】
1.一种适用于圆形麦克风阵列的时频-空域联合加权的圆谐域伪声强声源定位方法,其特征在于,具体如下:构建六元圆形麦克风阵列,采用构建的六元圆形麦克风阵列采集语音信号;将采集到的语音信号变换到时频域,利用时频域PHAT加权进行滤波处理;利用归一化后零阶特征波束、一阶特征波束,并由时频域PHAT加权的圆谐伪声强声源定位方法进行粗估计角度;最后用粗估计角度构造空域波束指向性函数,得到归一化后时频域PHAT加权联合指向性加权零阶特征波束,并利用时频-空域联合加权的圆谐域伪声强方法求解得到精确声源估计角度。2.根据权利要求1所述的一种适用于圆形麦克风阵列的时频-空域联合加权的圆谐域伪声强声源定位方法,其特征在于,包括如下步骤:步骤一:采用Q个相同的全向性麦克风等间距的排列成半径为r的圆形麦克风阵列;步骤二:对麦克风阵列采集到的声压信号Pq(t,ω)进行短时傅里叶变换,然后利用时频域PHAT加权对短时傅里叶变换后的声压信号进行预滤波,得到时频域PHAT加权后的n阶特征波束Fn′(t,ω);具体如下:(201)、对声源发出的信号s(t)进行采样,得到第q个麦克风采集到的声压信号其中,hq(t)表示声源到第q个麦克风间的脉冲响应,nq(t)表示第q个麦克风接收到的加性噪声信号,符号表示线性卷积运算,q=1,…,Q;(202)、将(201)中采集到的声压信号pq(t)变换到时频域处理,经短时傅里叶变换得Pq(t,ω)=Hq(t,ω)·S(t,ω)+Nq(t,ω)其中,Pq(t,ω)、S(t,ω)、Hq(t,ω)以及Nq(t,ω)分别表示麦克风接收声压信号pq(t)、声源信号s(t)、脉冲响应hq(t)和加性噪声信号nq(t)的短时傅里叶变换,(t,ω)表示时频率单元,t表示时间,ω表示频率;(203)、利用PHAT加权对(202)中经短时傅里叶变换后的声压信号Pq(t,ω)进行预滤波,得到经过时频域PHAT加权后的n阶特征波束其中,n表示阶数,表示第1个麦克风与第q个麦克风之间按逆时针方向的夹角,表示虚数单位,e表示自然指数;步骤三:对步骤二中的n阶特征波束Fn′(t,ω)进行归一化处理,得到归一化后时频域PHAT加权的零阶特征波束D0′(t,ω)、加权的一阶特征波束的两个正交分量Dx′(t,ω)和Dy′(t,ω),然后用时频域PHAT加权的圆谐伪声强声源定位方法求解得到粗估计角度具体如下:(301)、对步骤二中的n阶特征波束Fn′(t,ω)进行归一化处理,取阶数n=0时得到归一化后时频域PHAT加权的零阶特征波束其中,b0(t,ω)表示不同时频点的0阶贝塞尔函数;取阶数n=1时特征波束x轴和y轴的...
【专利技术属性】
技术研发人员:宋宫琨琨,陈华伟,吕中兴,张普芬,
申请(专利权)人:南京航空航天大学,
类型:发明
国别省市:江苏,32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。