一种基于声传递函数的声源定位方法技术

技术编号：16310644 阅读：52 留言：0更新日期：2017-09-29 04:14

本发明专利技术公开了一种基于声传递函数的声源定位方法。本方法为：1)为每一声源设置一波段；采用麦克风阵列接收各方位的声源的记录信号；2)对于每个方位的声源，根据该声源到麦克风阵列中各麦克风的传递函数估计所述记录信号中各频点的信噪比，然后将信噪比二值化，生成对应声源的频域二值掩模；3)对于每个方位的声源，根据该声源的频域二值掩模滤除所述记录信号中信噪比小于设定阈值H的频点，然后使用该声源到麦克风阵列中各麦克风的传递函数对记录信号做频域逆滤波；4)计算逆滤波结果的通道间相似性，然后根据通道间相似性的计算结果估计声源位置定位目标声源。本发明专利技术提高了定位方法的鲁棒性。

A method of sound source localization based on acoustic transfer function

The invention discloses a method for locating a sound source based on an acoustic transfer function. The method is as follows: 1) set up a band for each sound source; recording audio signal source based on microphone array receiving range; 2) for each sound source range, according to the sound source to the transfer function of the microphone array in the estimation of the record of the frequency in the signal SNR. Then the value of more than two signal-to-noise, generate the corresponding sound source frequency value of two mask; 3) for each range of sound source, the sound source frequency according to the value of two frequency mask filters the recorded signal SNR is less than the threshold of H, and then use the transfer function of the sound source to the microphone the microphone array in the column of recording signal frequency domain inverse filter; 4) to calculate the inverse filtering results of channel similarity, then according to the similarity between the calculation results of channel estimate the location of the sound source positioning target sound source. The invention improves the robustness of the positioning method.

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术属于信号处理
，涉及麦克风阵列和声源定位，具体涉及一种基于声传递函数的声源定位方法。
技术介绍
声源定位在许多领域有重要的应用，比如自动语音识别、机器人以及计算听觉场景分析等。对人而言，即使在复杂环境中，听者依然能顺利定位目标声源，其主要利用的定位线索有双耳时间差(InterauralTimeDifference，ITD)和双耳强度差(InterauralLevelDifference，ILD)。研究人员将上述定位线索应用于麦克风阵列的声源的定位问题中，提出了许多声源定位方法。一些定位方法仅利用时间定位线索。这类方法首先估计由声源发出的信号到达各麦克风的时间差，即到达时间差(TimeDifferenceOfArrival，TDOA)，之后将TDOA信息映射到空间位置。TDOA可通过GCC(generalizedcross-correlation)、GCC-PHAT(generalizedcross-correlationphasedtransform)、SRP(steeredresponsepower)以及SRP-PHAT-(steeredresponsepowerphasedtransform)等方法计算得到。TDOA与空间位置的映射关系则由麦克风阵列的位置、形状等因素决定。也有一些研究人员使用时间线索以及强度线索共同定位声源，Raspaud等人建立了通道间时间差和强度差与声源位置之间的参数模型，根据估计得到的时间差和强度差确定目标声源的位置。传递函数刻画了包含了时间差、强度差等定位线索，因此一些研究人员试图利用传递函数实现声源定位。K...
一种基于声传递函数的声源定位方法

【技术保护点】
一种基于声传递函数的声源定位方法，其步骤为：1)为每一声源设置一波段；采用麦克风阵列接收各方位的声源的记录信号；2)对于每个方位的声源，根据该声源到麦克风阵列中各麦克风的传递函数估计所述记录信号中各频点的信噪比，然后将信噪比二值化，生成对应声源的频域二值掩模；3)对于每个方位的声源，根据该声源的频域二值掩模滤除所述记录信号中信噪比小于设定阈值H的频点，然后使用该声源到麦克风阵列中各麦克风的传递函数对记录信号做频域逆滤波；4)计算逆滤波结果的通道间相似性，然后根据通道间相似性的计算结果估计声源位置定位目标声源。

【技术特征摘要】
1.一种基于声传递函数的声源定位方法，其步骤为：1)为每一声源设置一波段；采用麦克风阵列接收各方位的声源的记录信号；2)对于每个方位的声源，根据该声源到麦克风阵列中各麦克风的传递函数估计所述记录信号中各频点的信噪比，然后将信噪比二值化，生成对应声源的频域二值掩模；3)对于每个方位的声源，根据该声源的频域二值掩模滤除所述记录信号中信噪比小于设定阈值H的频点，然后使用该声源到麦克风阵列中各麦克风的传递函数对记录信号做频域逆滤波；4)计算逆滤波结果的通道间相似性，然后根据通道间相似性的计算结果估计声源位置定位目标声源。2.如权利要求1所述的方法，其特征在于，生成所述频域二值掩模的方法为：对于一声源Ps，将该声源Ps到各麦克风的传递函数做最...

【专利技术属性】
技术研发人员：曲天书，吴玺宏，宋涛，
申请(专利权)人：北京大学，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人