一种基于Gammatone滤波器和直方图的多声源定位方法技术

技术编号：21889478 阅读：25 留言：0更新日期：2019-08-17 13:37

本发明专利技术公开了一种基于Gammatone滤波器和直方图的多声源定位方法，用传声器阵列采集声源信号，通过Gammatone滤波器组获得子带信号，做分帧和加窗处理，转换至频域，计算可控响应功率值，绘制直方图，统计主峰方位和次峰方位的数量，估计主次声源方位。本发明专利技术在频域相互交叠而不分隔，避免相位缠绕，多个频率分量的空间谱的平均效应抑制了旁瓣，使主瓣突出，阵元间距不严格限于半波长，无需多帧信息，也无需假定声源在连续多帧内静止不动，实现了实时多声源定位，用直方图融合同一帧内的所有子带信息，作为方位估计的判决量，简单易操作，计算量低，显著提高了主声源和次声源的定位成功率，尤其次声源的定位成功率提升更为明显。

A Multi-Source Location Method Based on Gammatone Filter and Histogram

全部详细技术资料下载

【技术实现步骤摘要】
一种基于Gammatone滤波器和直方图的多声源定位方法
本专利技术涉及信号处理
，具体涉及一种多声源定位方法。
技术介绍
小型传声器阵列通常适用于办公室、会议室、智能机器人等应用场所，相位变换加权的可控响应功率SRP-PHAT声源定位算法只需一帧信号即可实现定位，但在多声源情况下，传统SRP-PHAT算法难以克服声源之间的干扰，最强声源的谱峰常常掩盖其它较弱声源的谱峰，导致难以找到多个声源，定位成功率较低，而小型传声器阵列的空间分辨率较低，使得实现多声源定位更为困难，多帧统计的方法虽然可以实现多声源定位，但是这类方法必须假定声源在连续多帧时间内静止不动，实时性较差。
技术实现思路
本专利技术为了解决现有技术存在的问题，提出了一种基于Gammatone滤波器和直方图的多声源定位方法，为了实现上述目的，本专利技术采用了以下技术方案。用传声器作为阵元，组成传声器阵列，采集声源信号，传声器的数量为U，序号为u，u＝1...U，第u个传声器采集的的声源信号为su(t)。用Gammatone滤波器产生脉冲响应，组成滤波器组，滤波器的数量为I，序号为i，i＝1...I，第i个Gammatone滤波器产生的脉冲响应函数为gi(t)，Gammatone滤波器的增益为A，阶数为m，衰减因子为bi，中心频率为fi，相位为阶跃函数为u(t)，产生的脉冲响应函数为通过Gammatone滤波器组产生脉冲响应。将第u个传声器采集的的声源信号su(t)通过第i个Gammatone滤波器产生的脉冲响应函数gi(t)，获得第i个子带的时域信号xu(i,t)，子带信号为xu(i,t)＝su...

【技术保护点】
1.一种基于Gammatone滤波器和直方图的多声源定位方法，其特征在于，包括：用传声器阵列采集声源信号，通过Gammatone滤波器组产生脉冲响应，在时域将声源信号分割为子带信号；将每个子带信号分帧和加窗作时频转换获得时频单元信号，计算每个时频单元信号的可控响应功率值，确认可控响应功率值的主峰方位和次峰方位；用直方图统计主峰方位和次峰方位的数量，根据数量最多的主峰方位和次峰方位估计主次声源方位。

【技术特征摘要】
1.一种基于Gammatone滤波器和直方图的多声源定位方法，其特征在于，包括：用传声器阵列采集声源信号，通过Gammatone滤波器组产生脉冲响应，在时域将声源信号分割为子带信号；将每个子带信号分帧和加窗作时频转换获得时频单元信号，计算每个时频单元信号的可控响应功率值，确认可控响应功率值的主峰方位和次峰方位；用直方图统计主峰方位和次峰方位的数量，根据数量最多的主峰方位和次峰方位估计主次声源方位。2.根据权利要求1所述的基于Gammatone滤波器和直方图的多声源定位方法，其特征在于，所述的用传声器阵列采集声源信号，包括：用传声器作为阵元，组成阵列采集声源信号，传声器的数量为U，序号为u，u＝1...U，第u个传声器采集的的声源信号为su(t)。3.根据权利要求2所述的基于Gammatone滤波器和直方图的多声源定位方法，其特征在于，所述的通过Gammatone滤波器组产生脉冲响应，包括：用Gammatone滤波器产生脉冲响应，组成滤波器组，滤波器的数量为I，序号为i，i＝1...I，第i个Gammatone滤波器产生的脉冲响应函数为gi(t)；Gammatone滤波器的增益为A，阶数为m，衰减因子为bi，中心频率为fi，相位为阶跃函数为u(t)，产生的的脉冲响应函数为4.根据权利要求3所述的基于Gammatone滤波器和直方图的多声源定位方法，其特征在于，所述的在时域将声源信号分割为子带信号，包括：将第u个传声器采集的的声源信号su(t)通过第i个Gammatone滤波器产生的脉冲响应函数gi(t)，获得第i个子带的时域信号xu(i,t)，子带信号为xu(i,t)＝su(t)*gi(t)。5.根据权利要求4所述的基于Gammatone滤波器和直方图的多声源定位方法，其特征在于，所述的将每个子带信号分帧和加窗作时频转换获得时频单元信号，包括：在时域将子带信号xu(i,t)分割为单帧信号，单帧信号的数量为L，长度为N，序号为l，l＝1...L，单帧内的采样序号为n，0≤n＜N，第l个单帧第n个采样信号为xu(i,lN+n)；用窗信号对xu(i,lN+n)进行加窗处理，得到xu(i,l,n)＝wH(n)xu(i,lN+n)，xu(i,l,n)为第u个传声器第i个子带第l个单帧第n个采样信号的加窗信号；用离散傅里叶变换函数DFT对xu(i,l,n)作时频转换，变换的长度为...

【专利技术属性】
技术研发人员：赵小燕，陈书文，刘鸿斌，
申请(专利权)人：南京林业大学，江苏第二师范学院江苏省教育科学研究院，
类型：发明
国别省市：江苏,32

全部详细技术资料下载我是这个专利的主人