一种基于Gammatone滤波器和直方图的多声源定位方法技术

技术编号:21889478 阅读:25 留言:0更新日期:2019-08-17 13:37
本发明专利技术公开了一种基于Gammatone滤波器和直方图的多声源定位方法,用传声器阵列采集声源信号,通过Gammatone滤波器组获得子带信号,做分帧和加窗处理,转换至频域,计算可控响应功率值,绘制直方图,统计主峰方位和次峰方位的数量,估计主次声源方位。本发明专利技术在频域相互交叠而不分隔,避免相位缠绕,多个频率分量的空间谱的平均效应抑制了旁瓣,使主瓣突出,阵元间距不严格限于半波长,无需多帧信息,也无需假定声源在连续多帧内静止不动,实现了实时多声源定位,用直方图融合同一帧内的所有子带信息,作为方位估计的判决量,简单易操作,计算量低,显著提高了主声源和次声源的定位成功率,尤其次声源的定位成功率提升更为明显。

A Multi-Source Location Method Based on Gammatone Filter and Histogram

【技术实现步骤摘要】
一种基于Gammatone滤波器和直方图的多声源定位方法
本专利技术涉及信号处理
,具体涉及一种多声源定位方法。
技术介绍
小型传声器阵列通常适用于办公室、会议室、智能机器人等应用场所,相位变换加权的可控响应功率SRP-PHAT声源定位算法只需一帧信号即可实现定位,但在多声源情况下,传统SRP-PHAT算法难以克服声源之间的干扰,最强声源的谱峰常常掩盖其它较弱声源的谱峰,导致难以找到多个声源,定位成功率较低,而小型传声器阵列的空间分辨率较低,使得实现多声源定位更为困难,多帧统计的方法虽然可以实现多声源定位,但是这类方法必须假定声源在连续多帧时间内静止不动,实时性较差。
技术实现思路
本专利技术为了解决现有技术存在的问题,提出了一种基于Gammatone滤波器和直方图的多声源定位方法,为了实现上述目的,本专利技术采用了以下技术方案。用传声器作为阵元,组成传声器阵列,采集声源信号,传声器的数量为U,序号为u,u=1...U,第u个传声器采集的的声源信号为su(t)。用Gammatone滤波器产生脉冲响应,组成滤波器组,滤波器的数量为I,序号为i,i=1...I,第i个Gammatone滤波器产生的脉冲响应函数为gi(t),Gammatone滤波器的增益为A,阶数为m,衰减因子为bi,中心频率为fi,相位为阶跃函数为u(t),产生的脉冲响应函数为通过Gammatone滤波器组产生脉冲响应。将第u个传声器采集的的声源信号su(t)通过第i个Gammatone滤波器产生的脉冲响应函数gi(t),获得第i个子带的时域信号xu(i,t),子带信号为xu(i,t)=su(t)*gi(t),在时域将声源信号分割为子带信号。在时域将子带信号xu(i,t)分割为单帧信号,单帧信号的数量为L,长度为N,序号为l,l=1...L,单帧内的采样序号为n,0≤n<N,第l个单帧第n个采样信号为xu(i,lN+n),将每个子带信号分帧。将分帧信号作加窗处理,用窗信号对xu(i,lN+n)进行加窗处理,得到xu(i,l,n)=wH(n)xu(i,lN+n),xu(i,l,n)为第u个传声器第i个子带第l个单帧第n个采样信号的加窗信号。用离散傅里叶变换函数DFT对xu(i,l,n)作时频转换,变换的长度为K,K=2N,频点为k,0≤k<K,得到Xu(i,l,k)为xu(i,l,n)的频域信号,将Xu(i,l,k)作为时频单元信号。计算候选方位到第v个阵元的导引时延τv0(r),候选方位的声源位置为r,阵列中心的位置为r0,第v个阵元的位置为rv,空气中的声速为c,候选方位到阵列中心的声传播时延为τ0(r),候选方位到第v个阵元的声传播时延为τv(r),候选方位到第v个阵元的导引时延计算阵列的PHAT可控响应输出YPHAT(i,l,k,r),信号采样率为fs,将τv0(r)和Xu(i,l,k)代入,得到计算每个时频单元信号的可控响应功率值,由YPHAT(i,l,k,r)计算第i个子带第l个单帧的时频单元信号在候选方位r的可控响应功率值确认可控响应功率值的主峰方位和次峰方位,将P(i,l,r)的最大值确认为主峰,次最大值确认为次峰,主峰对应的rpeak1(i,l)为第i个子带第l个单帧的时频单元信号的可控响应功率最大值的方位,次峰对应的rpeak2(i,l)为第i个子带第l个单帧的时频单元信号的可控响应功率次最大值的方位。用直方图统计主峰方位和次峰方位的数量,对第l个单帧所有子带的时频单元信号对应的方位rpeak1(i,l)作直方图,统计每个方位的数量,数量最多的方位为若存在数量次多的方位,则数量次多的方位为若rpeak1(i,l)中不存在数量次多的方位则对第l个单帧所有子带的时频单元信号对应的方位rpeak2(i,l)作直方图,统计每个方位的数量,数量最多的方位为将估计为第l个单帧的主声源方位,将估计为第l个单帧的次声源方位,所作直方图的组距为5°,组数为72。本专利技术利用Gammatone滤波器组分解信号子带,在时频单元内计算可控响应功率,提取声源方位信息,用直方图融合同一帧内的所有子带信息,作为方位估计的判决量,实现多声源定位;分解的每个子带在频域相互交叠而不分隔,避免相位缠绕,多个频率分量的空间谱的平均效应抑制了旁瓣,使主瓣突出,阵元间距不严格限于半波长;直方图简单易操作,计算量低;无需多帧信息,也无需假定声源在连续多帧内静止不动,实现了实时多声源定位,应用场合更为广泛;显著提高了主声源和次声源的定位成功率,尤其次声源的定位成功率提升更为明显,算法对噪声和混响都具有更强的鲁棒性。附图说明图1是本方法的流程图,图2是混响时间T60=0.3s时本方法和传统SRP-PHAT方法的主声源定位成功率比较图,图3是混响时间T60=0.3s时本方法和传统SRP-PHAT方法的次声源定位成功率比较图,图4是混响时间T60=0.3s时本方法和传统SRP-PHAT方法的主次声源定位平均成功率比较图,图5是混响时间T60=0.6s时本方法和传统SRP-PHAT方法的主声源定位成功率比较图,图6是混响时间T60=0.6s时本方法和传统SRP-PHAT方法的次声源定位成功率比较图,图7是混响时间T60=0.6s时本方法和传统SRP-PHAT方法的主次声源定位平均成功率比较图。图2至图7的横坐标为全局信噪比,纵坐标为定位成功率。具体实施方式以下结合附图对本专利技术的技术方案做具体的说明。一种基于Gammatone滤波器和直方图的多声源定位方法,如图1所示,用麦克风作为阵元,组成传声器阵列,接收语音,采集声源信号;将声源信号通过Gammatone滤波器组,通过Gammatone滤波器产生的脉冲响应,将声源信号在时域分割为子带信号;将每个子带信号分帧和加窗,作时频转换处理,获得单帧信号的频域信号,作为时频单元信号;计算候选方位到阵元的导引时延,进而计算每个时频单元信号的可控响应功率值;获取声源方位信息,包括可控响应功率值的主峰方位和次峰方位;绘制直方图,统计主峰方位和次峰方位的数量;先从主峰方位的数量估计主声源方位和次声源方位,若无法估计次声源方位,再从次峰方位的数量估计次声源方位。选用6个全向麦克风,组成均匀的圆形阵列,通过圆形麦克风阵列接收语音,采集声源信号,阵列半径设置为0.1m,每个麦克风作为一个阵元,阵元间距不必严格限于半波长,阵列采集声源信号的数量和阵元的数量U=6,序号u=1...U,第u个传声器采集的的声源信号为su(t)。用Gammatone滤波器产生脉冲响应,组成滤波器组,滤波器的数量I=32,序号i=1...I,第i个Gammatone滤波器产生的脉冲响应函数为gi(t),Gammatone滤波器的增益为A,阶数m=6,衰减因子bi=1.109ERB(fi),中心频率fi的范围取[800Hz,8000Hz],相位计算得到ERB(fi)=24.7(4.37fi/1000+1),阶跃函数为u(t),产生的的脉冲响应函数为通过32个Gammatone滤波器组产生脉冲响应。将第u个传声器采集的的声源信号su(t)通过第i个Gammatone滤波器产生的脉冲响应函数gi(t),获得第i个子带的时域信号xu(i,t),子带信号为xu(i,t)=su(t)*本文档来自技高网...

【技术保护点】
1.一种基于Gammatone滤波器和直方图的多声源定位方法,其特征在于,包括:用传声器阵列采集声源信号,通过Gammatone滤波器组产生脉冲响应,在时域将声源信号分割为子带信号;将每个子带信号分帧和加窗作时频转换获得时频单元信号,计算每个时频单元信号的可控响应功率值,确认可控响应功率值的主峰方位和次峰方位;用直方图统计主峰方位和次峰方位的数量,根据数量最多的主峰方位和次峰方位估计主次声源方位。

【技术特征摘要】
1.一种基于Gammatone滤波器和直方图的多声源定位方法,其特征在于,包括:用传声器阵列采集声源信号,通过Gammatone滤波器组产生脉冲响应,在时域将声源信号分割为子带信号;将每个子带信号分帧和加窗作时频转换获得时频单元信号,计算每个时频单元信号的可控响应功率值,确认可控响应功率值的主峰方位和次峰方位;用直方图统计主峰方位和次峰方位的数量,根据数量最多的主峰方位和次峰方位估计主次声源方位。2.根据权利要求1所述的基于Gammatone滤波器和直方图的多声源定位方法,其特征在于,所述的用传声器阵列采集声源信号,包括:用传声器作为阵元,组成阵列采集声源信号,传声器的数量为U,序号为u,u=1...U,第u个传声器采集的的声源信号为su(t)。3.根据权利要求2所述的基于Gammatone滤波器和直方图的多声源定位方法,其特征在于,所述的通过Gammatone滤波器组产生脉冲响应,包括:用Gammatone滤波器产生脉冲响应,组成滤波器组,滤波器的数量为I,序号为i,i=1...I,第i个Gammatone滤波器产生的脉冲响应函数为gi(t);Gammatone滤波器的增益为A,阶数为m,衰减因子为bi,中心频率为fi,相位为阶跃函数为u(t),产生的的脉冲响应函数为4.根据权利要求3所述的基于Gammatone滤波器和直方图的多声源定位方法,其特征在于,所述的在时域将声源信号分割为子带信号,包括:将第u个传声器采集的的声源信号su(t)通过第i个Gammatone滤波器产生的脉冲响应函数gi(t),获得第i个子带的时域信号xu(i,t),子带信号为xu(i,t)=su(t)*gi(t)。5.根据权利要求4所述的基于Gammatone滤波器和直方图的多声源定位方法,其特征在于,所述的将每个子带信号分帧和加窗作时频转换获得时频单元信号,包括:在时域将子带信号xu(i,t)分割为单帧信号,单帧信号的数量为L,长度为N,序号为l,l=1...L,单帧内的采样序号为n,0≤n<N,第l个单帧第n个采样信号为xu(i,lN+n);用窗信号对xu(i,lN+n)进行加窗处理,得到xu(i,l,n)=wH(n)xu(i,lN+n),xu(i,l,n)为第u个传声器第i个子带第l个单帧第n个采样信号的加窗信号;用离散傅里叶变换函数DFT对xu(i,l,n)作时频转换,变换的长度为...

【专利技术属性】
技术研发人员:赵小燕陈书文刘鸿斌
申请(专利权)人:南京林业大学江苏第二师范学院江苏省教育科学研究院
类型:发明
国别省市:江苏,32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1