一种基于频点信噪比和偏置软判决的阵列声源定位方法技术

技术编号:21889525 阅读:19 留言:0更新日期:2019-08-17 13:38
本发明专利技术公开了一种基于频点信噪比和偏置软判决的阵列声源定位方法,通过传声器阵列采集声源信号,在时域分割为单帧信号,加窗和离散傅里叶变换为频域信号,同时继续将单帧信号分割为子帧信号,加窗和离散傅里叶变换为频域信号,计算频点信噪比,映射为偏置软判决值,计算候选方位的修正可控响应功率值,估计可控响应功率值最大的候选方位为声源方位。本发明专利技术使用麦克风组成阵列,实现立体定位,对整个频带的每个频点估计信噪比,不用考虑声源到达两个传声器的时延差,直接定位,使用Sigmoid函数增加偏置,实现软修正,参考信噪比对特定频点进行抑制,不需要信号统计特性的先验信息,无需利用静音帧的数据估计噪声功率谱,适用于噪声变换较快的环境,在定位成功率和均方误差根RMSE指标上表现更优秀,在中低信噪比环境下定位成功率优明显提升,算法鲁棒性更好。

An Array Source Location Method Based on Frequency Signal-to-Noise Ratio and Bias Soft Decision

【技术实现步骤摘要】
一种基于频点信噪比和偏置软判决的阵列声源定位方法
本专利技术涉及信号处理
,具体涉及一种声源定位方法。
技术介绍
相位变换加权的可控响应功率SRP-PHAT声源定位算法,不需要信号和噪声的先验知识,只需要20-30ms数据就可以估计声源的位置,是一种可以实时实现的声源定位算法,具有较强的抗混响能力,但是传统的SRP-PHAT声源定位方法,在复杂声学环境下定位性能不能令人满意,尤其是噪声增大时,定位性能下降明显。为提高噪声和混响环境下的声源定位成功率,本方法采用了频点信噪比和偏置软判决,估计每个频率点的信号和噪声功率谱密度,计算每个频点的信噪比,将频率信噪比映射为带偏置的频率软判决值,修正传统的可控响应功率计算公式,信噪比高的频谱权重大,信噪比低的频谱权重小,利用可控响应功率来定位声源,由频率软判决值和频率信号计算每个候选位置的可控响应功率值,实现鲁棒的声源定位。
技术实现思路
本专利技术为了解决现有技术存在的问题,提出了一种基于频点信噪比和偏置软判决的阵列声源定位方法,为了实现上述目的,本专利技术采用了以下技术方案。通过传声器阵列采集声源信号,阵列由阵元组成,阵元的数量为M,序号为m,m=1...M,阵列采集声源信号的数量为M,第m个阵元采集的的声源信号为xm(t)。在时域将阵列采集的声源信号xm(t)分割为单帧信号,单帧信号的数量为I,长度为N,序号为i,i=1...I,单帧内的采样序号为n,0≤n<N,第i个单帧第n个采样信号为xm(iN+n)。通过加窗处理和离散傅里叶变换将每个单帧信号转换为频域信号,用窗信号对xm(iN+n)进行加窗处理,得到xm(i,n)=wH(n)xm(iN+n),xm(i,n)为第m个阵元第i个单帧第n个采样信号的加窗信号,用离散傅里叶变换函数DFT对xm(i,n)进行离散傅里叶变换,变换的长度为K,频点为k,0≤k<K,得到表示第m个阵元第i个单帧第k个频点的频域信号,Xm(i,k)为时域信号xm(i,n)对应的频域信号。在时域将每个单帧信号xm(iN+n)分割为子帧信号,子帧信号的数量为Lsub,长度为Nsub=N/Lsub,序号为l,1≤l≤Lsub,子帧内的采样序号为nsub,0≤nsub<Nsub,第l个子帧第nsub个采样信号为xm(iN+(l-1)Nsub+nsub)。通过加窗处理和离散傅里叶变换将每个子帧信号转换为频域信号,用窗信号对xm(iN+(l-1)Nsub+nsub)进行加窗处理,得到xm(i,l,nsub)=wH(nsub)xm(iN+(l-1)Nsub+n),xm(i,l,nsub)为第m个阵元第i个单帧第l个子帧第nsub个采样信号的加窗信号,用离散傅里叶变换函数DFT对xm(i,l,nsub)进行离散傅里叶变换,得到表示第m个阵元第i个单帧第l个子帧第k个频点的频域信号,Xm(i,l,k)为时域信号xm(i,l,nsub)对应的频域信号。由子帧信号的频域信号计算单帧信号的频点信噪比,将Xm(i,l,k)表示为向量形式X(i,l,k)=[X1(i,l,k)X2(i,l,k)...XM(i,l,k)]T,将Xm(i,k)表示为向量形式X(i,k)=[X1(i,k)X2(i,k)...XM(i,k)]T,用X(i,l,k)计算第i个单帧信号第k个频点X(i,k)的协方差矩阵计算第i个单帧信号第k个频点的信号功率和噪声功率Rpq(i,k)为协方差矩阵R(i,k)第p行第q列的数值;由信号功率Ps(i,k)和噪声功率σ2(i,k)计算第i个单帧信号第k个频点的信噪比将频点信噪比映射为偏置软判决值,将代入Sigmoid函数,映射为第i个单帧信号第k个频点的偏置软判决值α为Sigmoid函数的斜率,β为信噪比偏置值。根据单帧信号的频域信号和频率软判决值计算候选方位的修正可控响应功率值,计算候选方位到第m个阵元的导引时延τm0(r),候选方位的声源位置为r,阵列中心的位置为r0,第m个阵元的位置为rm,空气中的声速为c,候选方位到阵列中心的声传播时延为τ0(r),候选方位到第m个阵元的声传播时延为τm(r),候选方位到第m个阵元的导引时延计算阵列的PHAT可控响应输出YPHAT(i,k,r),信号采样率为fs,将τm0(r)和Xm(i,k)代入,得到由YPHAT(i,k,r)和SD(i,k)得到第i个单帧信号在每个候选方位r的修正PHAT可控响应功率值可控响应功率最大值对应的候选方位为声源方位,第i帧信号的声源方位估计为声源方位的估计公式为本专利技术使用多个传声器组成圆形阵列,相当于多个声学传感器,实现立体定位;对声源信号的整个频带的每个频点估计信噪比,极大的提高了计算精度;不用考虑声源到达两个传声器的时延差,直接定位,使用Sigmoid函数实现软修正;对Sigmoid函数增加了偏置,参考信噪比对特定频点进行抑制;不需要信号统计特性的先验信息,无需利用静音帧的数据估计噪声功率谱;适用于噪声变换较快的环境,应用场合更为广泛;经过混响时间T60=0.3s和T60=0.6s实验,在定位成功率和均方误差根RMSE指标上表现更优秀;在中低信噪比环境下定位成功率优明显提升,算法鲁棒性更好。附图说明图1是本方法的流程图,图2是Sgmoid函数在β=0改变α时的曲线,图3是Sgmoid函数在α=0.5改变β时的曲线,图4是混响时间T60=0.3s时本方法和传统SRP-PHAT方法的成功率比较图,图5是混响时间T60=0.3s时本方法和传统SRP-PHAT方法的均方误差根RMSE比较图,图6是混响时间T60=0.6s时本方法和传统SRP-PHAT方法的成功率比较图,图7是混响时间T60=0.6s时本方法和传统SRP-PHAT方法的均方误差根RMSE比较图。具体实施方式以下结合附图对本专利技术的技术方案做具体的说明。一种基于频点信噪比和偏置软判决的阵列声源定位方法,如图1所示:使用多个麦克风组成传声器阵列,接收语音,采集声源信号;在时域进行分帧,将麦克风阵列采集的声源信号分割为单帧信号;对单帧信号分别做两种处理,一种是加窗和离散傅里叶变换DFT,将每个单帧信号转换为频域信号,另一种是继续在时域进行分帧,将每个单帧信号分割为子帧信号;对于后一种处理得到的子帧信号,继续加窗和离散傅里叶变换DFT,将每个子帧信号转换为频域信号;对子帧信号的频域信号,使用频率信噪比估计算法,得到单帧信号的频点信噪比;使用Sigmoid函数,将频点信噪比映射为带偏置的频率软判决值;根据单帧信号的第一种处理得到的频域信号,和第二种处理得到的频率软判决值,参考每个候选方位到每个麦克风的导引时延,计算每个候选方位的修正可控响应功率值;选择可控响应功率最大值对应的候选方位,估计声源位置。选用6个全向麦克风,组成均匀的圆形阵列,通过圆形麦克风阵列接收语音,采集声源信号,语音信号的采样率fs设置为16kHz,阵列半径设置为0.1m,每个麦克风作为一个阵元,阵列采集声源信号的数量和阵元的数量均为M=6,序号为m=1...M,第m个阵元采集的的声源信号为xm(t)。在时域将xm(t)分割为单帧信号,单帧信号的数量为I,长度为N=512(32ms),帧移设置为0,序号为i,i=1...I,单帧内的采样序号为n,0≤n<N,本文档来自技高网...

【技术保护点】
1.一种基于频点信噪比和偏置软判决的阵列声源定位方法,包括:通过传声器阵列采集声源信号,在时域将阵列采集的声源信号分割为单帧信号,通过加窗处理和离散傅里叶变换将每个单帧信号转换为频域信号;在时域将每个单帧信号分割为子帧信号,通过加窗处理和离散傅里叶变换将每个子帧信号转换为频域信号;由子帧信号的频域信号计算单帧信号的频点信噪比,将频点信噪比映射为偏置软判决值;根据单帧信号的频域信号和频率软判决值计算候选方位的修正可控响应功率值,将可控响应功率最大值对应的候选方位估计为声源方位。

【技术特征摘要】
1.一种基于频点信噪比和偏置软判决的阵列声源定位方法,包括:通过传声器阵列采集声源信号,在时域将阵列采集的声源信号分割为单帧信号,通过加窗处理和离散傅里叶变换将每个单帧信号转换为频域信号;在时域将每个单帧信号分割为子帧信号,通过加窗处理和离散傅里叶变换将每个子帧信号转换为频域信号;由子帧信号的频域信号计算单帧信号的频点信噪比,将频点信噪比映射为偏置软判决值;根据单帧信号的频域信号和频率软判决值计算候选方位的修正可控响应功率值,将可控响应功率最大值对应的候选方位估计为声源方位。2.根据权利要求1所述的基于频点信噪比和偏置软判决的阵列声源定位方法,其特征在于,所述的通过传声器阵列采集声源信号,包括:阵列由阵元组成,阵元的数量为M,序号为m,m=1...M,阵列采集声源信号的数量为M,第m个阵元采集的的声源信号为xm(t)。3.根据权利要求2所述的基于频点信噪比和偏置软判决的阵列声源定位方法,其特征在于,所述的在时域将阵列采集的声源信号分割为单帧信号,包括:在时域将声源信号xm(t)分割为单帧信号,单帧信号的数量为I,长度为N,序号为i,i=1...I,单帧内的采样序号为n,0≤n<N,第i个单帧第n个采样信号为xm(iN+n)。4.根据权利要求3所述的基于频点信噪比和偏置软判决的阵列声源定位方法,其特征在于,所述的通过加窗处理和离散傅里叶变换将每个单帧信号转换为频域信号,包括:用窗信号对xm(iN+n)进行加窗处理,得到xm(i,n)=wH(n)xm(iN+n),xm(i,n)为第m个阵元第i个单帧第n个采样信号的加窗信号;用离散傅里叶变换函数DFT对xm(i,n)进行离散傅里叶变换,变换的长度为K,频点为k,0≤k<K,得到表示第m个阵元第i个单帧第k个频点的频域信号,Xm(i,k)为时域信号xm(i,n)对应的频域信号。5.根据权利要求3所述的基于频点信噪比和偏置软判决的阵列声源定位方法,其特征在于,所述的在时域将每个单帧信号分割为子帧信号,包括:将单帧信号xm(iN+n)分割为子帧信号,子帧信号的数量为Lsub,长度为Nsub=N/Lsub,序号为l,1≤l≤Lsub,子帧内的采样序号为nsub,0≤nsub<Nsub,第l个子帧第nsub个采样信号为xm(iN+(l-1)Nsub+nsub)。6.根据权利要求5所述的基于频点信噪比和偏置软判决的阵列声源定位方法,其特征在于,所述的通过加窗处理和离散傅里叶变换将每个子帧信号转换为频域信号,包括:用窗信号对xm(iN+(l-1)Nsub+nsub...

【专利技术属性】
技术研发人员:赵小燕陈书文
申请(专利权)人:南京林业大学江苏第二师范学院江苏省教育科学研究院
类型:发明
国别省市:江苏,32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1