基于频域Bark子带的波束扫描方法及声源定向装置制造方法及图纸

技术编号:26595128 阅读:37 留言:0更新日期:2020-12-04 21:16
本发明专利技术涉及一种基于频域Bark子带的波束扫描方法及声源定向装置,包括步骤1:麦克风阵列采集声音信号,计算获得阵列频域输出信号模型;步骤2:根据采样频率和Bark子带中心频率求取感兴趣频点;估计感兴趣频点处阵列频域输出信号的协方差矩阵;步骤3:计算感兴趣频点对应的窄带空间谱;步骤4:将所有感兴趣频点窄带空间谱进行平均,获得平均空间谱;步骤5:在全角度区域进行平均空间谱搜索,获得声源方向。本发明专利技术能够有效提高声源定向精度,降低运算复杂程度。

【技术实现步骤摘要】
基于频域Bark子带的波束扫描方法及声源定向装置
本专利技术涉及一种基于频域Bark子带的波束扫描方法及声源定向装置。
技术介绍
基于麦克风阵列的声源定向是语音信号处理中的一个重要问题,它在视频会议、智能监控、人机语音交互等领域有着广泛的应用。基于麦克风阵列的声源定向方法大致可以分为三类:基于到达时间差的定向方法、基于最大输出功率的可控波束形成方法和基于高分辨谱估计的定向方法。由于语音信号属于宽带信号,传统基于高分辨谱估计的声源定向方法在处理宽带信号时大多采用子带波束扫描方法,根据均匀子带划分的方式,将语音信号按照频带连续的原则分割成若干个相同带宽间隔的子带,再分别对每个子带数据求取空间谱,然后对所有子带空间谱进行平均,通过利用平均空间谱搜索,估计最终宽带信号的波达方向。语音信号能量大多集中在低频段(小于3400Hz),并不是在每个频段都一直包含语音成分,很大部分时间里,有些波段可能仅包含了噪声。传统子带波束扫描方法存在的不足之处在于,并未充分利用语音信号的频率特性,采用全频带定向,易受噪声波段影响,存在定向精度有限和计算复杂度高的问题本文档来自技高网...

【技术保护点】
1.一种基于频域Bark子带的波束扫描方法,其特征在于,包括以下步骤:/n步骤1:麦克风阵列采集声音信号,计算获得阵列频域输出信号模型;/n步骤2:根据采样频率和Bark子带中心频率求取感兴趣频点;估计感兴趣频点处阵列频域输出信号的协方差矩阵;/n步骤3:计算感兴趣频点对应的窄带空间谱;/n步骤4:将所有感兴趣频点窄带空间谱进行平均,获得平均空间谱;/n步骤5:在全角度区域进行平均空间谱搜索,获得声源方向。/n

【技术特征摘要】
1.一种基于频域Bark子带的波束扫描方法,其特征在于,包括以下步骤:
步骤1:麦克风阵列采集声音信号,计算获得阵列频域输出信号模型;
步骤2:根据采样频率和Bark子带中心频率求取感兴趣频点;估计感兴趣频点处阵列频域输出信号的协方差矩阵;
步骤3:计算感兴趣频点对应的窄带空间谱;
步骤4:将所有感兴趣频点窄带空间谱进行平均,获得平均空间谱;
步骤5:在全角度区域进行平均空间谱搜索,获得声源方向。


2.根据权利要求1所述的基于频域Bark子带的波束扫描方法,其特征在于:步骤1中,阵列频域输出信号模型通过如下方法计算,
第n个阵元时域输出为:
xn(t)=s(t+τn)+vn(t)
式中,vn(t)为第n个阵元的噪声,s(t)为声音信号,τn为信号到达第n个阵元对于到达参考原点的传播时延;
第n个阵元频域输出为:



式中,S(ωk)为频点ωk处信号的有限时间傅里叶变换,Vn(ωk)为频点ωk处第n个阵元上噪声的有限时间傅里叶变换。
对于N元阵列,阵列频域输出信号矢量具有下述形式:
x(ωk)=[X1(ωk),…,XN(ωk)]T=a(ωk,θ)S(ωk)+v(ωk)



v(ωk)=[V1(ωk),…,VN(ωk)]T
式中,a(ωk,θ)为信号在频点ωk处的导向矢量,v(ωk)为频点ωk处噪声矢量。


3.根据权利要求1所述的基于频域Bark子带的波束扫描方法,其特征在于:步骤2中,选取Bark滤波器的前17个频带中心频率作为感兴趣频率,第一感兴趣频率设为60Hz;除第一感兴趣频点采取向上取整,其余感兴趣频点采取向上向下取整。


4.根据权利要求3所述的基于频域Bark子带的波束扫描方法,其特征在于:步骤2中,感兴趣频点ωk处阵列频域输出协方差矩阵Rxx(ωk)通过如下方法估计,
选取阵列数据观测时间T0内snap帧语音数据,每帧点数wlen,利用离散傅里叶变换将snap帧数...

【专利技术属性】
技术研发人员:王荔张小博陈龙
申请(专利权)人:北京中电慧声科技有限公司中国电子科技集团公司第三研究所
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1