适用于微型麦克风阵列的声强估计声源定向方法技术

技术编号:12025658 阅读:163 留言:0更新日期:2015-09-10 10:32
本发明专利技术公开了一种适用于微型麦克风阵列的声强估计声源定向方法,首先,借助语音信号的稀疏特性对各时频点构造方位估计时频图,利用滑动窗对选定的时频块对应的瞬时方位估计值进行局部标准差估计;然后,根据设定的局部标准差门限参数值对时频点进行二值掩蔽处理;再次,对过滤出的时频点进行重新排布,并进行第二次局部标准差估计和门限判断;最后,将满足条件的时频点对应的各方向上的瞬时声强进行求和平均,得出方位角估计值。相比现有技术,本发明专利技术对混响和噪声具有更高的鲁棒性,方位角估计精度也较高。

【技术实现步骤摘要】

本专利技术涉及小尺寸阵列,尤其是直径小于4cm的阵列下的声强估计声源定向方 法,可用于视频会议系统、机器人听觉、助听器、人机语音交互系统、以及音频监控等诸多领 域。
技术介绍
在很多实际应用中,由于受到安装平台限制或系统设计要求,往往只能采用小 尺寸麦克风阵列。而在小尺寸阵列孔径条件下,传统的声源定向方法如时延估计法、可 控功率波束形成法等已经无法满足实际定向精度的要求。基于差分思想的声强估计 声源定向方法为小尺寸阵列条件下的高精度声源定向提供了一个重要技术途径。目 前,基本的声强估计声源定向方法有复声强法(见文献GUnel B,Hacihabiboglu H,Kondoz A M. Acoustic Source Separation of Convolutive Mixtures Based on Intensity Vector Statistics. IEEE Transactions on Audio,Speech, and Language Processing,2008, 16(4) :748-756;文献陈华伟,赵俊渭.基于矢量传感器复声强 测量的低空目标二维波达方向估计.声学学报:中文版,2004,(3) :277-282.)和直 方图法(见文献 Zhong,X.,Chen, X.,Wang, W.,Mlinaghi,Acoustic vector sensor based reverberant speech separation with probabilistic time-frequency masking. European Signal Processing Conference. IEEE, 2013:1-5 ;文献惠俊英,惠娟?矢量 声信号处理基础.国防工业出版社,2009)。对于复声强法,其虽然对空间不相关噪声 具有很强的抑制能力,但对混响较为敏感,随着混响的增大其性能急剧下降。而对于直方图 法,信噪比较低时,其性能较差,并且该方法须通过搜索峰值来确定方位角,实时性较差。因 此,为了克服以上方法的缺陷,本专利技术提出了一种同时对噪声和混响具有鲁棒性的声源定 向方法,并且所提出的方法具有闭式解,无需峰值搜索,便于实时实现。
技术实现思路
本专利技术的目的是针对上述
技术介绍
中的不足,提供一种适用于微型麦克风阵列的 声强估计声源定向方法,同时对噪声和混响具有鲁棒性,并且具有闭式解,无需峰值搜索, 便于实时实现。 为实现上述目的,本专利技术采用以下技术方案: -种,包括如下步骤:步骤1,借助语音信号的稀疏特性对各时频点构造方位估计时频图,利用滑动窗对 选定的时频块对应的瞬时方位估计值进行局部标准差估计; 步骤2,根据设定的局部标准差门限参数值对时频点进行二值掩蔽处理; 步骤3,对过滤出的时频点进行重新排布,并再次进行局部标准差估计和门限判 断; 步骤4,将满足条件的时频点对应的各方向上的瞬时声强进行求和平均,得出方位 角估计值。 所述步骤1的具体步骤为:对每个时频点各方向上的声强估计值进行求和平均, 并取实部,即可得到方位角估计值: 上式中,IM(t, f)、Ijt,f)分别表示各时频点在x轴和y轴方向上声强分量,Re 表示取实部; 为了更加清楚的了解每个时频点对方位估计的贡献,利用下式对每个时频点进行 瞬时方位估计,因为是圆形阵列,考虑到方位估计的范围为,那么对每个时频点 对应的小于0°的方位角进行360°补偿,即(i>(t,f) - (i>(t,f)+360°。然后对修正之后 的瞬时方位估计值.4^,/:)计算局部标准差。 所述步骤2中,如果0 Jti,fi) > a,那么将所有符合条件的时频点信息都置为0, 即=0,1。7(1^,;^) =0。这样做的目的是为了初步筛选出那些局 部标准差较大且定向精度不高的时频点。 所述步骤3中的时频点重新排布,是将过滤出的时频点对应的方位角、各方向声 强分量信息分别载入一个新向量中。 所述步骤3中,将满足〇1(tk,fk)彡a条件的二维时频图中的时频点信息分别载 入到一维向量中,即伞'(k) = <Htk,fk),I ' 。x(k) = Iox(tk,fk),I' 。y(k) = Ioy(tk,fk), 这样做的目的,可以有效的分散开原先局部标准差较小,但是定向精度很差的区域中的时 频点,然后计算出对应时频点的局部标准差。 2(k)。如果〇2〇〇彡0,就按照步骤2的方 法将不满足条件的时频点信息置0,其他时频点信息保留,巾"(j) = 4>' 0〇,1" M(j) =r 0!£(^),i"oy(j) = r oy(ki)〇 所述步骤4中,将步骤3中最终保留的数据按照下式即可得出方位角估计值: 本专利技术的有益效果为:相比现有技术,本专利技术对混响和噪声具有更高的鲁棒性,方 位估计精度也较高,具体为: (1)由于对时频点进行局部标准差估计时,往往会出现局部标准差较小但方位估 计值也不完全精确的情况,如果按照局部标准差进行加权,必定会造成这些方位估计误差 较大的时频点占据更大的权重,从而导致最后估计结果偏离真实值。为此,本专利技术巧妙利用 二次门限时频重排的方式,有效克服了局部标准差较小而方位估计值不准的异常情况。 (2)本专利技术克服了直方图法的缺陷,一方面在信噪比降低时也能保持很高的定向 精度,另一方面避免了峰值搜索过程,实时性较高。 (3)相比现有的方法,本专利技术适用于小尺寸麦克风阵列,且具有较高的抗混响能力 和空间噪声抑制能力,在混响噪声环境下的方位估计精度高。【附图说明】 图1为阵列结构和坐标定义示意图; 图2为本专利技术方法原理流程图; 图3为时频重排前后部分时频信息分布图,其中,(a)第一次门限判断后部分时频 信息分布,(b)时频重排方式1,(c)时频重排方式2,(d)第二次门限判断后部分时频信息 的一种分布方式; 图4为实施例1的仿真结果图,其中,(a)局部标准差小于30°但方位估计值大于 30°的时频分布,(b)第一次门限判断后,局部标准差小于30°但方位估计大于30°的时 频分布,(c)第二次门限判断后,局部标准差小于30°但方位估计大于30°的时频分布; 图5为对比例1的仿真结果图,其中,(a)信噪比20dB时复声强法、直方图法和本 专利技术方法的均方根误差对比图,(b)信噪比10dB时复声强法、直方图法和本专利技术方法的均 方根误差对比图; 图6为对比例2的实测结果图,其中,(a)复声强法、直方图法和本专利技术方法平均 绝对误差对比图,(b)复声强法、直方图法和本专利技术方法最大绝对误差对比图。【具体实施方式】 本专利技术中所指的微型麦克风阵列是指尺寸较小的阵列,一般是指直径小于4cm的 阵列(即下文所述的D〈4cm),本专利技术实施例和对比例中都选用2. 5cm。 下面结合附图对专利技术的技术方案进行详细说明。 本专利技术方法是在如图1所示的麦克风阵列的基础上,按照图2所示的原理流程图 进行研宄的。四个全向麦克风等间隔的分布在直径为D的圆周上,那么原点处声压由四个 麦克风接收到的信号的平均值近似求得:其中,Pl (t)、p2(t)、p3(t)、p4⑴分别表示麦克风Mi、M2、M3、M 4接收到的信号,原点 处振速的两本文档来自技高网
...
<a href="http://www.xjishu.com/zhuanli/52/CN104898086.html" title="适用于微型麦克风阵列的声强估计声源定向方法原文来自X技术">适用于微型麦克风阵列的声强估计声源定向方法</a>

【技术保护点】
一种适用于微型麦克风阵列的声强估计声源定向方法,其特征在于:包括如下步骤:步骤1,借助语音信号的稀疏特性对各时频点构造方位估计时频图,利用滑动窗对选定的时频块对应的瞬时方位估计值进行局部标准差估计;步骤2,根据设定的局部标准差门限参数值对时频点进行二值掩蔽处理;步骤3,对过滤出的时频点进行重新排布,并再次进行局部标准差估计和门限判断;步骤4,将满足条件的时频点对应的各方向上的瞬时声强进行求和平均,得出方位角估计值。

【技术特征摘要】

【专利技术属性】
技术研发人员:何赛娟陈华伟丁少为
申请(专利权)人:南京航空航天大学
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1