基于时间反转技术的封闭空间声源定位方法技术

技术编号:22363108 阅读:85 留言:0更新日期:2019-10-23 04:22
本发明专利技术涉及一种基于时间反转技术的封闭空间声源定位方法。本方法以封闭空间内表示声音传播通道信息的空间脉冲响应为指标,首先固定传声器阵列位置,对封闭空间内的若干采样位置进行空间脉冲响应测量或仿真作为样本信息;然后利用传声器阵列测量获得的实际声源的信号作为检测信息;最后对检测信息以及样本信息进行匹配,从而获得实际声源的位置。该方法将时间反转概念引入到定位算法之中,有效地避免了传统定位方法中存在的一系列问题。本方法特别适用于环境复杂,混响程度较高的封闭空间环境。通过与测量实验对比,验证了本发明专利技术具有较高的精度,因而在封闭空间声源定位中具有广阔应用前景。

Acoustic source location method in closed space based on time reversal Technology

【技术实现步骤摘要】
基于时间反转技术的封闭空间声源定位方法
本专利技术涉及一种基于时间反转技术的封闭空间声源定位方法,可应用于任意类型,特别是环境复杂、混响程度较高的封闭空间声源定位问题。
技术介绍
封闭空间中的声源定位问题是声源定位研究中的一项重要内容,在人们的生活中有广泛的应用。例如视频会议,智能家居,飞机舱室噪声源定位,车载电话系统,以及地下车库的车位识别系统等。这类空间的主要特点是环境复杂(反射、折射、干涉、、衍射、吸声)且混响程度较高,因此对声源定位技术的精度、稳定性要求较高。声源定位技术是利用麦克风阵列接收信号后进行信号处理的方法,现有的声源定位技术基本上可以分为3类,基于最大输出功率的可控波束形成技术,基于声达时间差(TDOA)的定位技术,基于高分辨率空间谱估计的技术。波束形成技术将各阵元采集来的信号进行加权求和形成波束,通过搜索声源的可能位置来引导该波束,修改权值使得传声器阵列的输出信号功率量最大化。基于声达时间差(TDOA)的定位技术,这类声源定位方法一般分为2个步骤进行:先进行声达时间差估计,并从中获取传声器阵列中阵元间的声延迟TDOA;再利用获取的声达时间差,结合已知的传声器阵列的空间位置进一步定出声源的位置。这种方法的计算量一般比前面的要小,更利于实时处理,所以它在语音信号的声源定位中占有很大的比重。高分辨率谱估计技术,这类的声源定位技术基于高分辨率的谱估计算法,通过获取了传声器阵列的信号来计算空间谱的相关矩阵获得声源位置。这三种方法都是基于阵列信号处理的方法。从算法和实际应用来看,现有的声源定位技术还存在着一些缺点。首先,对于基于最大输出功率的可控波形成技术来说,要获得较高的定位精度,需要大规模的传声器阵列,这在经济上会造成很大的负担;另外,这种技术由于算法的限制,只能对远场的声源进行定位,在小尺度的封闭空间中,其定位精度将会大大下降。其次,对于基于高分辨率谱估计技术的生源定位方法,要求空间中的声源或噪声必须平稳时不变的,但这对于语音信号来说,这种实际的声学环境很难实现;同时,基于高分辨率的谱估计声源定位还有很多的假设条件,这对一个实时实现的系统来说也不可能;而且在计算中,这种谱估计方法的运算量很大,还很容易导致定位不准确,因而在现代的声源定位系统中很少采用。第三,对于基于声达时间差的定位技术,声源定位实际上只是定位出了声源的方向,具体的距离则无法给出,另外,这种方法受环境混响影响很大,当混响程度较高时,精度很低。封闭空间中声学环境较为复杂,由于障碍物的存在,目标声源发出的声信号通过多径传播最后被传声器阵列接收,多径效应会影响传声器定位的精度。目前封闭空间中声源定位的方法就是上述的三种,但在多径环境下效果都不太理想。本专利技术主要通过传声器阵列进行声信号采集和定位,在充分利用封闭空间的声场特性的前提下进行声源定位,该方法可在办公楼,地下车库等声学场景变化不大的空间中应用。该方法具有算法效率高,鲁棒性高,计算快,声源定位精度高等优点。
技术实现思路
为了避免现有技术的不足之处,本专利技术提出一种基于时间反转技术的封闭空间声源定位方法。本方法以封闭空间内表示声音传播通道信息的空间脉冲响应为指标,结合室内声学测量、信号匹配原理,首先固定传声器阵列位置,对封闭空间内的若干采样位置进行空间脉冲响应测量或仿真作为样本信息;然后利用传声器阵列测量获得的实际声源的信号作为检测信息;最后对检测信息以及样本信息进行匹配,从而获得实际声源的位置。技术方案本方法通过两个阶段实现声源定位,第一阶段为对划分的网格点的空间脉冲响应获取,称之为采样阶段;第二阶段为对实际声源的定位,称之为定位阶段。以下为两个阶段的具体实现步骤:步骤1:把待定位的空间按照需要划分为若干网格,网格中心之间的距离可自由选择。可在定位精度要求高的区域设置较多的采样位置,而在定位精度要求低的地方设置较少的采样位置。网格一般采用规则的正方形或长方形。将各区域编号为i,i=1,2,…n。确定传声器阵列(也可是麦克风,或任何可接收声信号的装置)的位置,在测量和定位过程中,传声器阵列的位置保持不变。步骤2:在各网格中心处设置测点,测量各测点到麦克风阵列的脉冲响应,具体可使用常用的测量软件测量。或者通过仿真得到。设各点处测得的通道脉冲响应为hi。步骤3:声源发出的声信号为s(t),持续时间为t。持续时间可从0-10s,一般不应超过脉冲响应的持续时间。步骤4:假定待测点为rs,第m个传声器接收到的声信号s(t)记为ym(t),持续时间为t,与声源信号相同。hm(rs,rm,t)为通道脉冲响应,n(t)为高斯白噪声。由信号处理理论可知,测得的信号为实际声源信号与通道脉冲响应的卷积,即:步骤5:对步骤4中的信号进行傅里叶变换,得到Ym(ω),时域上的时间反转相当于频域上的相位共轭,因此上述信号的时反形式为步骤6:将时反后的信号重新发射回封闭空间中:步骤7:对式(3)做自相关:步骤8:传声器阵列的最终相关系数为:M为阵列的传声器数目。找出其中相关系数最大的一组数据,例如Ri,即可认为声源位于这组数据所对应的预设采样位置Si。有益效果本专利技术提出一种新型封闭空间声源定位方法,将时间反转概念引入到定位算法之中,有效地避免了传统定位方法中存在的一系列问题。本专利技术方法简便,适合于各类人群使用,且与传统方法相比定位精度得到了大大的提高;此外,本方法特别适用于环境复杂,混响程度较高的封闭空间环境。通过与测量实验对比,验证了本专利技术具有较高的精度,因而在封闭空间声源定位中具有广阔应用前景。附图说明图1是实施例中封闭空间及采样位置,传声器阵列位置示意图;图2是实施例中声源定位方法的流程图。具体实施方式现结合实例、附图详细描述本专利技术的声源定位方法:假设在某封闭空间中(实际应用并非一定是指定在封闭空间),区域划分中心的测点及传声器阵列的安排如附图1所示。步骤1:把待定位的空间按照需要划分为若干网格,网格中心之间的距离可自由选择。可在定位精度要求高的区域设置较多的采样位置,而在定位精度要求低的地方设置较少的采样位置。网格采用规则的正方形或长方形。将各区域编号为i,i=1,2,…n。确定传声器阵列(也可是麦克风,或任何可接收声信号的装置)的位置,在测量和定位过程中,传声器阵列的位置保持不变。本实施例中,将封闭空间中需要定位的区域的化成i=1,2,...n,n=100。个网格。网格间距为20cm。步骤2:在各网格中心处设置测点,测量各测点到麦克风阵列的脉冲响应,具体可使用常用的测量软件测量。或者通过仿真得到。设各点处测得的通道脉冲响应为hi。步骤3:假设在某感兴趣区域内,有一已知声源产生的声音信号为s(t),通过传声器接收到的信号为ym(t),得到ym(t)的方法可通过M-AUDIO声卡及声望传声器获得。步骤4:对s(t),及ym(t)做傅立叶变换,得到其频域形式S(ω)=FFT(s(t))和Y(ω)=FFT(y(ω))。并得到所有网格点到传声器阵列的通道脉冲响应Hm(rs,rm,ω)。步骤5:对传声器阵列得到的信号进行时间反转操作,得到步骤6:将时反信号重新发射到封闭空间中,得到步骤7:对式(6)做自相关:步骤8:传声器阵列的最终相关系数为:M=15。不同的位置得到不同的相关系数R值,其中相关系数最大本文档来自技高网
...

【技术保护点】
1.基于时间反转技术的封闭空间声源定位方法,其特征在于,包括如下步骤:步骤1:把待定位的空间按照需要划分为若干网格,网格中心之间的距离可自由选择。可在定位精度要求高的区域设置较多的采样位置,而在定位精度要求低的地方设置较少的采样位置;将各区域编号为i,i=1,2,…n;确定传声器阵列的位置,在测量和定位过程中,传声器阵列的位置保持不变;步骤2:在各网格中心处设置测点,测量各测点到麦克风阵列的脉冲响应,设各点处测得的通道脉冲响应为hi;步骤3:声源发出的声信号为s(t),持续时间为t;持续时间不超过脉冲响应的持续时间;步骤4:假定待测点为rs,第m个传声器接收到的声信号s(t)记为ym(t),持续时间为t,与声源信号相同;hm(rs,rm,t)为通道脉冲响应,n(t)为高斯白噪声;由信号处理理论可知,测得的信号为实际声源信号与通道脉冲响应的卷积,即:

【技术特征摘要】
1.基于时间反转技术的封闭空间声源定位方法,其特征在于,包括如下步骤:步骤1:把待定位的空间按照需要划分为若干网格,网格中心之间的距离可自由选择。可在定位精度要求高的区域设置较多的采样位置,而在定位精度要求低的地方设置较少的采样位置;将各区域编号为i,i=1,2,…n;确定传声器阵列的位置,在测量和定位过程中,传声器阵列的位置保持不变;步骤2:在各网格中心处设置测点,测量各测点到麦克风阵列的脉冲响应,设各点处测得的通道脉冲响应为hi;步骤3:声源发出的声信号为s(t),持续时间为t;持续时间不超过脉冲响应的持续时间;步骤4:假定待测点为rs,第m个传声器接收到的声信号s(t)记为ym(t),持续时间...

【专利技术属性】
技术研发人员:曾向阳马慧颖
申请(专利权)人:西北工业大学
类型:发明
国别省市:陕西,61

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1