一种基于声源阵列的定位跟踪方法及其装置制造方法及图纸

技术编号:12220775 阅读:144 留言:0更新日期:2015-10-21 23:43
本发明专利技术公开了一种基于声源阵列的定位跟踪方法,包括如下步骤:S1,采用五元麦克风阵列采集现场声音,对五元麦克风阵列中每个麦克风采集的声音信号进行预处理得到音频信号;S2,根据各麦克风之间的音频信号到达时间延迟和麦克风阵列的位置信息对音频信号进行声源的定位,计算出俯仰角、方位角和目标距离;S3,对定位跟踪装置进行移动和转向,到达声源位置。本发明专利技术对于非高斯噪声、相干噪声以及声源本身在室内的混响对准确定位造成的影响,进行了相关处理,提高了声源定位的准确性。

【技术实现步骤摘要】

本专利技术涉及一种基于声源阵列的定位跟踪方法,同时涉及一种基于声源阵列的定 位跟踪装置。
技术介绍
声源定位技术是利用传声器拾取语音信号,并用数字信号处理技术对其进行分析 和处理,继而确定和跟踪声源的空间位置。在现有技术中,具有高性能、高方向性的单个传 声器在无噪声、无混响、距离声源很近的情况下,可以获得高质量的声源信号。但是,单个传 声器的拾音范围很有限,若声源在传声器的选择方向之外,则会引入大量的噪声,导致拾取 信号的质量下降;并且单个传声器接收的信号,是由多个声源和环境噪声叠加组成的,无法 实现各个声源的分离。在实际应用中,由于声源可能在室内的小范围内运动,加之室内各种 其它声音的多径反射和混响等因素,也会导致单个传声器接收的信号信噪比降低,拾取信 号的质量下降。 为了解决单个传声器的局限性,有人提出了基于麦克风阵列的声源定位。它是近 年来语音信号处理领域的一大研宄热点。结合实际应用的需要,如远程视频会议、报警系 统、车载电话、助听系统、智能机器人系统等等,人们提出了用多个麦克风按一定的几何结 构进行摆放,组成麦克风阵列进行语音处理的方法。它具有很强的空间选择性,无须移动就 可对声源信号自动监测、定位和跟踪,因此在语音增强、声源定位、回声消除等方面有着极 大的应用空间。其中,利用麦克风阵列采集到的声音信号来估计声源所在位置受到了人们 的亲睐。 但是,声源定位麦克风阵列多位于室内等较封闭的环境中,除了非高斯噪声和相 干噪声的影响外,声源本身在室内的混响也会对准确定位造成影响。因此,如何在真实的声 场环境中定位三维空间的点声源,来提供准确的位置信息,成为人们的迫切需求。 为了解决上述问题,在申请号为201210204877. 3的中国专利申请中,公开了一种 基于麦克风阵列的声源定位系统。该系统将LabVIEW应用于声源定位软件的开发,方便地 完成音频信号的采集与处理,运用广义互相关函数法进行时延估计,结合平面四元十字阵 模型建立方程组实现定位。但是,该系统对于非高斯噪声、相干噪声以及声源本身在室内的 混响对准确定位造成影响,并没有进行相关的处理。除此之外,时延估计引起的方位角误 差、俯仰角误差、目标距离误差均与声速、阵元间距、俯仰角以及方位角有关,严重影响了定 位精度。
技术实现思路
针对现有技术的不足,本专利技术所要解决的首要技术问题在于提供一种基于声源阵 列的定位跟踪方法。 本专利技术所要解决的另一技术问题在于提供一种基于声源阵列的定位跟踪装置。 为实现上述专利技术目的,本专利技术采用下述的技术方案: -种基于声源阵列的定位跟踪方法,包括如下步骤: S1,采用五元麦克风阵列采集现场声音,对五元麦克风阵列中每个麦克风采集的 声音信号进行预处理得到音频信号; S2,根据各麦克风之间的音频信号到达时间延迟和麦克风阵列的位置信息对音频 信号进行声源的定位,计算出俯仰角、方位角和目标距离;S3,根据计算出的俯仰角、方位角和目标距离对定位跟踪装置进行移动和转向,到 达声源位置。 其中较优地,在步骤S1中,所述五元麦克风阵列中的五个麦克风组成十字阵型, 用于拾取同一声源信号。 其中较优地,在步骤S1中,声音信号进行预处理得到音频信号,包括如下步骤:S11,将声音信号进行加窗分帧,得到短时平稳的信号小段;其中,分帧是用特定的 窗函数w(n)与声音信号sjn)进行卷积计算,从而形成加窗信号sw(n) =sJnhwOi);S12,对声音信号进行断点检测,计算短时能量E,若E小于门限值可认为是噪声, 其中:N是采样点数,否则,转向步骤S13 ;S13,计算短时过零率&,若&在门限内,则表示检测到带噪音的音频信号,带噪音 的音频信号的加窗信号\(1〇的短时过零率为S14,当带噪音的音频信号检测出来后,利用谱减法去噪,送入FIR带通滤波器进 行滤波处理得到音频信号。 其中较优地,在步骤S14中,利用谱减法去噪,包括如下步骤: S141,对带噪音的音频信号进行傅里叶变换,得到:X(?) =S(?)+N(?),计算功 率谱得:|x(?)2| = |s(?) |2+|n(?) |2+s(〇)n*(〇)+s*(?)n(?);其中,S*(?)N(?)与S(?)N#(?)均为 0,Ps(?)、Px(?) *PN(?)分别表示s(t)、x(t)和n(t)的功率谱,s(t) 为音频信号,n(t)为噪声信号,x(t)为带噪音频信号,则Px(?) =PS(?)+PN(?);S142,取检测到音频信号前的一帧数据作为噪声信号,得到噪声功率谱PN(?);S143,根据公式:Px ( ? ) =Ps ( ? ) +PN ( ? )得到纯净的音频谱;S144,对得到的纯净的音频谱进行开方得到纯音频的幅度谱;S145,对音频信号s(t)作傅里叶变换,求出其相位,用所述相位乘以纯音频的幅 度谱,再进行傅里叶反变换得到谱减后的音频信号。 其中较优地,在步骤S2中,根据各麦克风之间的音频信号到达时间延迟和麦克风 阵列的位置信息对进行过预处理的音频信号进行目标声源的定位,包括如下步骤:S21,通过广义互相关函数法,计算出五元麦克风阵列接收到的音频信号中,每两 路音频信号之间的相对时延;S22,根据步骤S21得到的相对时延,利用阵元与声源位置的几何关系得到声源的 位置; 所述声源的位置包括声源的方位角、俯仰角和目标距离。 其中较优地,在步骤S21中,采用广义互相关函数法计算出五元麦克风阵列接收 到的音频信号中,每两路音频信号之间的相对时延,包括如下步骤: S211,对两路音频信号求傅里叶变换,对其中一路傅里叶变换后的数据取共轭; S212,计算两路音频信号之间的互功率谱; S213,将频域信号转换到时域,得到广义互相关函数,其中,广义互相关函数为:.Xi(?)、X2 (?)分别是Xl (t)、x2⑴的傅里叶变换, , 1(蛛〇)是互功率谱,!D12为权函数; S214,找到广义互相关相关函数的峰值位置,即为音频信号之间的相对时延; S215,对得到的相对时延中的错误数据进行过滤。 其中较优地,在步骤S215中,对得到的相对时延中的错误数据进行过滤,包括如 下步骤: S2151,进行声音检测,检测到声音则进入下一步,预定时间内没有检测到声音,则 清空时延值数组; S2152,利用时延值数组中包含的声音段计算出时延值。 其中较优地,在步骤S2152中,计算出时延值包括如下步骤: S21521,将时延值数组中时延个数与时延阈值进行比较,当时延值数组中时延个 数小于时延阈值时,将新估算的时延值放入数组末尾; S21522,当时延值数组中时延个数等于时延阈值时,则将数组后时延阈值-1个时 延前移,再将新估计算出的时延值放入数组末尾; S21523,再次判断时延值数组中时延个数,小于时延阈值时,则转向步骤S21521, 等于时延阈值时,则转向步骤S21524 ; S21524,对时延数组中的时延值进行排序,去掉3个最大值和3个最小值,求剩余 时延阈值-6个值的平均,将此平均时延作为时延值进行声源的定向。 一种基于声源阵列的定位跟踪装置,用于实现上述定位跟踪方法,包括运动单元、 控制单元、音频单元和显示单元; 其中,所述音频单元用以采集现场声音,并本文档来自技高网
...

【技术保护点】
一种基于声源阵列的定位跟踪方法,其特征在于包括如下步骤:S1,采用五元麦克风阵列采集现场声音,对五元麦克风阵列中每个麦克风采集的声音信号进行预处理得到音频信号;S2,根据各麦克风之间的音频信号到达时间延迟和麦克风阵列的位置信息对音频信号进行声源的定位,计算出俯仰角、方位角和目标距离;S3,根据计算出的俯仰角、方位角和目标距离对定位跟踪装置进行移动和转向,到达声源位置。

【技术特征摘要】

【专利技术属性】
技术研发人员:汤道宇
申请(专利权)人:北京品创汇通科技有限公司
类型:发明
国别省市:北京;11

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1