一种声源定位方法、装置和用于声源定位的装置制造方法及图纸

技术编号:21889521 阅读:14 留言:0更新日期:2019-08-17 13:38
本发明专利技术实施例提供了一种声源定位方法、装置和用于声源定位的装置。其中的方法具体包括:通过麦克风阵列接收声源的时域信号;确定所述时域信号对应的频域信号;所述频域信号包括:麦克风阵元在时间块的时帧和子频带对应的信号;依据所述时间块的频域信号对应的观测向量,确定所述麦克风阵列中麦克阵元对应的频响误差;依据所述频响误差,对所述时域信号对应的输出信号进行校正;依据校正后的输出信号,确定所述声源的定位结果。本发明专利技术实施例可以提高声源的定位性能。

A Sound Source Location Method, Device and Device for Sound Source Location

【技术实现步骤摘要】
一种声源定位方法、装置和用于声源定位的装置
本专利技术涉及信号处理
,尤其涉及一种声源定位方法、装置和用于声源定位的装置。
技术介绍
声源定位技术可以指示声源所在的空间方位(以下简称声源位置),为后续的信息采集与处理提供重要的空间信息,故可被广泛应用于电话会议、视频会议、视频电话、家居监控、军事追踪等场景。麦克风阵列可以指将多个麦克风阵元排列成线形、圆形、球形等几何拓扑结构的各种阵列。相较于单个麦克风阵元,麦克风阵列可以通过增加空间域,不仅对采集到的信号进行时域和频域分析处理,还可以对位于不同方位的信号进行空、时联合处理。基于麦克风阵列的声源定位可以结合语音信号处理技术和阵列信号处理技术及算法对获取的信号进行预处理和空、时联合处理,从而对声源在空间所处的位置信息进行估计。专利技术人在实施本专利技术实施例的过程中发现,麦克风阵元的传感器敏感元件的差异、硬件放大电路构造的差异、安装的差异以及传输信道的差异等因素,导致不同麦克风阵元之间的频率响应特性存在差异,因此使得声源的定位性能降低。
技术实现思路
本专利技术实施例提供了一种声源定位方法、装置和用于声源定位的装置,可以提高声源的定位性能。为了解决上述问题,本专利技术实施例公开了一种声源定位方法,包括:通过麦克风阵列接收声源的时域信号;确定所述时域信号对应的频域信号;所述频域信号包括:麦克风阵元在时间块的时帧和子频带对应的信号;依据所述时间块的频域信号对应的观测向量,确定所述麦克风阵列中麦克阵元对应的频响误差;依据所述频响误差,对所述时域信号对应的输出信号进行校正;依据校正后的输出信号,确定所述声源的定位结果。可选地,所述依据所述时间块的频域信号对应的观测向量,确定所述麦克阵元的频响误差,包括:依据所述时间块的频域信号对应的观测向量,确定声源位置对应的导向信号子空间与所述频域信号的噪声子空间之间的正交度量;依据所述正交度量,确定所述麦克风阵列中麦克阵元对应的频响误差。可选地,所述方法还包括:依据多个时间块的频域信号对应的观测向量,得到观测矩阵;依据所述观测矩阵,得到所述频域信号的噪声子空间。可选地,所述方法还包括:利用多重信号分类方法,确定声源位置对应的初值;依据所述初值,确定声源位置对应的导向信号子空间。可选地,所述依据所述正交度量,确定所述麦克风阵列中麦克阵元对应的频响误差,包括:确定频响误差对应的代价函数;在所述麦克风阵列中麦克阵元对应的频响误差最小的情况下,对所述代价函数进行求解,以得到所述麦克风阵列中麦克阵元对应的频响误差。可选地,所述时域信号对应的输出信号包括:观测矩阵;所述观测矩阵为依据多个时间块的频域信号对应的观测向量得到;所述依据所述频响误差,对所述时域信号对应的输出信号进行校正,包括:依据所述频响误差对应的校正矩阵,对所述观测矩阵进行校正。可选地,所述确定所述时域信号对应的频域信号,包括:对所述时域信号进行时间块划分,以得到时间块对应的时域信号;将一个时间块中时帧的时域信号从时域转换为频域,并将频域分割为若干个子频带,以得到麦克风阵元在时间块的时帧和子频带对应的信号。可选地,所述方法还包括:针对麦克风阵元在一个时间块的时帧和子频带对应的信号,确定对应的自相关矩阵;对所述自相关矩阵进行向量化,以得到所述时间块的频域信号对应的观测向量。可选地,所述依据校正后的输出信号,确定所述声源的定位结果,包括:利用稀疏贝叶斯学习方法,确定所述校正后的输出信号对应的稀疏向量;依据所述稀疏向量,确定所述声源的定位结果。可选地,所述利用稀疏贝叶斯学习方法,确定所述校正后的输出信号对应的稀疏向量,包括:将多个所述子频带划分到对应的子频带组;利用稀疏贝叶斯学习方法,确定所述校正后的输出信号和所述子频带组对应的稀疏向量。可选地,所述子频带组对应的中心频率为预设频率。可选地,所述麦克风阵列为非均匀阵列。可选地,所述麦克风阵列包括:第一均匀线性阵列和第二均匀线性阵列,其中,所述第一均匀线性阵列的数量和所述第二均匀线性阵列的数量互质,且所述第一均匀线性阵列中第一麦克风阵元之间的距离和所述第二均匀线性阵列中第二麦克风阵列之间的距离不同。另一方面,本专利技术实施例公开了一种声源定位装置,包括:接收模块,用于通过麦克风阵列接收声源的时域信号;频域信号确定模块,用于确定所述时域信号对应的频域信号;所述频域信号包括:麦克风阵元在时间块的时帧和子频带对应的信号;频响误差确定模块,用于依据所述时间块的频域信号对应的观测向量,确定所述麦克风阵列中麦克阵元对应的频响误差;校正模块,用于依据所述频响误差,对所述时域信号对应的输出信号进行校正;以及定位结果确定模块,用于依据校正后的输出信号,确定所述声源的定位结果。可选地,所述频响误差确定模块包括:正交度量确定子模块,用于依据所述时间块的频域信号对应的观测向量,确定声源位置对应的导向信号子空间与所述频域信号的噪声子空间之间的正交度量;以及频响误差确定子模块,用于依据所述正交度量,确定所述麦克风阵列中麦克阵元对应的频响误差。可选地,所述装置还包括:观测矩阵确定模块,用于依据多个时间块的频域信号对应的观测向量,得到观测矩阵;噪声子空间确定模块,用于依据所述观测矩阵,得到所述频域信号的噪声子空间。可选地,所述装置还包括:初值确定模块,用于利用多重信号分类方法,确定声源位置对应的初值;导向信号子空间确定模块,用于依据所述初值,确定声源位置对应的导向信号子空间。可选地,所述频响误差确定子模块包括:函数确定子模块,用于确定频响误差对应的代价函数;以及频响误差求解子模块,用于在所述麦克风阵列中麦克阵元对应的频响误差最小的情况下,对所述代价函数进行求解,以得到所述麦克风阵列中麦克阵元对应的频响误差。可选地,所述时域信号对应的输出信号包括:观测矩阵,所述观测矩阵为依据多个时间块的频域信号对应的观测向量得到;所述校正模块包括:校正子模块,用于依据所述频响误差对应的校正矩阵,对所述观测矩阵进行校正。可选地,所述频域信号确定模块包括:时间块划分子模块,用于对所述时域信号进行时间块划分,以得到时间块对应的时域信号;以及时频转换子模块,用于将一个时间块中时帧的时域信号从时域转换为频域,并将频域分割为若干个子频带,以得到麦克风阵元在时间块的时帧和子频带对应的信号。可选地,所述装置还包括:自相关矩阵确定模块,用于针对麦克风阵元在一个时间块的时帧和子频带对应的信号,确定对应的自相关矩阵;向量化模块,用于对所述自相关矩阵进行向量化,以得到所述时间块的频域信号对应的观测向量。可选地,所述定位结果确定模块包括:稀疏向量确定子模块,用于利用稀疏贝叶斯学习装置,确定所述校正后的输出信号对应的稀疏向量;定位结果确定子模块,用于依据所述稀疏向量,确定所述声源的定位结果。可选地,所述稀疏向量确定子模块包括:子频带组划分单元,用于将多个所述子频带划分到对应的子频带组;以及稀疏向量确定单元,用于利用稀疏贝叶斯学习方法,确定所述校正后的输出信号和所述子频带组对应的稀疏向量。可选地,所述子频带组对应的中心频率为预设频率。可选地,所述麦克风阵列为非均匀阵列。可选地,所述麦克风阵列包括:第一均匀线性阵列和第二均匀线性阵列,其中,所述第一均匀线性阵列的数量和所述第二均匀线性阵列的数量互质,且所述第一均匀线性阵列中本文档来自技高网...

【技术保护点】
1.一种声源定位方法,其特征在于,所述方法包括:通过麦克风阵列接收声源的时域信号;确定所述时域信号对应的频域信号;所述频域信号包括:麦克风阵元在时间块的时帧和子频带对应的信号;依据所述时间块的频域信号对应的观测向量,确定所述麦克风阵列中麦克阵元对应的频响误差;依据所述频响误差,对所述时域信号对应的输出信号进行校正;依据校正后的输出信号,确定所述声源的定位结果。

【技术特征摘要】
1.一种声源定位方法,其特征在于,所述方法包括:通过麦克风阵列接收声源的时域信号;确定所述时域信号对应的频域信号;所述频域信号包括:麦克风阵元在时间块的时帧和子频带对应的信号;依据所述时间块的频域信号对应的观测向量,确定所述麦克风阵列中麦克阵元对应的频响误差;依据所述频响误差,对所述时域信号对应的输出信号进行校正;依据校正后的输出信号,确定所述声源的定位结果。2.根据权利要求1所述的方法,其特征在于,所述依据所述时间块的频域信号对应的观测向量,确定所述麦克阵元的频响误差,包括:依据所述时间块的频域信号对应的观测向量,确定声源位置对应的导向信号子空间与所述频域信号的噪声子空间之间的正交度量;依据所述正交度量,确定所述麦克风阵列中麦克阵元对应的频响误差。3.根据权利要求2所述的方法,其特征在于,所述方法还包括:依据多个时间块的频域信号对应的观测向量,得到观测矩阵;依据所述观测矩阵,得到所述频域信号的噪声子空间。4.根据权利要求2所述的方法,其特征在于,所述方法还包括:利用多重信号分类方法,确定声源位置对应的初值;依据所述初值,确定声源位置对应的导向信号子空间。5.根据权利要求2所述的方法,其特征在于,所述依据所述正交度量,确定所述麦克风阵列中麦克阵元对应的频响误差,包括:确定频响误差对应的代价函数;在所述麦克风阵列中麦克阵元对应的频响误差最小的情况下,对所述代价函数进行求解,以得到所述麦克风阵列中麦克阵元对应的频响误差。6.根据权利要求1至5中任一所述的方法,其特征在于,所述时域信号对应的输出信号包括:观测矩阵;所述观测矩阵为依据多个时间块的频域信号对应的观测向量得到;所述依据所述频响误差,对所述时域信号对应的输出信号进行校正...

【专利技术属性】
技术研发人员:秦思赵成帅
申请(专利权)人:北京搜狗科技发展有限公司搜狗杭州智能科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1