一种声源测向方法、装置和用于声源测向的装置制造方法及图纸

技术编号:21889523 阅读:29 留言:0更新日期:2019-08-17 13:38
本发明专利技术实施例提供了一种声源测向方法、装置和用于声源测向的装置。其中的方法具体包括:通过麦克风阵列接收声源的时域信号;确定所述时域信号对应的频域信号;所述频域信号包括:麦克风阵元在时帧和频带对应的信号;确定所述频域信号对应的自相关矩阵、以及所述自相关矩阵对应的信号观测向量;确定所述信号观测向量对应的稀疏向量;依据所述稀疏向量,确定所述声源的定位结果。本发明专利技术实施例可以提高声源的定位结果的准确度,以及可以提高声源测向的鲁棒性。

A Sound Source Direction Finding Method, Device and Device for Sound Source Direction Finding

【技术实现步骤摘要】
一种声源测向方法、装置和用于声源测向的装置
本专利技术涉及信号处理
,尤其涉及一种声源测向方法、装置和用于声源测向的装置。
技术介绍
声源测向技术可以指示声源所在的空间位置(以下简称声源位置),为后续的信息采集与处理提供重要的空间信息,故可被广泛应用于电话会议、视频会议、视频电话、家居监控、军事追踪等场景。在实际应用中,声源的定位结果也即声源在空间上的位置,其可通过方位角、俯仰角、距离等位置特征来表述。当前,基于TDOA(波达时延差,TimeDifferenceofArrival)的方法是一种常用的声源测向方法,其实现原理为:利用广义互相关等时延估计算法求出信号到麦克风阵列中不同麦克风的相对时延,并利用时延信息与麦克风阵列的空间分布关系估计声源位置。专利技术人在实施本专利技术实施例的过程中发现,基于TDOA的方法的鲁棒性较差,具体地,在定位环境混响或噪声较大的情况下,声源测向性能下降,无法实现声源的精确定位。
技术实现思路
本专利技术实施例提供了一种声源测向方法、装置和用于声源测向的装置,可以提高声源的定位结果的准确度,以及可以提高声源测向的鲁棒性。为了解决上述问题,本专利技术实施例公开了一种声源测向方法,包括:通过麦克风阵列接收声源的时域信号;确定所述时域信号对应的频域信号;所述频域信号包括:麦克风阵元在时帧和频带对应的信号;确定所述频域信号对应的自相关矩阵、以及所述自相关矩阵对应的信号观测向量;确定所述信号观测向量对应的稀疏向量;依据所述稀疏向量,确定所述声源的定位结果。可选地,所述确定所述信号观测向量对应的稀疏向量,包括:将多个所述频带划分到对应的频带组;确定所述信号观测向量和所述频带组对应的稀疏向量。可选地,所述频带组对应的中心频率为预设频率。可选地,所述确定所述信号观测向量对应的稀疏向量,包括:确定信号观测向量、信号观测向量的稀疏表示、以及稀疏向量之间的映射关系;所述稀疏表示中声源信号与噪声分离;分别对所述稀疏表示中的声源信号与噪声进行建模,以得到所述稀疏表示包括的声源信号模型和噪声模型;依据所述映射关系、所述声源信号模型和所述噪声模型,确定所述声源信号所对应的稀疏向量。可选地,所述稀疏向量具有组稀疏性;所述依据所述映射关系、所述声源信号模型和所述噪声模型,确定所述声源信号所对应的稀疏向量,包括:利用稀疏贝叶斯学习方法、所述声源信号模型和所述噪声模型,对频带组对应的稀疏向量进行求解,以得到所述信号观测向量对应的稀疏向量;所述频带组包括:多个所述频带。可选地,所述麦克风阵列为非均匀阵列。可选地,所述麦克风阵列包括:第一均匀线性阵列和第二均匀线性阵列,其中,所述第一均匀线性阵列的数量和所述第二均匀线性阵列的数量互质,且所述第一均匀线性阵列中第一麦克风阵元之间的距离和所述第二均匀线性阵列中第二麦克风阵列之间的距离不同。可选地,所述确定所述时域信号对应的频域信号,包括:对所述时域信号进行采样处理和分帧处理;将一个时帧的时域信号从时域转换为频域,并将频域分割为若干个频带,以得到麦克风阵元在时帧和频带对应的信号。另一方面,本专利技术实施例公开了一种声源测向装置,包括:接收模块,用于通过麦克风阵列接收声源的时域信号;时频转换模块,用于确定所述时域信号对应的频域信号;所述频域信号包括:麦克风阵元在时帧和频带对应的信号;信号观测向量确定模块,用于确定所述频域信号对应的自相关矩阵、以及所述自相关矩阵对应的信号观测向量;稀疏向量确定模块,用于确定所述信号观测向量对应的稀疏向量;以及定位结果确定模块,用于依据所述稀疏向量,确定所述声源的定位结果。可选地,所述稀疏向量确定模块包括:分组子模块,用于将多个所述频带划分到对应的频带组;第一稀疏向量确定子模块,用于确定所述信号观测向量和所述频带组对应的稀疏向量。可选地,所述频带组对应的中心频率为预设频率。可选地,所述稀疏向量确定模块包括:稀疏表示确定子模块,用于确定信号观测向量、信号观测向量的稀疏表示、以及稀疏向量之间的映射关系;所述稀疏表示中声源信号与噪声分离;建模子模块,用于分别对所述稀疏表示中的声源信号与噪声进行建模,以得到所述稀疏表示包括的声源信号模型和噪声模型;第二稀疏向量确定子模块,用于依据所述映射关系、所述声源信号模型和所述噪声模型,确定所述声源信号所对应的稀疏向量。可选地,所述稀疏向量具有组稀疏性;所述第二稀疏向量确定子模块,具体用于利用稀疏贝叶斯学习方法、所述声源信号模型和所述噪声模型,对频带组对应的稀疏向量进行求解,以得到所述信号观测向量对应的稀疏向量;所述频带组包括:多个所述频带。可选地,所述麦克风阵列为非均匀阵列。可选地,所述麦克风阵列包括:第一均匀线性阵列和第二均匀线性阵列,其中,所述第一均匀线性阵列的数量和所述第二均匀线性阵列的数量互质,且所述第一均匀线性阵列中第一麦克风阵元之间的距离和所述第二均匀线性阵列中第二麦克风阵列之间的距离不同。可选地,所述时频转换模块包括:采样分帧子模块,用于对所述时域信号进行采样处理和分帧处理;时频转换子模块,用于将一个时帧的时域信号从时域转换为频域,并将频域分割为若干个频带,以得到麦克风阵元在时帧和频带对应的信号。再一方面,本专利技术实施例公开了一种用于声源测向的装置,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:通过麦克风阵列接收声源的时域信号;确定所述时域信号对应的频域信号;所述频域信号包括:麦克风阵元在时帧和频带对应的信号;确定所述频域信号对应的自相关矩阵、以及所述自相关矩阵对应的信号观测向量;确定所述信号观测向量对应的稀疏向量;依据所述稀疏向量,确定所述声源的定位结果。可选地,所述确定所述信号观测向量对应的稀疏向量,包括:将多个所述频带划分到对应的频带组;确定所述信号观测向量和所述频带组对应的稀疏向量。可选地,所述频带组对应的中心频率为预设频率。可选地,所述确定所述信号观测向量对应的稀疏向量,包括:确定信号观测向量、信号观测向量的稀疏表示、以及稀疏向量之间的映射关系;所述稀疏表示中声源信号与噪声分离;分别对所述稀疏表示中的声源信号与噪声进行建模,以得到所述稀疏表示包括的声源信号模型和噪声模型;依据所述映射关系、所述声源信号模型和所述噪声模型,确定所述声源信号所对应的稀疏向量。可选地,所述稀疏向量具有组稀疏性;所述依据所述映射关系、所述声源信号模型和所述噪声模型,确定所述声源信号所对应的稀疏向量,包括:利用稀疏贝叶斯学习方法、所述声源信号模型和所述噪声模型,对频带组对应的稀疏向量进行求解,以得到所述信号观测向量对应的稀疏向量;所述频带组包括:多个所述频带。可选地,所述麦克风阵列为非均匀阵列。可选地,所述麦克风阵列包括:第一均匀线性阵列和第二均匀线性阵列,其中,所述第一均匀线性阵列的数量和所述第二均匀线性阵列的数量互质,且所述第一均匀线性阵列中第一麦克风阵元之间的距离和所述第二均匀线性阵列中第二麦克风阵列之间的距离不同。可选地,所述确定所述时域信号对应的频域信号,包括:对所述时域信号进行采样处理和分帧处理;将一个时帧的时域信号从时域转换为频域,并将频域分割为若干个频带,以得到麦克风阵元在时帧和频带对本文档来自技高网...

【技术保护点】
1.一种声源测向方法,其特征在于,所述方法包括:通过麦克风阵列接收声源的时域信号;确定所述时域信号对应的频域信号;所述频域信号包括:麦克风阵元在时帧和频带对应的信号;确定所述频域信号对应的自相关矩阵、以及所述自相关矩阵对应的信号观测向量;确定所述信号观测向量对应的稀疏向量;依据所述稀疏向量,确定所述声源的定位结果。

【技术特征摘要】
1.一种声源测向方法,其特征在于,所述方法包括:通过麦克风阵列接收声源的时域信号;确定所述时域信号对应的频域信号;所述频域信号包括:麦克风阵元在时帧和频带对应的信号;确定所述频域信号对应的自相关矩阵、以及所述自相关矩阵对应的信号观测向量;确定所述信号观测向量对应的稀疏向量;依据所述稀疏向量,确定所述声源的定位结果。2.根据权利要求1所述的方法,其特征在于,所述确定所述信号观测向量对应的稀疏向量,包括:将多个所述频带划分到对应的频带组;确定所述信号观测向量和所述频带组对应的稀疏向量。3.根据权利要求2所述的方法,其特征在于,所述频带组对应的中心频率为预设频率。4.根据权利要求1所述的方法,其特征在于,所述确定所述信号观测向量对应的稀疏向量,包括:确定信号观测向量、信号观测向量的稀疏表示、以及稀疏向量之间的映射关系;所述稀疏表示中声源信号与噪声分离;分别对所述稀疏表示中的声源信号与噪声进行建模,以得到所述稀疏表示包括的声源信号模型和噪声模型;依据所述映射关系、所述声源信号模型和所述噪声模型,确定所述声源信号所对应的稀疏向量。5.根据权利要求4所述的方法,其特征在于,所述稀疏向量具有组稀疏性;所述依据所述映射关系、所述声源信号模型和所述噪声模型,确定所述声源信号所对应的稀疏向量,包括:利用稀疏贝叶斯学习方法、所述声源信号模型和所述噪声模型,对频带组对应的稀疏向量进行求解,以得到所述信号观测向量对应的稀疏向量;所述频带组包括:多个所述频带。6.根据权利要求1至5中任一所述的方法,其特征在于,所述麦克风...

【专利技术属性】
技术研发人员:秦思赵成帅
申请(专利权)人:北京搜狗科技发展有限公司搜狗杭州智能科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1