当前位置: 首页 > 专利查询>大连大学专利>正文

混响房间内分布式麦克风阵列多声源定位的恢复块稀疏信号的算法制造技术

技术编号:19818130 阅读:22 留言:0更新日期:2018-12-19 13:27
混响房间内分布式麦克风阵列多声源定位的恢复块稀疏信号的算法,属于信号处理领域,为了使用欠定数量的麦克风阵列解决定位问题,要点是由如下欠定线性方程组求解块稀疏信号S:X=ΦS,其中:X表示M个麦克风接收到的观测信号,Φ是压缩观测矩阵,效果是由该算法实现了使用欠定数量的麦克风阵列就能对混响房间内的多个声源进行定位。

【技术实现步骤摘要】
混响房间内分布式麦克风阵列多声源定位的恢复块稀疏信号的算法
本专利技术属于信号处理领域,更进一步涉及一种基于压缩感知的混响房间内分布式欠定数量麦克风阵列多声源定位方法及系统。
技术介绍
随着通信行业的迅速发展,阵列信号处理成为一项研究热点。20世纪90年代以来,基于麦克风阵列的声源定位技术已在各个领域取得长足的进步与发展。比如在军事领域,声源定位技术可用于确定狙击手位置以及估计火炮发射位置等;在工业应用上,采用麦克风阵列声源定位技术对机械设备的故障进行定位;在安全监控方面,对于视频监控中存在的死角及视觉不佳的问题,声源定位技术可起到很好地补偿作用;在音/视频会议中,声源定位技术和语音增强技术的应用使与会者可在房间内自由走动而无需手动切换语音采集设备。然而,在像会议室这样的实际房间环境中,声源信号经房间墙壁、天花板、地面等的多次反射而形成房间混响。在混响条件下,常规的麦克风阵列声源定位算法,如基于高分辨率谱估计的定位算法或基于波达时延差的算法的定位性能显得颇为乏力,而基于最大输出功率的可控波束形成算法虽然抗混响能力较好,但在多声源情况下,这种算法须要克服初值敏感的问题,且为了提升定位精度,须以大量的麦克风阵列为代价。一般多声源定位算法大致分两类:一是基于传统的多重信号分类的声源定位算法,二是基于盲源分离-声达时差方法的声源定位算法。如文献(宋宫琨琨.基于麦克风阵列的室内语音定位算法研究[D].南京信息工程大学,2016.)提出的一种基于一致聚焦变换最小二乘法的麦克风阵列双声源定位算法,运用基于一致聚焦变换最小二乘法的宽带信号MUSIC算法,对室内近场双声源进行定位。纵观整个麦克风阵列声源定位算法的特点,现有的麦克风阵列声源定位技术仍无法摆脱三角定位的限制,即使采用信道盲分离技术,可恢复的声源数目依然无法超过麦克风数量;欠定盲源分离方法虽然能解决声源数大于麦克风数量的问题,但目前只能处理相对线性瞬时混叠的情况,不能处理卷积混叠和非线性混叠的情况。所以目前具有实用价值的麦克风阵列系统大都是海量阵列,即麦克风数量至少超过声源数目。压缩感知理论提出之后,被很多学者应用到阵列信号处理中,如文献(赵小燕,周琳,吴镇扬.基于压缩感知的麦克风阵列声源定位算法[J].东南大学学报(自然科学版),2015,45(2):203-207.)提出了一种基于压缩感知的声源定位算法,实现了在混响环境下使用3个麦克风定位1个声源的定位算法。该算法假设3个麦克风和说话人处于同一水平面,将声源可能存在的空间离散成36个位置(0°,10°,…,350°),并以这36个位置的房间冲激响应来构建字典,再采用OMP算法恢复出声源信号矢量,以矢量中最大元素对应空间位置作为实际声源的位置。文献(柯炜,张铭,张铁成.一种利用分布式传声器阵列的声源三维定位方法[J].声学学报,2017(3):361-369.)提出一种利用空间稀疏性和压缩感知原理的声源定位方法,该方法首先通过两次余弦变换提取声音信号特征,并用此特征构建稀疏定位模型,然后利用在线字典学习方法动态调整字典,克服稀疏模型与实际信号之间的失配问题,最后使用一种改进的平滑l0范数稀疏重构算法进行声源位置解算。以上两种算法虽然都实现了混响环境下麦克风阵列的声源定位,但使用麦克风数量依然多于空间中的声源数量。在像会堂、礼堂这样的大型室内公共场所的混响环境中,要实现多声源定位和语音分离,就需要大量的麦克风阵列采集设备,这无疑增加了系统的计算负担和硬件成本。在类似手机、电脑这样的语音通信设备日益小型化的今天,大而笨重的硬件设施显然过时,在达到精确定位目标的前提下,我们更希望使用的硬件设备更小巧、便捷,在麦克风阵列声源定位系统中,减少阵列数量也是减小阵列尺寸的一条有效路径。
技术实现思路
为了使用欠定数量的麦克风阵列解决定位问题,本专利技术提出如下技术方案:一种混响房间内分布式麦克风阵列多声源定位的恢复块稀疏信号的算法,由如下欠定线性方程组求解块稀疏信号S:X=ΦS其中:表示M个麦克风接收到的观测信号,Xm∈CF×1为第m个麦克风接收到的观测信号的频谱,Φ是压缩观测矩阵。进一步的,所述的欠定线性方程组的具体公式表达为:上式等号左侧第一项为M个麦克风接收到的观测信号在不同频点的值,是中每个麦克风接收到的信号取F个频点后的表示形式;等号右侧第一项为选取F个频点构造的压缩观测矩阵;等号右侧第二项为声源所在的二维网格中各个网格点信号在不同频点的频域表示,是块稀疏信号S在每个网格选取F个频点后按列堆叠而成的一维向量。有益效果:本专利技术所述的上述算法,不受阵型约束,且能够克服三角定位的限制,使用欠定数量的麦克风阵列(麦克风数量少于声源数)就能对混响房间内的多个声源进行定位。现有多声源定位算法中,麦克风数目不能少于声源数目;麦克风数量的增加不仅意味着算法的复杂度增加,硬件成本也将提高,本专利技术使用上述算法,使得欠定数量的麦克风阵列实现了对多个声源的同时定位,更符合语音通信设备小型化的趋势。本专利技术的麦克风阵列不受阵型约束,可随意放置,适合分布式阵列;且麦克风数量增减不影响算法框架,只需简单增减压缩观测矩阵行数即可。附图说明图1为本专利技术实现的基本流程图。图2为本专利技术模拟多个声源同时位于房间的不同位置时的定位仿真图;其中:(a)4个声源位于房间右上角,(b)5个声源同时分布于房间左上角左下角和右上角,(c)5个声源同时分布在房间左上角、右上角、右下角(d)6个声源同时位于房间左上角,(e)7个麦克风同时分布在房间右上角和左下角,(f)8个麦克风同时分布在房间中间。图3为本专利技术在不同混响时间下的定位成功率直方图。图4为本专利技术在不同频点数时的定位成功率直方图。图5为本专利技术在声源数目增加时的声源定位成功率折线图。图6为本专利技术方法与其他传统方法的定位对比图。具体实施方式为了使本专利技术的
技术实现思路
、特征等更加明显易懂,下面结合图1对本专利技术的实现步骤做出说明,简要的说,本专利技术混响房间内分布式麦克风阵列多声源定位方法,可以由软件实现,主要涉及下述步骤:(1)首先确定房间尺寸,即分别获取房间的长、宽、高数值,同时确定麦克风阵列的位置,均以米为单位。(2)构造房间冲激响应,生成压缩观测矩阵。(3)多声源信号、压缩观测矩阵以及麦克风观测数据三者之间的关系由欠定线性方程组所示,此为本专利技术提出的混响多声源定位算法模型。(4)麦克风观测数据为已知量,计算压缩观测矩阵,采用块稀疏优化算法求得声源信号的估计,对该估计信号进行整合,将非零块的位置与空间网格对应,即可得出声源和数目。对上述技术方案作出详细说明如下:根据混响多声源信号传播及麦克风接收信号的特点构造压缩感知定位算法;在已知房间尺寸和麦克风位置前提下,采用Image方法构造压缩观测矩阵;使用块稀疏优化对本专利技术提出的混响房间内欠定数量麦克风阵列多声源定位算法进行求解,得到空间中各个声源的位置及数目。具体步骤如下:1.构造压缩感知混响多声源定位算法1a)混响多声源传播模型描述室内混响环境下,声源数目未知的多声源多信道的时域传播模型为:其中xm表示第m个麦克风接收的信号,sn(t)表示第n个声源信号,hmn(t)表示第n个声源与第m个麦克风之间的信道,亦称为第n个声源与第m个麦克风之间的房间冲激响应,*为卷积符本文档来自技高网
...

【技术保护点】
1.一种混响房间内分布式麦克风阵列多声源定位的恢复块稀疏信号的算法,其特征在于:由如下欠定线性方程组求解块稀疏信号S:X=ΦS其中:

【技术特征摘要】
1.一种混响房间内分布式麦克风阵列多声源定位的恢复块稀疏信号的算法,其特征在于:由如下欠定线性方程组求解块稀疏信号S:X=ΦS其中:表示M个麦克风接收到的观测信号,Xm∈CF×1为第m个麦克风接收到的观测信号的频谱,Φ是压缩观测矩阵。2.如权利要1所述的混响房间内分布式麦克风阵列多声源定位的恢复块稀疏信号的算法,其特征在于:所...

【专利技术属性】
技术研发人员:张奕
申请(专利权)人:大连大学
类型:发明
国别省市:辽宁,21

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1