当前位置: 首页 > 专利查询>黑龙江大学专利>正文

一种基于空间分布式麦克风的三维声源定位方法技术

技术编号:18113278 阅读:38 留言:0更新日期:2018-06-03 07:29
本发明专利技术公开了一种基于空间分布式麦克风的三维声源定位方法。该方法包括以下步骤:将声源定位的空间均等化分为若干个正方体作为声源位置、将由多个麦克风组成的麦克风阵列摆放在声源定位的空间内、在空间内建立空间直角坐标系、预处理,求相对时间、计算,建库、声源在空间内未知位置发声时坐标的提取,实现声源定位。所述定位方法具有实时定位声源的特点。

【技术实现步骤摘要】
一种基于空间分布式麦克风的三维声源定位方法
本专利技术涉及一种基于空间分布式麦克风的三维声源定位方法,属于声源定位

技术介绍
近年来,人工智能化异常火爆,智能化也必将由当下流行的手动控制慢慢转变为声音控制,未来的人机交互会很大程度上离开触控,声控会逐步取而代之;声音在人工智能、人机交互中扮演着举足轻重的角色,而声音处理的单麦克风方式渐显疲态,随着人工智能的发展,越来越多的领域单麦克风已经不能解决问题,所以由多个麦克风组成的麦克风阵列对声音的处理成为研究热点。当下流行的声源定位方法大多是“基于TDOA的声源定位”以及“基于可控波束的声源定位”等,例如基于两步定位的TDOA声源定位的方法;两步定位方法的方法第一步是对时延的估计,第二步是由得到的时延,结合麦克风阵列的物理结构,得到声源的位置。基于GCC和LMS组合的方法最常见;R.Parisi等人提出采用广义互相关法进行时延估计,该方法主要根据麦克风对不同麦克风接收同一语音信号而产生的时相对延进行声源定位。根据麦克风接收语音信号的模型,采用广义互相关法计算麦克风对接收语音信号的相关函数,根据相关函数峰值对应的点确定时延,这类算法在麦克风接受到信号后仍然进行大量的处理以及运算,很难满足声源的实时定位。
技术实现思路
本专利技术为了解决现有声源定位方法中计算量大,无法满足声源实时定位的技术问题,提出了一种基于空间分布式麦克风的三维声源定位方法,所采取的技术方案如下:一种基于空间分布式麦克风的三维声源定位方法,所述声源定位方法是将需要声源定位的三维空间均等划分为若干个正方体作为声源位置,并将每个正方体视为一个格点;将由多个麦克风组成的麦克风阵列摆放在所述三维空间内,其中,麦克风位于所述三维空间的各空间顶点上和空间棱边上;根据麦克风的分布并结合正方体格点的划分结构建立三维空间对应的直角坐标系,并对麦克风接收到的声源信息进行预处理,并求取所述声源位置发出声源到达麦克风的相对时间,对所述三维空间内位置位置发声时的坐标进行提取,并建立声音信息数据库,进而完成声源定位。进一步地,所述声源定位方法具体过程为:步骤一:将n个麦克风组成一个麦克风阵列,并将每个所述麦克风进行标号,其中,n表示正整数;步骤二:将所述三维空间均等分为若干个正方体,并将每个所述正方体视为一个声源位置;步骤三:将步骤一所述麦克风阵列摆放于需要声源定位的所述三维空间中,并且,将所述麦克风阵列中包含的麦克风设置于所述三维空间的各空间顶点和空间棱边上;所述麦克风摆放好后,所述麦克风的位置和对应的标号不再变动;步骤四:以麦克风的分布位置以及步骤二所述正方体的分布位置为坐标点建立所述三维空间对应的直角坐标系,获得待声源定位所述三维空间的直角坐标系;步骤五:使步骤二所述正方体依次作为声源点进行发声,对所述麦克风收集到的声源信息进行预处理,并计算每个作为声源点的正方体发生时,n个麦克风所产生的n-1个相对时间差;步骤六:对步骤五所述预处理之后产生的数据建立数据库;步骤七:根据步骤五所述相对时间差与步骤六所述数据库中的数据进行比对,并提取相应相对时间差对应的声源坐标,完成声源定位。进一步地,步骤一所述麦克风阵列的麦克风数量为12个,所述12个麦克风中,有8个麦克风对应设置于所述三维空间的8个空间顶点上,另外4个麦克风分别设置于所述三维空间的四个竖直方向的棱边的中心位置处。进一步地,步骤三所述正方体的大小相等,划分出来的所有所述正方体均包含在由多个麦克风组成的麦克风阵列所涵盖的三维空间内。进一步地,步骤五所述预处理的具体过程为:第一步:以步骤二所述若干个正方体中的一个正方体作为声源点,并启动所述声源点发声;第二步:将所述麦克风阵列中任一一个麦克风收到声息信号的时间作为时间零点,并将此麦克风标记为标准麦克风;第三步:对除第二步所述标准麦克风之外的n-1个麦克风接收到声息信息的时间与标准麦克风接收到声息信息时间相比产生的相对时间差进行计算。进一步地,步骤六所述建立数据库是依固定的顺序记录这n-1个麦克风相对于标准麦克风收到信号的相对时间,并记录n-1个相对时间,记录此时发声的坐标;依次在所有正方体里发声并记录每个正方体发声的相对时间以及坐标;以次建立一个适用于所述三维空间内声源定位的数据库;每1组n-1个相对时间对应一个坐标,所述数据库由这些相对时间以及相对时间对应的坐标组成;最后将每组坐标汇聚起来按发声顺序排列生成坐标参数数据库。进一步地,所述声源定位方法具体过程为:Step1:放置麦克风,形成麦克风阵列,具体将由12个麦克风组成的分布式麦克分阵列摆放在此长方体空间区域内。一旦摆放好,麦克风位置不再变动,并将每个麦克风标号,所述麦克风阵列的麦克风数量为12个,所述12个麦克风中,有8个麦克风对应设置于所述三维空间的8个空间顶点上,另外4个麦克风分别设置于所述三维空间的四个竖直方向的棱边的中心位置处;Step2:将待声源定位的三维空间进行均等分,具体将此空间均等分为N=72000个长宽高都为10cm的正方体;Step3:将所述麦克风阵列中任一一个麦克风收到声息信号的时间作为时间零点,并将此麦克风标记为标准麦克风;计算每个麦克风收到声音信号的时间,做差求出标准麦克风与其余麦克风接收信号的时间差值;所述时间差值分别标记为M1、M2、M3、M4、M5、M6、M7、M8、M9、M10、M11、M12;Step4:建立空间直角坐标系,具体为:以所述三维空间内的任意一点作为空间直角坐标系的原点,相应的就可以得到所有的麦克风以及正方体的坐标;Step5:对麦克风收到的声息信息进行预处理,并获取各麦克风接收到声息信息的接收时间与标准麦克风接收到声息信息的接收时间之间的相对时间,具体为:让所述三维空间内已知坐标上一个作为发生点的正方体发声,其中,声源坐标为rs=(xs,ys,zs),麦克风坐标Mi=(xi,yi,zi),(i=1,2,3,4,5,6,7,8,9,10,11,12),由于所述坐标已知,根据数学模型:可求出声音到达每个麦克风的时间,其中,C为声音传播速度,以其中一个麦克风作为标准,对比其他11个麦克风与已知坐标声源求出的时间与标准麦克风与已知坐标声源求出的时间做差,即可获得11个相对时间;Step6:对相对时间进行记录,并建立适用于所述三维空间的声源定位数据库;具体过程为:按照step5,将空间内所有的格点依次作为声源点发声;每个声源点都会产生一组数据与此声源点对应,进而72000个正方体即可产生72000组数据,记录这72000组数据以及与其对应的空间坐标,由此建立一个适用于本空间区域声源定位的数据库;根据所述相对时间差与所述数据库中的数据进行比对,即可提取相应相对时间差对应的声源坐标,完成声源定位。进一步地,将所述三维空间地面上四个拐角的其中一个作为step4所述坐标原点。本专利技术有益效果:本专利技术提出的基于空间分布式麦克风的三维定位方法可以在各麦克风收到声音信号后,对声音信号进行最少量的处理,最快速的给出定位结果。定位不能很好的实现实时性是因为几乎所有的定位工作都是在麦克风接收到声音信号以后。本专利技术提出的定位方法是在麦克风收到声息信号之前就对信号数据进行处理,而麦克风收到信号后直接提取之前处理好的信息进行比对,极大程本文档来自技高网...
一种基于空间分布式麦克风的三维声源定位方法

【技术保护点】
一种基于空间分布式麦克风的三维声源定位方法,其特征在于,所述声源定位方法是将需要声源定位的三维空间均等划分为若干个正方体作为声源位置,并将每个正方体视为一个格点;将由多个麦克风组成的麦克风阵列摆放在所述三维空间内,其中,麦克风位于所述三维空间的各空间顶点上和空间棱边上;根据麦克风的分布并结合正方体格点的划分结构建立三维空间对应的直角坐标系,并对麦克风接收到的声源信息进行预处理,并求取所述声源位置发出声源到达麦克风的相对时间,对所述三维空间内位置位置发声时的坐标进行提取,并建立声音信息数据库,进而完成声源定位。

【技术特征摘要】
1.一种基于空间分布式麦克风的三维声源定位方法,其特征在于,所述声源定位方法是将需要声源定位的三维空间均等划分为若干个正方体作为声源位置,并将每个正方体视为一个格点;将由多个麦克风组成的麦克风阵列摆放在所述三维空间内,其中,麦克风位于所述三维空间的各空间顶点上和空间棱边上;根据麦克风的分布并结合正方体格点的划分结构建立三维空间对应的直角坐标系,并对麦克风接收到的声源信息进行预处理,并求取所述声源位置发出声源到达麦克风的相对时间,对所述三维空间内位置位置发声时的坐标进行提取,并建立声音信息数据库,进而完成声源定位。2.根据权利要求1所述声源定位方法,其特征在于,所述声源定位方法具体过程为:步骤一:将n个麦克风组成一个麦克风阵列,并将每个所述麦克风进行标号,其中,n表示正整数;步骤二:将所述三维空间均等分为若干个正方体,并将每个所述立方体视为一个声源位置;步骤三:将步骤一所述麦克风阵列摆放于需要声源定位的所述三维空间中,并且,将所述麦克风阵列中包含的麦克风设置于所述三维空间的各空间顶点和空间棱边上;所述麦克风摆放好后,所述麦克风的位置和对应的标号不再变动;步骤四:以麦克风的分布位置以及步骤二所述正方体的分布位置为坐标点建立所述三维空间对应的直角坐标系,获得待声源定位所述三维空间的直角坐标系;步骤五:使步骤二所述正方体依次作为声源点进行发声,对所述麦克风收集到的声源信息进行预处理,并计算每个作为声源点的正方体发生时,n个麦克风所产生的n-1个相对时间差;步骤六:对步骤五所述预处理之后产生的数据建立数据库;步骤七:根据步骤五所述相对时间差与步骤六所述数据库中的数据进行比对,并提取相应相对时间差对应的声源坐标,完成声源定位。3.根据权利要求2所述声源定位方法,其特征在于,步骤一所述麦克风阵列的麦克风数量为12个,所述12个麦克风中,有8个麦克风对应设置于所述三维空间的8个空间顶点上,另外4个麦克风分别设置于所述三维空间的四个竖直方向的棱边的中心位置处。4.根据权利要求2所述声源定位方法,其特征在于,步骤三所述正方体的大小相等,划分出来的所有所述正方体均包含在由多个麦克风组成的麦克风阵列所涵盖的三维空间内。5.根据权利要求2所述声源定位方法,其特征在于,步骤五所述预处理的具体过程为:第一步:以步骤二所述若干个正方体中的一个正方体作为声源点,并启动所述声源点发声;第二步:将所述麦克风阵列中任一一个麦克风收到声息信号的时间作为时间零点,并将此麦克风标记为标准麦克风;第三步:对除第二步所述标准麦克风之外的n-1个麦克风接收到声息信息的时间与标准麦克风接收到声息信息时间相比产生的相对时间差进行计算。6.根据权利要求5所述声源定位方法,其特征在于,步骤六所述建立数据库是依固定的顺序记录这n-1个麦克风相对于标准麦克风收到信号的相对时间,并记录n-1个相对时间,记录此时发声的坐标;依次在所有正方体里发声并记录每个正方体发声...

【专利技术属性】
技术研发人员:刘勇胡志强蒋大庆孙志啸王鑫张越刘紫薇
申请(专利权)人:黑龙江大学哈尔滨普曼科技有限公司
类型:发明
国别省市:黑龙江,23

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1