【技术实现步骤摘要】
一种基于空间分布式麦克风的三维声源定位方法
本专利技术涉及一种基于空间分布式麦克风的三维声源定位方法,属于声源定位
技术介绍
近年来,人工智能化异常火爆,智能化也必将由当下流行的手动控制慢慢转变为声音控制,未来的人机交互会很大程度上离开触控,声控会逐步取而代之;声音在人工智能、人机交互中扮演着举足轻重的角色,而声音处理的单麦克风方式渐显疲态,随着人工智能的发展,越来越多的领域单麦克风已经不能解决问题,所以由多个麦克风组成的麦克风阵列对声音的处理成为研究热点。当下流行的声源定位方法大多是“基于TDOA的声源定位”以及“基于可控波束的声源定位”等,例如基于两步定位的TDOA声源定位的方法;两步定位方法的方法第一步是对时延的估计,第二步是由得到的时延,结合麦克风阵列的物理结构,得到声源的位置。基于GCC和LMS组合的方法最常见;R.Parisi等人提出采用广义互相关法进行时延估计,该方法主要根据麦克风对不同麦克风接收同一语音信号而产生的时相对延进行声源定位。根据麦克风接收语音信号的模型,采用广义互相关法计算麦克风对接收语音信号的相关函数,根据相关函数峰值对应的点确定时延,这类算法在麦克风接受到信号后仍然进行大量的处理以及运算,很难满足声源的实时定位。
技术实现思路
本专利技术为了解决现有声源定位方法中计算量大,无法满足声源实时定位的技术问题,提出了一种基于空间分布式麦克风的三维声源定位方法,所采取的技术方案如下:一种基于空间分布式麦克风的三维声源定位方法,所述声源定位方法是将需要声源定位的三维空间均等划分为若干个正方体作为声源位置,并将每个正方体视为一个格 ...
【技术保护点】
一种基于空间分布式麦克风的三维声源定位方法,其特征在于,所述声源定位方法是将需要声源定位的三维空间均等划分为若干个正方体作为声源位置,并将每个正方体视为一个格点;将由多个麦克风组成的麦克风阵列摆放在所述三维空间内,其中,麦克风位于所述三维空间的各空间顶点上和空间棱边上;根据麦克风的分布并结合正方体格点的划分结构建立三维空间对应的直角坐标系,并对麦克风接收到的声源信息进行预处理,并求取所述声源位置发出声源到达麦克风的相对时间,对所述三维空间内位置位置发声时的坐标进行提取,并建立声音信息数据库,进而完成声源定位。
【技术特征摘要】
1.一种基于空间分布式麦克风的三维声源定位方法,其特征在于,所述声源定位方法是将需要声源定位的三维空间均等划分为若干个正方体作为声源位置,并将每个正方体视为一个格点;将由多个麦克风组成的麦克风阵列摆放在所述三维空间内,其中,麦克风位于所述三维空间的各空间顶点上和空间棱边上;根据麦克风的分布并结合正方体格点的划分结构建立三维空间对应的直角坐标系,并对麦克风接收到的声源信息进行预处理,并求取所述声源位置发出声源到达麦克风的相对时间,对所述三维空间内位置位置发声时的坐标进行提取,并建立声音信息数据库,进而完成声源定位。2.根据权利要求1所述声源定位方法,其特征在于,所述声源定位方法具体过程为:步骤一:将n个麦克风组成一个麦克风阵列,并将每个所述麦克风进行标号,其中,n表示正整数;步骤二:将所述三维空间均等分为若干个正方体,并将每个所述立方体视为一个声源位置;步骤三:将步骤一所述麦克风阵列摆放于需要声源定位的所述三维空间中,并且,将所述麦克风阵列中包含的麦克风设置于所述三维空间的各空间顶点和空间棱边上;所述麦克风摆放好后,所述麦克风的位置和对应的标号不再变动;步骤四:以麦克风的分布位置以及步骤二所述正方体的分布位置为坐标点建立所述三维空间对应的直角坐标系,获得待声源定位所述三维空间的直角坐标系;步骤五:使步骤二所述正方体依次作为声源点进行发声,对所述麦克风收集到的声源信息进行预处理,并计算每个作为声源点的正方体发生时,n个麦克风所产生的n-1个相对时间差;步骤六:对步骤五所述预处理之后产生的数据建立数据库;步骤七:根据步骤五所述相对时间差与步骤六所述数据库中的数据进行比对,并提取相应相对时间差对应的声源坐标,完成声源定位。3.根据权利要求2所述声源定位方法,其特征在于,步骤一所述麦克风阵列的麦克风数量为12个,所述12个麦克风中,有8个麦克风对应设置于所述三维空间的8个空间顶点上,另外4个麦克风分别设置于所述三维空间的四个竖直方向的棱边的中心位置处。4.根据权利要求2所述声源定位方法,其特征在于,步骤三所述正方体的大小相等,划分出来的所有所述正方体均包含在由多个麦克风组成的麦克风阵列所涵盖的三维空间内。5.根据权利要求2所述声源定位方法,其特征在于,步骤五所述预处理的具体过程为:第一步:以步骤二所述若干个正方体中的一个正方体作为声源点,并启动所述声源点发声;第二步:将所述麦克风阵列中任一一个麦克风收到声息信号的时间作为时间零点,并将此麦克风标记为标准麦克风;第三步:对除第二步所述标准麦克风之外的n-1个麦克风接收到声息信息的时间与标准麦克风接收到声息信息时间相比产生的相对时间差进行计算。6.根据权利要求5所述声源定位方法,其特征在于,步骤六所述建立数据库是依固定的顺序记录这n-1个麦克风相对于标准麦克风收到信号的相对时间,并记录n-1个相对时间,记录此时发声的坐标;依次在所有正方体里发声并记录每个正方体发声...
【专利技术属性】
技术研发人员:刘勇,胡志强,蒋大庆,孙志啸,王鑫,张越,刘紫薇,
申请(专利权)人:黑龙江大学,哈尔滨普曼科技有限公司,
类型:发明
国别省市:黑龙江,23
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。