一种三维空间音源定位方法及定位系统技术方案

技术编号:37617365 阅读:12 留言:0更新日期:2023-05-18 12:08
本发明专利技术提供一种三维空间音源定位方法及定位系统,定位方法包括:通过多个麦克风收集音源发出的信号X(t),对多个信号分别进行短时傅里叶变换,得到四个语谱图;通过对比四个语谱图来计算音源到另外三个麦克风相对原点位置麦克风的三个到达时延,根据声音传播速度与到每一个达时延的乘积得到三个距离差;根据三个距离差计算出音源的三维空间坐标(x,y,z),实现音源的三维空间定位。本发明专利技术提供的三维空间音源定位方法及系统,仅通过简单的运算就能实时获取声源的三维空间位置,能够在道路监测、区域安防以及紧急救援上提供帮助,有一定的应用价值。的应用价值。的应用价值。

【技术实现步骤摘要】
一种三维空间音源定位方法及定位系统


[0001]本专利技术涉及声学处理领域,更具体地,涉及一种三维空间音源定位方法及定位系统。

技术介绍

[0002]在道路监控系统的应用中,要抓捕违法鸣笛的车辆,只有及时准确锁定鸣笛车辆的位置,才能对违法行为做相应的惩罚,维护城市道路的规章制度。此外,监控摄像头存在拍不到死角,这对交通事故发生后的及时救援造成了一些不便。
[0003]传统道路检测应用中主要是依赖监控影像内容来判断是否有交通违法现象的发生,这无法对鸣笛现象进行有效的监测。而且监控摄像头存在死角,这会导致对一些事故高发区域的救援不够及时。将该系统安放在校园道路旁,理想状态下,该系统会实时得到违法鸣笛的车辆的空间坐标。将该系统安放在交通事故高发路段,该系统会监测异常声音的声源位置。相关监控人员或者智能系统可以结合监控影像实时定位事件发生方位,并了解事件大致情况。如在交通事故发生在高速公路上的时候,方便抢险救援人员在定位事故发生的位置后及时通过广播的方式快速传递指令,避免二次事故的发生。

技术实现思路

[0004]本专利技术针对现有技术中存在的技术问题,提供一种三维空间音源定位方法及定位系统。
[0005]根据本专利技术的第一方面,提供了一种三维空间音源定位方法,包括:
[0006]S100,设置包含四个麦克风的麦克风阵列,所述麦克风阵列的阵元大小为d,利用阵元中的每一个麦克风收集音源发出的信号X(t),得到X0(t)、X1(t)、X2(t)和X3(t);
[0007]S200,对信号X0(t)、X1(t)、X2(t)和X3(t)分别进行短时傅里叶变换,得到四个语谱图;
[0008]S300,通过对比四个语谱图来计算音源到另外三个麦克风相对原点位置麦克风的三个到达时延,根据声音传播速度与到每一个达时延的乘积得到三个距离差;
[0009]S400,根据三个距离差计算出音源的三维空间坐标(x,y,z),实现音源的三维空间定位。
[0010]根据本专利技术的第二方面,提供一种三维空间音源定位系统,包括包含四个麦克风的麦克风阵列和处理模块;
[0011]四个麦克风,用于收集音源发出的信号X(t),得到X0(t)、X1(t)、X2(t)和X3(t);
[0012]所述处理模块包括:
[0013]变换单元,用于对信号X0(t)、X1(t)、X2(t)和X3(t)分别进行短时傅里叶变换,得到四个语谱图;
[0014]计算单元,用于通过对比四个语谱图来计算音源到另外三个麦克风相对原点位置麦克风的三个到达时延,根据声音传播速度与到每一个达时延的乘积得到三个距离差;
[0015]第二计算单元,用于根据三个距离差计算出音源的三维空间坐标(x,y,z),实现音源的三维空间定位。
[0016]本专利技术提供的一种三维空间音源定位方法及定位系统,提供的三维空间音源定位方法及系统,仅通过简单的运算就能实时获取声源的三维空间位置,能够在道路监测、区域安防以及紧急救援上提供帮助,有一定的应用价值。
附图说明
[0017]图1为本专利技术提供的一种三维空间音源定位方法流程图;
[0018]图2为四个麦克风的分布示意图;
[0019]图3为本专利技术提供的一种三维空间音源定位系统的结构示意图;
[0020]图4为图3中的处理模块的内部结构示意图。
具体实施方式
[0021]为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。另外,本专利技术提供的各个实施例或单个实施例中的技术特征可以相互任意结合,以形成可行的技术方案,这种结合不受步骤先后次序和/或结构组成模式的约束,但是必须是以本领域普通技术人员能够实现为基础,当技术方案的结合出现相互矛盾或无法实现时,应当认为这种技术方案的结合不存在,也不在本专利技术要求的保护范围之内。
[0022]图1为本专利技术提供的一种三维空间音源定位方法流程图,如图1所示,方法包括:
[0023]S100,设置包含四个麦克风的麦克风阵列,所述麦克风阵列的阵元大小为d,利用阵元中的每一个麦克风收集音源发出的信号X(t),得到X0(t)、X1(t)、X2(t)和X3(t)。
[0024]可参见图2,为麦克风阵列分布示意图,含有四个麦克风的阵列的形状类似于三维坐标系,一个麦克风M0位于三维坐标系的原点,其他三个麦克风M1、M2、M3分别位于三维坐标系的x轴、y轴、z轴上,与原点距离均为d。
[0025]如图2所示摆放四个麦克风组成麦克风阵列,在(x,y,z)处使用喇叭播放音频,利用数字采集卡采集四个麦克风收集到的音频信号传递到上位机中。
[0026]麦克风M0收集音源发出的信号X0(t),麦克风M1收集音源发出的信号X1(t),麦克风M2收集音源发出的信号X2(t),麦克风M3收集音源发出的信号X3(t)。
[0027]S200,对信号X0(t)、X1(t)、X2(t)和X3(t)分别进行短时傅里叶变换,得到四个语谱图。
[0028]可理解的是,对每一个麦克风收集的音源发出的信号X0(t)、X1(t)、X2(t)和X3(t)分别进行短时傅里叶变换,得到对应语谱图。
[0029]具体的,对每一个信号进行短时傅里叶变换的具体过程如下:
[0030]S210,根据监测信号的特征,对收集到的信号X0(t)、X1(t)、X2(t)和X3(t)进行去趋势项、降噪、带通滤波以及归一化,得到I0(t)、I1(t)、I2(t)和I3(t);
[0031]S220,使用下列短时傅里叶算法分别对I0(t)、I1(t)、I2(t)和I3(t)进行短时傅里
叶变换,得到Y0和Y1、Y2和Y3:
[0032]S230,x(m)是输入信号,ω(m)是窗函数;它在时间上翻转并且有n个样本的偏移量;
[0033]S240,矩阵为横坐标包含时间信息和纵坐标包含频率信息的语谱图。
[0034]通过上述步骤S210至步骤S240,对信号I0(t)、I1(t)、I2(t)和I3(t)分别进行短时傅里叶变换,得到对应的语谱图。
[0035]S300,通过对比四个语谱图来计算音源到另外三个麦克风相对原点位置麦克风的三个到达时延,根据声音传播速度与到每一个达时延的乘积得到三个距离差。
[0036]可理解的是,由收集到的信号在不同时间段的频率具有不一致性,通过对比信号的短时傅里叶变换得到的语谱图来计算音源到另外三个麦克风相对原点位置麦克风的到达时延,再由声音的传播速度与到达时延的乘积得到距离差。
[0037]根据多个语谱图计算到达时延和距离差的具体步骤包括:
[0038]S310,使用下列公式求出X本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种三维空间音源定位方法,其特征在于,包括:S100,设置包含四个麦克风的麦克风阵列,所述麦克风阵列的阵元大小为d,利用阵元中的每一个麦克风收集音源发出的信号X(t),得到X0(t)、X1(t)、X2(t)和X3(t);S200,对信号X0(t)、X1(t)、X2(t)和X3(t)分别进行短时傅里叶变换,得到四个语谱图;S300,通过对比四个语谱图来计算音源到另外三个麦克风相对原点位置麦克风的三个到达时延,根据声音传播速度与到每一个达时延的乘积得到三个距离差;S400,根据三个距离差计算出音源的三维空间坐标(x,y,z),实现音源的三维空间定位。2.根据权利要求1所述的三维空间音源定位方法,其特征在于,所述S100,设置包含四个麦克风的麦克风阵列,包括:含有四个麦克风的阵列的形状类似于三维坐标系,一个麦克风M0位于三维坐标系的原点,其他三个麦克风M1、M2、M3分别位于三维坐标系的x轴、y轴、z轴上,与原点距离均为d;麦克风M0收集音源发出的信号X0(t),麦克风M1收集音源发出的信号X1(t),麦克风M2收集音源发出的信号X2(t),麦克风M3收集音源发出的信号X3(t)。3.根据权利要求1所述的三维空间音源定位方法,其特征在于,所述S200,对信号X0(t)、X1(t)、X2(t)和X3(t)分别进行短时傅里叶变换,得到四个语谱图,包括:S210,根据监测信号的特征,对收集到的信号X0(t)、X1(t)、X2(t)和X3(t)进行去趋势项、降噪、带通滤波以及归一化,得到I0(t)、I1(t)、I2(t)和I3(t);S220,使用下列短时傅里叶算法分别对I0(t)、I1(t)、I2(t)和I3(t)进行短时傅里叶变换,得到Y0和Y1、Y2和Y3:x(m)是输入信号,ω(m)是窗函数;它在时间上翻转并且有n个样本的偏移量;S240,矩阵为横坐标包含时间信息和纵坐标包含频率信息的语谱图。4.根据权利要求3所述的三维空间音源定位方法,其特征在于,所述S300,通过对比四个语谱图来计算音源到另外三个麦克风相对原点位置麦克风的三个到达时延,根据声音传播速度与到每一个达时延的乘积得到三个距离差,包括:S310,使用下列公式求出X1(t)、X2(t)和X3(t)信号对应的语谱图分别与X0(t)信号对应的语谱图之间的时间延迟,其中|
·
|代表对矩阵内每一个元素求绝对值,其中∑∑代表对矩阵内所有元素求和:S320,R1=[r0…
r
n
],其中r
i
=∑∑|Y1[i:n]

Y0[0:n

i]|
÷
(n

i+1),R2=[r0…
r
n
],其中r
i
=∑∑|Y2[i:n]

Y0[0:n

i]|
÷
(n

i+1),R3=[r0…
r
n
],其中r
i
=∑∑|Y3[i:n]

Y0[0:n

i]|
÷
(n

i+1);S330,分别求出数列R1、R2、R3中最小值对应的下标j1、j2、j3,将j1、j2、j3根据选择的短时傅里叶变换的步长和语音信号的采样率可转换为时间延迟D1、D2...

【专利技术属性】
技术研发人员:李小强曹巍诸文秀张益豪
申请(专利权)人:杭州楚芯光电科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1