一种三维空间音源定位方法及定位系统技术方案

技术编号：37617365 阅读：12 留言：0更新日期：2023-05-18 12:08

本发明专利技术提供一种三维空间音源定位方法及定位系统，定位方法包括：通过多个麦克风收集音源发出的信号X(t)，对多个信号分别进行短时傅里叶变换，得到四个语谱图；通过对比四个语谱图来计算音源到另外三个麦克风相对原点位置麦克风的三个到达时延，根据声音传播速度与到每一个达时延的乘积得到三个距离差；根据三个距离差计算出音源的三维空间坐标(x,y,z)，实现音源的三维空间定位。本发明专利技术提供的三维空间音源定位方法及系统，仅通过简单的运算就能实时获取声源的三维空间位置，能够在道路监测、区域安防以及紧急救援上提供帮助，有一定的应用价值。的应用价值。的应用价值。

全部详细技术资料下载

【技术实现步骤摘要】
一种三维空间音源定位方法及定位系统

[0001]本专利技术涉及声学处理领域，更具体地，涉及一种三维空间音源定位方法及定位系统。

技术介绍

[0002]在道路监控系统的应用中，要抓捕违法鸣笛的车辆，只有及时准确锁定鸣笛车辆的位置，才能对违法行为做相应的惩罚，维护城市道路的规章制度。此外，监控摄像头存在拍不到死角，这对交通事故发生后的及时救援造成了一些不便。
[0003]传统道路检测应用中主要是依赖监控影像内容来判断是否有交通违法现象的发生，这无法对鸣笛现象进行有效的监测。而且监控摄像头存在死角，这会导致对一些事故高发区域的救援不够及时。将该系统安放在校园道路旁，理想状态下，该系统会实时得到违法鸣笛的车辆的空间坐标。将该系统安放在交通事故高发路段，该系统会监测异常声音的声源位置。相关监控人员或者智能系统可以结合监控影像实时定位事件发生方位，并了解事件大致情况。如在交通事故发生在高速公路上的时候，方便抢险救援人员在定位事故发生的位置后及时通过广播的方式快速传递指令，避免二次事故的发生。

技术实现思路

[0004]本专利技术针对现有技术中存在的技术问题，提供一种三维空间音源定位方法及定位系统。
[0005]根据本专利技术的第一方面，提供了一种三维空间音源定位方法，包括：
[0006]S100，设置包含四个麦克风的麦克风阵列，所述麦克风阵列的阵元大小为d，利用阵元中的每一个麦克风收集音源发出的信号X(t)，得到X0(t)、X1(t)、X2(t)和X3(t)；
[0007]S200...

【技术保护点】

【技术特征摘要】
1.一种三维空间音源定位方法，其特征在于，包括：S100，设置包含四个麦克风的麦克风阵列，所述麦克风阵列的阵元大小为d，利用阵元中的每一个麦克风收集音源发出的信号X(t)，得到X0(t)、X1(t)、X2(t)和X3(t)；S200，对信号X0(t)、X1(t)、X2(t)和X3(t)分别进行短时傅里叶变换，得到四个语谱图；S300，通过对比四个语谱图来计算音源到另外三个麦克风相对原点位置麦克风的三个到达时延，根据声音传播速度与到每一个达时延的乘积得到三个距离差；S400，根据三个距离差计算出音源的三维空间坐标(x，y，z)，实现音源的三维空间定位。2.根据权利要求1所述的三维空间音源定位方法，其特征在于，所述S100，设置包含四个麦克风的麦克风阵列，包括：含有四个麦克风的阵列的形状类似于三维坐标系，一个麦克风M0位于三维坐标系的原点，其他三个麦克风M1、M2、M3分别位于三维坐标系的x轴、y轴、z轴上，与原点距离均为d；麦克风M0收集音源发出的信号X0(t)，麦克风M1收集音源发出的信号X1(t)，麦克风M2收集音源发出的信号X2(t)，麦克风M3收集音源发出的信号X3(t)。3.根据权利要求1所述的三维空间音源定位方法，其特征在于，所述S200，对信号X0(t)、X1(t)、X2(t)和X3(t)分别进行短时傅里叶变换，得到四个语谱图，包括：S210，根据监测信号的特征，对收集到的信号X0(t)、X1(t)、X2(t)和X3(t)进行去趋势项、降噪、带通滤波以及归一化，得到I0(t)、I1(t)、I2(t)和I3(t)；S220，使用下列短时傅里叶算法分别对I0(t)、I1(t)、I2(t)和I3(t)进行短时傅里叶变换，得到Y0和Y1、Y2和Y3：x(m)是输入信号，ω(m)是窗函数；它在时间上翻转并且有n个样本的偏移量；S240，矩阵为横坐标包含时间信息和纵坐标包含频率信息的语谱图。4.根据权利要求3所述的三维空间音源定位方法，其特征在于，所述S300，通过对比四个语谱图来计算音源到另外三个麦克风相对原点位置麦克风的三个到达时延，根据声音传播速度与到每一个达时延的乘积得到三个距离差，包括：S310，使用下列公式求出X1(t)、X2(t)和X3(t)信号对应的语谱图分别与X0(t)信号对应的语谱图之间的时间延迟，其中|
·
|代表对矩阵内每一个元素求绝对值，其中∑∑代表对矩阵内所有元素求和：S320，R1＝[r0…
r
n
]，其中r
i
＝∑∑|Y1[i：n]
‑
Y0[0：n
‑
i]|
÷
(n
‑
i+1)，R2＝[r0…
r
n
]，其中r
i
＝∑∑|Y2[i：n]
‑
Y0[0：n
‑
i]|
÷
(n
‑
i+1)，R3＝[r0…
r
n
]，其中r
i
＝∑∑|Y3[i：n]
‑
Y0[0：n
‑
i]|
÷
(n
‑
i+1)；S330，分别求出数列R1、R2、R3中最小值对应的下标j1、j2、j3，将j1、j2、j3根据选择的短时傅里叶变换的步长和语音信号的采样率可转换为时间延迟D1、D2...

【专利技术属性】
技术研发人员：李小强，曹巍，诸文秀，张益豪，
申请(专利权)人：杭州楚芯光电科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人