一种基于被动式声音信号的声源定位方法技术

技术编号：37155125 阅读：32 留言：0更新日期：2023-04-06 22:16

本发明专利技术公开了一种基于被动式声音信号对声源进行定位的方法，目的是解决目前定位方法复杂度高、速度慢、精度较差、不适宜三维场景等问题。技术方案是首先选择线性麦克风阵列；选择声音传播模型为远场模型，搭建信号传播路径，简化远场声源定位模型，构建虚拟的壁镜麦克风阵列；然后采用自相关算法和互相关算法测量三种时延参数；基于三种时延参数建立三个损失函数；最后基于梯度下降方法最小化三个损失函数之和测量声源坐标。本发明专利技术在二维场景下定位声源比现有技术精度更高、速度更快，且本发明专利技术在三维场景同样也实现了较高的精度，解决了现有方法只能定位声源二维坐标的问题。现有方法只能定位声源二维坐标的问题。现有方法只能定位声源二维坐标的问题。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于被动式声音信号的声源定位方法

[0001]本专利技术涉及物联网领域被动式声源定位方法，特别涉及一种基于被动式声音信号的声源定位方法。

技术介绍

[0002]被动式声音信号，顾名思义是被观测物体发出声音，被观测物体作为声源，发出的声音信号就是被动式声音信号。基于这种声音信号可以建立观测主体与被观测物体之间的联系。被动式声音信号定位声源在物联网领域具有广泛应用。例如在安全领域，可以检测是否因为发出声音的是窗户等破碎造成的非法闯入。在智能家居领域，通过人的发声可以实现人机交互；在公共场合可以检测噪声来源，如汽车非法鸣笛，从而做出相应的处理来减少噪声污染。
[0003]一般来说，人类的双耳具有初步的声源定位功能，但是只能近似判断声音的方向(direction)，对于声源距离(distance)的判定往往只能实现很低精度。近些年，学术界一些学者通过设计单麦克风结合超材料的方式、使用深度学习方法进行盲音分离、音源增强的研究和工作。同时，使用麦克风阵列利用声音进行测距也是一个可以实现定位的方法。基于麦克风传感器阵列设备的声...

【技术保护点】

【技术特征摘要】
1.一种基于被动式声音信号的声源定位方法，其特征在于包括以下步骤：第一步，选择麦克风阵列为线性麦克风阵列，麦克风数量为I，I为正整数；第二步，搭建声源测距定位模型；选择声音传播模型为远场模型，搭建信号传播路径；简化远场模型；构建虚拟的壁镜麦克风阵列；方法是：步骤2.1搭建远场定位模型和信号多路传播路径，方法如下：步骤2.1.1选用远场定位模型，远场定位模型中声音信号到达每个麦克风传感器的方向角近似或相同；步骤2.1.2搭建信号多路传播路径：设声源发出的信号是s(t)，t是声音信号的发送时刻，第i个麦克风采集到的声源信号y
i
(t)的数学模型为公式(1)，i为正整数且1≤i≤I：其中，K为声音信号到达第i个麦克风的传播路径条数，α
k
为第k条路径的传播衰减因子，在三维场景下存在高度角，是第i个麦克风第k条路径的高程角，是第i个麦克风第k条路径的水平角，为声音信号沿第k条传递到第i个麦克风的时延、n
i
(t)为第i个麦克风采集到的噪声信号，为第i个麦克风接收的声源在时刻发射的声音信号；表示第i个麦克风关于夹角与夹角的导向矢量；步骤2.2对声源信号y
i
(t)的数学模型进行简化，方法是：按到达方式划分麦克风接收到的信号，将直接通过空气到达麦克风的声源信号记为LOS信号，将通过墙壁反射被麦克风接收的声源信号记为ECHO信号，提取LOS信号和正好反射进入麦克风话筒中心的ECHO信号，建立LOS信号直接传递给麦克风的路径和ECHO信号传递给麦克风的路径，令公式(1)中K＝2；步骤2.3，构建虚拟的壁镜麦克风阵列，基于ECHO信号的路径将第一步选择的麦克风阵列即真实麦克风阵列等价成一个与墙壁垂直的壁镜麦克风阵列，真实麦克风阵列中每个麦克风与墙壁的距离相等，克风与墙壁的距离相等，为真实麦克风阵列中第i个麦克风与墙壁的距离；真实麦克风阵列与虚拟麦克风阵列镜面对称；真实麦克风阵列接收LOS信号，壁镜麦克风阵列接收ECHO信号，转第三步；第三步，测量信道时延，包括采用广义互相关的GCC
‑
PHAT算法测量第一时延参数τ
L
，采用自相关算法测量第二时延参数τ
LE
和第三时延参数Δτ
LE
，第一时延参数τ
L
表示第1个麦克风与其它麦克风之间的LOS时延差，第二时延参数τ
LE
表示LOS信号与ECHO路径到达麦克风阵列中同一麦克风的时延差，第三时延参数Δτ
LE
表示LOS信号与ECHO路径的时延差之差，方法是：步骤3.1建立三维坐标模型，方法是：步骤3.1.1在与真实麦克风阵列平行的墙壁上任取一点作为原点，令原点坐标为(0，0，0)，要求原点和I个麦克风话筒中心在同一水平面；步骤3.1.2沿真实麦克风阵列线性方向建立x轴；步骤3.1.3在水平垂直x轴的方向建立y轴，在竖直垂直x轴的方向建立z轴；步骤3.1.4设三维空间中声源的坐标为P
s
，令P
s
坐标为(x
s
，y
s
，z
s
)；步骤3.2，测量第一时延参数τ
L
，方法：
步骤3.2.1测量真实麦克风阵列中第j个麦克风和第1个麦克风之间的LOS时延差τ
j，1
，2≤j≤I，得到τ
2，1
，...，τ
j，1
，...，τ
I，1
；步骤3.2.2将麦克风编号2，...，j，...，I作为横坐标，τ
2，1
，...，τ
j，1
，...，τ
I，1
作为纵坐标，在二维坐标平面上写成坐标形式(2，τ
2，1
)，...，(j，τ
j，1
)，...，(I，τ
I，1
)；步骤3.2.3线性拟合坐标为(2，τ
2，1
)，...，(j，τ
j，1
)，...，(I，τ
I，1
)的I
‑
1个点，得到拟合后的直线，命名为第一直线，令第一时延参数τ
L
等于第一直线的斜率；步骤3.3，测量第二时延参数τ
LE
和第三时延参数Δτ
LE
，方法是：步骤3.3.1测量第i个麦克风接收的LOS信号与ECHO信号的时延差得到转步骤3.3.2；步骤3.3.2将麦克风编号0，...，j
‑
1，...，I
‑
1作为横坐标，1作为横坐标，作为纵坐标，在二维坐标平面上写成坐标形式纵坐标，在二维坐标平面上写成坐标形式步骤3.3，3线性拟合这I个点，得到拟合后的直线，命名为第二直线，令第二时延参数τ
LE
等于第二直线的截距；步骤3.3.5令第三时延参数Δτ
LE
等于第二直线的斜率；第四步，基于τ
L
，τ
LE
和Δτ
LE
建立三个最小化损失函数，方法是：步骤4.1根据τ
L
建立第一损...

【专利技术属性】
技术研发人员：张永敏，汤志鹏，陈建熹，李朝辉，张尧学，
申请(专利权)人：中南大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人