当前位置: 首页 > 专利查询>中南大学专利>正文

一种基于被动式声音信号的声源定位方法技术

技术编号:37155125 阅读:29 留言:0更新日期:2023-04-06 22:16
本发明专利技术公开了一种基于被动式声音信号对声源进行定位的方法,目的是解决目前定位方法复杂度高、速度慢、精度较差、不适宜三维场景等问题。技术方案是首先选择线性麦克风阵列;选择声音传播模型为远场模型,搭建信号传播路径,简化远场声源定位模型,构建虚拟的壁镜麦克风阵列;然后采用自相关算法和互相关算法测量三种时延参数;基于三种时延参数建立三个损失函数;最后基于梯度下降方法最小化三个损失函数之和测量声源坐标。本发明专利技术在二维场景下定位声源比现有技术精度更高、速度更快,且本发明专利技术在三维场景同样也实现了较高的精度,解决了现有方法只能定位声源二维坐标的问题。现有方法只能定位声源二维坐标的问题。现有方法只能定位声源二维坐标的问题。

【技术实现步骤摘要】
一种基于被动式声音信号的声源定位方法


[0001]本专利技术涉及物联网领域被动式声源定位方法,特别涉及一种基于被动式声音信号的声源定位方法。

技术介绍

[0002]被动式声音信号,顾名思义是被观测物体发出声音,被观测物体作为声源,发出的声音信号就是被动式声音信号。基于这种声音信号可以建立观测主体与被观测物体之间的联系。被动式声音信号定位声源在物联网领域具有广泛应用。例如在安全领域,可以检测是否因为发出声音的是窗户等破碎造成的非法闯入。在智能家居领域,通过人的发声可以实现人机交互;在公共场合可以检测噪声来源,如汽车非法鸣笛,从而做出相应的处理来减少噪声污染。
[0003]一般来说,人类的双耳具有初步的声源定位功能,但是只能近似判断声音的方向(direction),对于声源距离(distance)的判定往往只能实现很低精度。近些年,学术界一些学者通过设计单麦克风结合超材料的方式、使用深度学习方法进行盲音分离、音源增强的研究和工作。同时,使用麦克风阵列利用声音进行测距也是一个可以实现定位的方法。基于麦克风传感器阵列设备的声源测距方法具有处理简单、成本低等特质。由于这些特性,麦克风阵列在声音增强、声音降噪、户外直播、盲声源分离等场景有广泛的研究。市场中也有基于麦克风阵列进行指定说话人的人声增强的产品。
[0004]麦克风阵列指的是具有特定拓扑形状和功能的一种麦克风排列。麦克风阵列由一定数目的麦克风组成,通过麦克风对环境中的声音信号进行采样。
[0005]一般来说,有以下几种常用的基于阵列信号的声源定位方法:高分辨谱估计方法(High Resolution Spectrum Estimation)、波束形成器方法(Beamforming)、到达时间差方法(Time Difference of Arrial,TDOA)。对传感器阵列接收信号进行融合、去重,计算机可估计声源在三维空间中的位置,从而实现对被观测物体定位的功能。
[0006]TDOA(到达时间差方法,Time Difference of Arrial)定位算法是一种常用于声源定位的方法(见文献Sheng Shen,Daguan Chen,Yu

Lin Wei,Zhijian Yang,and Romit Roy Choudhury等人的论文,“Voice localization using nearby wall reflections”:基于周边墙壁声音反射的定位方法)。该方法是基于到达不同麦克风的时间差进行声源方向定位的方法。在麦克风阵列上使用TDOA算法,可以方便地估计被观测物体方向角。TDOA算法通过使用广义互相关的方法,计算两个麦克风阵列收到声音信号的最大互相关信号峰值,依次对不同麦克风测量不同的到达时间差。该最大峰对应的横坐标,就是两条声音信号的到达时间差。该方法的精度受到麦克风阵列大小的制约,目前达到误差在0.5m内的精度范围。(见文献Sheng Shen,Daguan Chen,Yu

Lin Wei,Zhijian Yang,and Romit Roy Choudhury等人的论文,“Voice localization using nearby wall reflections,”:基于周边墙壁声音反射的定位方法)TDOA方法使小麦克风在实际场景中很难提供高精度的定位,其次目前的方法很难扩展到三维场景。
[0007]如何降低时间复杂度、提高声源定位的精度和速度,是本领域技术人员极为关注的技术问题。

技术实现思路

[0008]本专利技术要解决的技术问题是针对目前TDOA方法中复杂度高、定位速度慢、定位精度较差、很难扩展到三维场景等问题,提供一种基于被动式声音信号的声源定位方法。降低时间复杂度、提高声源定位的精度和速度,并扩展到三维场景。
[0009]技术方案是:首先选择麦克风阵列,选择声音传播模型为远场模型,搭建信号传播路径,简化远场模型,构建虚拟的壁镜麦克风阵列;然后采用自相关算法和互相关算法测量三种时延参数,基于三种时延参数建立三个损失函数,最后基于梯度下降方法最小化三个损失函数之和测量声源坐标。
[0010]本专利技术包括如下步骤:
[0011]第一步,选择麦克风阵列,方法是:
[0012]步骤1.1选择线性麦克风阵列,麦克风阵列从形状上分类,可分为线性、圆形阵列等。线性麦克风阵列,即麦克风排列呈直线;圆形阵列即麦克风排列成圆形。线性阵列较为简单,在很多情况下可将声波看成是平面波,可以使用线性阵列的算法,所以选择线性麦克风阵列。
[0013]步骤1.2确定线性麦克风阵列中的麦克风数量:从数量上来分,可分为二麦、三麦、四麦、六麦等。麦克风数量越多,算法上更容易实现声音的降噪、声音的增强,为了提高测量的精度,选择四麦或六麦的阵列,即麦克风数量I为4或6。
[0014]步骤1.3确定麦克风阵列款式为树莓派款式:麦克风阵列有搭载于树莓派(一种微型嵌入式计算机)上的款式,也有USB接入电脑的款式。USB接入电脑的款式需要依赖于电脑进行计算处理,而树莓派款式可以在麦克风阵列自身内嵌的微型计算机进行一些计算任务。因此,树莓派款式比USB接入电脑的款式更适合普遍的物联网环境,所以选用树莓派款式。
[0015]第二步,搭建声源测距定位模型。选择声音传播模型为远场模型,搭建信号传播路径;简化远场模型;构建虚拟的壁镜麦克风阵列。方法是:
[0016]步骤2.1搭建远场定位模型和信号多路传播路径,方法如下:
[0017]步骤2.1.1由于麦克风阵列规模较小,选用远场定位模型(见书籍John C Curlander and Robert N McDonough,Synthetic aperture radar,vol.11,Wiley,New York,1991.)。远场定位模型中声音信号到达每个麦克风传感器的方向角近似或相同。
[0018]步骤2.1.2搭建信号多路传播路径。
[0019]设声源发出的信号是s(t),t是声音信号的发送时刻,第i个麦克风采集到的声源信号y
i
(t)的数学模型为公式(1),i为正整数且1≤i≤I:
[0020][0021]其中,K为声音信号到达第i个麦克风的传播路径条数,α
k
为第k条路径的传播衰减因子(声源信号到达第i个麦克风后的强度与声源发射时信号强度的比值),在三维场景下
存在高度角,是第i个麦克风第k条路径的高程角,是第i个麦克风第k条路径的水平角,为声音信号沿第k条传递到第i个麦克风的时延、n
i
(t)为第i个麦克风采集到的噪声信号,为第i个麦克风接收的声源在时刻发射的声音信号。表示第i个麦克风关于夹角与夹角的导向矢量(steering vector,见文献综述S.Gannot,E.Vincent,S.Markovich

Golan,and A.Ozerov,“A Consolidated Perspe本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于被动式声音信号的声源定位方法,其特征在于包括以下步骤:第一步,选择麦克风阵列为线性麦克风阵列,麦克风数量为I,I为正整数;第二步,搭建声源测距定位模型;选择声音传播模型为远场模型,搭建信号传播路径;简化远场模型;构建虚拟的壁镜麦克风阵列;方法是:步骤2.1搭建远场定位模型和信号多路传播路径,方法如下:步骤2.1.1选用远场定位模型,远场定位模型中声音信号到达每个麦克风传感器的方向角近似或相同;步骤2.1.2搭建信号多路传播路径:设声源发出的信号是s(t),t是声音信号的发送时刻,第i个麦克风采集到的声源信号y
i
(t)的数学模型为公式(1),i为正整数且1≤i≤I:其中,K为声音信号到达第i个麦克风的传播路径条数,α
k
为第k条路径的传播衰减因子,在三维场景下存在高度角,是第i个麦克风第k条路径的高程角,是第i个麦克风第k条路径的水平角,为声音信号沿第k条传递到第i个麦克风的时延、n
i
(t)为第i个麦克风采集到的噪声信号,为第i个麦克风接收的声源在时刻发射的声音信号;表示第i个麦克风关于夹角与夹角的导向矢量;步骤2.2对声源信号y
i
(t)的数学模型进行简化,方法是:按到达方式划分麦克风接收到的信号,将直接通过空气到达麦克风的声源信号记为LOS信号,将通过墙壁反射被麦克风接收的声源信号记为ECHO信号,提取LOS信号和正好反射进入麦克风话筒中心的ECHO信号,建立LOS信号直接传递给麦克风的路径和ECHO信号传递给麦克风的路径,令公式(1)中K=2;步骤2.3,构建虚拟的壁镜麦克风阵列,基于ECHO信号的路径将第一步选择的麦克风阵列即真实麦克风阵列等价成一个与墙壁垂直的壁镜麦克风阵列,真实麦克风阵列中每个麦克风与墙壁的距离相等,克风与墙壁的距离相等,为真实麦克风阵列中第i个麦克风与墙壁的距离;真实麦克风阵列与虚拟麦克风阵列镜面对称;真实麦克风阵列接收LOS信号,壁镜麦克风阵列接收ECHO信号,转第三步;第三步,测量信道时延,包括采用广义互相关的GCC

PHAT算法测量第一时延参数τ
L
,采用自相关算法测量第二时延参数τ
LE
和第三时延参数Δτ
LE
,第一时延参数τ
L
表示第1个麦克风与其它麦克风之间的LOS时延差,第二时延参数τ
LE
表示LOS信号与ECHO路径到达麦克风阵列中同一麦克风的时延差,第三时延参数Δτ
LE
表示LOS信号与ECHO路径的时延差之差,方法是:步骤3.1建立三维坐标模型,方法是:步骤3.1.1在与真实麦克风阵列平行的墙壁上任取一点作为原点,令原点坐标为(0,0,0),要求原点和I个麦克风话筒中心在同一水平面;步骤3.1.2沿真实麦克风阵列线性方向建立x轴;步骤3.1.3在水平垂直x轴的方向建立y轴,在竖直垂直x轴的方向建立z轴;步骤3.1.4设三维空间中声源的坐标为P
s
,令P
s
坐标为(x
s
,y
s
,z
s
);步骤3.2,测量第一时延参数τ
L
,方法:
步骤3.2.1测量真实麦克风阵列中第j个麦克风和第1个麦克风之间的LOS时延差τ
j,1
,2≤j≤I,得到τ
2,1
,...,τ
j,1
,...,τ
I,1
;步骤3.2.2将麦克风编号2,...,j,...,I作为横坐标,τ
2,1
,...,τ
j,1
,...,τ
I,1
作为纵坐标,在二维坐标平面上写成坐标形式(2,τ
2,1
),...,(j,τ
j,1
),...,(I,τ
I,1
);步骤3.2.3线性拟合坐标为(2,τ
2,1
),...,(j,τ
j,1
),...,(I,τ
I,1
)的I

1个点,得到拟合后的直线,命名为第一直线,令第一时延参数τ
L
等于第一直线的斜率;步骤3.3,测量第二时延参数τ
LE
和第三时延参数Δτ
LE
,方法是:步骤3.3.1测量第i个麦克风接收的LOS信号与ECHO信号的时延差得到转步骤3.3.2;步骤3.3.2将麦克风编号0,...,j

1,...,I

1作为横坐标,1作为横坐标,作为纵坐标,在二维坐标平面上写成坐标形式纵坐标,在二维坐标平面上写成坐标形式步骤3.3,3线性拟合这I个点,得到拟合后的直线,命名为第二直线,令第二时延参数τ
LE
等于第二直线的截距;步骤3.3.5令第三时延参数Δτ
LE
等于第二直线的斜率;第四步,基于τ
L
,τ
LE
和Δτ
LE
建立三个最小化损失函数,方法是:步骤4.1根据τ
L
建立第一损...

【专利技术属性】
技术研发人员:张永敏汤志鹏陈建熹李朝辉张尧学
申请(专利权)人:中南大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1