一种利用信号时频点相关性判别的多声源定位方法技术

技术编号：33457514 阅读：31 留言：0更新日期：2022-05-19 00:39

本发明专利技术提出一种利用信号时频点相关性判别的多声源定位方法，通过语音信号的时域相关性和局部频率稳定性进行单源点检测。首先，进行指导时频点的检测。其次，利用指导点的波达方向信息，通过指导点与相邻时频点的方向偏差测度进行帧内的单源点检测，得到指导点的频域相关单声源点。再次，结合帧间频率子带相关系数和指导点与相邻时频点的方向偏差测度，得到指导点的时域相关单声源点。然后，计算检测到的所有点的波达方向估计值，利用核密度估计和峰值搜索估计各声源的角度区间。最后，通过统计加权的精细定位得到各声源角度估计值。计加权的精细定位得到各声源角度估计值。计加权的精细定位得到各声源角度估计值。

全部详细技术资料下载

【技术实现步骤摘要】
一种利用信号时频点相关性判别的多声源定位方法

[0001]本专利技术属于语音信号处理领域中的声源定位领域，尤其涉及高混响场景下的多声源定位问题

技术介绍

[0002]语音信号的波达方向(Direction of arrival,DOA)估计在声学信号处理中具有重要意义。其旨在没有任何关于声源以及录制环境等先验知识的条件下，仅利用放置于听音环境中的麦克风录制的听音信号获取所有声源的空间位置信息。由于麦克风阵列网络的应用，实现了混响和噪声条件下的多源DOA估计，其相关技术如城市监测、目标检测、人机交互等也因此被用于更加复杂的环境。但高混响和噪声下的多源DOA估计还有待完善。
[0003]在实际应用过程中，由于多声源同时发声造成录制信号的混叠、麦克风阵列结构上的限制、场景中的混响效应和非平稳噪声等都会声源位置信息的获取产生负面影响，最终导致声源位置估计偏差甚至声源计数错误等问题。针对上述问题，国内外科技工作者开展了大量研究工作，先后提出了基于到达时间差的声源定位技术、基于高分辨率谱估计的定位技术、基于波束形成的声源定位技术...

【技术保护点】

【技术特征摘要】
1.一种利用信号时频点相关性判别的多声源定位方法，其特征在于包括以下步骤：步骤1，麦克风采集信号时
‑
频变换，获取指导时频点即指导点，并计算指导点及其相邻时频点的活动强度矢量；步骤2，计算帧内所有指导点与其相邻时频点的归一化波达方向偏差系数，并以此进行指导点的频域相关单声源点检测；步骤3，计算帧间归一化波达方向偏差系数；步骤4，计算帧间相关系数，并与帧间归一化波达方向偏差系数相结合，进行指导点的时域相关单声源点检测；步骤5，计算所有检测出的单声源点的DOA估计值，并通过核密度估计及峰值检测方式，计算各声源的角度估计区间；步骤6，通过基于统计加权的精细定位方式，计算各声源波达方向估计值。2.如权利要求1所述的一种利用信号时频点相关性判别的多声源定位方法，其特征在于：步骤1获取指导点并求取活动强度矢量：进行指导点的获取；A格式信号向量为：X
A
(n，k)＝[S
FLU
(n，k)，S
FRD
(n，k)，S
BLD
(n，k)，S
BRU
(n，k)]；其中，S
FLU
(n，k)，S
FRD
(n，k)，S
BLD
(n，k)，S
BRU
(n，k)是声场麦克风阵列中左前上、右前下、后左下、后右上四个麦克风采集信号的时频域表示，以下是各通路麦克采集信号在时频点(n，k)的向量角间距：其中，Re{
·
}和Im{
·
}分别为取实部和取虚部操作，T是转置运算符，|
·
|是取绝对值操作，||
·
||2表示求二范数操作；是向量角间距，的值范围为[0，1]，反映了麦克风阵列中各通道信号的相位一致性程度；时，各通道信号相位完全一致，时频点(n，k)为单声源点；值越大，各通道信号相位相似程度越高，该时频点中单声源成分占比越高；根据此准则，检测出单声源时频点称为指导时频点，简称为指导点；指导点用于判断其临近时频点是否为单声源时频点；检测出的指导点集合如下；其中，ε1为相位一致性检测阈值，该阈值的取值范围为[0.85，0.98]；该公式中Q
g
是所有满足条件的时频点(n，k)的集合；通过下式，得到B格式信号向量X
B
(n，k)＝[S
W
(n，k)，S
X
(n，k)，S
Y
(n，k)，S
Z
(n，k)]：B格式信号包含一个全向通道信号S
w
(n，k)和三个指向笛卡尔坐标系正方向的通道信号{S
X
(n，k)，S
Y
(n，k)，S
Z
(n，k)}；利用X
B
(n，k)计算时频点(n，k)的活动强度矢量：其中，I
B
(n，k)是计算出的时频点(n，k)的活动强度矢量，*是共轭运算符，Re{}是取实部操作，I
X
(n，k)、I
Y
(n，k)、I
Z
(n，k)是对应于笛卡尔坐标系中X、Y、Z轴正方向上的活动强度分
量。3.如权利要求1所述的一种利用信号时频点相关性判别的多声源定位方法，其特征在于：计算帧内所有指导点与其相邻时频点的归一化波达方向偏差系数，并以此进行指导点的频域相关单声源点检测；通过下式计算第n帧相邻两时频点(n，k)和(n，k
±
1)之间的矢量角偏差为：其中，I
B
(n，k)是计算出的时频点(n，k)的活动强度矢量，<
·
>为点乘积运算，||
·
||2表示求二范数操作；将两时频点间的矢量角偏差转化为角度信息并进行归一化，得到相邻频点间归一化波达方向偏差系数C
F
(n，k，k
±
1)，如下式：其中π为180度的弧度制表示；C
F
(n，k，k
±
1)反应了时频点(n，k)和时频点(n，k
±
1)所对应声源波达方向的差异，其取值范围在0到1之间；C
F
(n，k，k
±
1)越小，方向偏差越大；相反，C
F
(n，k，k
±
1)越大，方向偏差越小；当C
F
(n，k，k
±
1)＝1时，表示时频点(n，k
±
1)的声源波达方向(DOA)估计值与时频点(n，k)的DOA估计值一样；若时频点(n，k)为步骤1得到的指导点即(n，k)∈Q
g
，而时频点(n，k+1)或(n，k
‑
1)不是指导点即则通过相邻频点间归一化波达方向偏差系数来判别它们是否为单源时频点；通过此步骤检测出的新单源时频点称为指导点的频域相关单声源点，其集合Q
fu
和Q
fd
为：为：其中，ε2为频域相关性检测阈值，该阈值的取值范围为[0.85，0.98]；该公式中Q
fu
是所有满足条件C
F
(n，k，k+1)＞ε2，(n，k)∈Q
g
，的时频点(n，k)的集合；Q
fd
是所有满足条件C
F
(n，k，k
‑
1)＞ε2，(n，k)∈Q
g
，的时频点(n，k)的集合。4.如权利要求1所述的一种利用信号时频点相关性判别的多声源定位方法，其特征在于：计算帧间归一化波达方向偏差系数；利用步骤1得到的指导点，检测下一帧相邻时频点是否为单源点；若时频点(n
‑
1，k)为指导点(即，(n
‑
1，k)∈Q
g
)，而时频点(n，k)不被检测为指导点及指导点的频域相关单声源点(即，(n，k)根据语音信号的时域相关性，时频点(n，k)大概率也是一个单声源时频点；通过下式计算相邻帧第k个频率处两时频点(n
‑
1，k)和(n，k)之间活动强度矢量的矢量角偏差：其中，C
DT
(n
‑
1，n，k)为两个时频点间活动强度矢量的矢量角偏差，I
B
(n，k)是计算出的时频点(n，k)的活动强度矢量，<
·
>为点乘积运算，||
·
||2表示求二范数操作；将两时频点
间的矢量角偏差转化为角度信息并进...

【专利技术属性】
技术研发人员：李禄，贾懋珅，王一帆，刘锦祥，
申请(专利权)人：北京工业大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人