一种利用信号时频点角度分布信息的多声源定位方法技术

技术编号:36532164 阅读:12 留言:0更新日期:2023-02-01 16:15
本发明专利技术提出一种利用信号时频点角度分布信息的多声源定位方法。第一步,获得声场麦克风录制信号的时频点方位角和仰角信息。第二步,对每一帧录制信号在频域上划分子带,构建各子带内时频点的方位角集合和仰角集合。第三步,分别对方位角和仰角的取值范围进行区间划分,确立方位角和仰角子区间。第四步,分别将每个子带时频点的方位角和仰角划分到对应的角度子区间内,构建各子带中不同角度子区间的方位角集合和仰角集合。第五步,分别保留各角度数量最多的方位角子区间集合和仰角子区间集合。分别将方位角和仰角的各个子区间集合合并。最后对两个集合中的角度进行核密度估计,所得角度分布曲线中的峰值所对应的角度值为声源波达方向估计值。声源波达方向估计值。声源波达方向估计值。

【技术实现步骤摘要】
一种利用信号时频点角度分布信息的多声源定位方法


[0001]本专利技术属于语音信号处理领域中的声源定位领域,尤其涉及高混响场景下的多声源定位问题。

技术介绍

[0002]多声源定位在声学信号处理领域一直是一个热门话题,该技术研究的主要目的是仅通过麦克风阵列去获得声源的波达方向(Direction of arrival,DOA)估计值。由于DOA估计的应用极其广泛,因此它在很多应用场景中发挥了重要作用,例如,耳蜗助听器、声音监控、机器中的主要噪声定位以及语音增强等。
[0003]在多声源定位的研究中,国内外研究学者和机构提出了众多方法。最早提出的方法是基于到达时间差,其主要思想主要是通过计算声源到达不同麦克风阵列的时间差从而获得声源信号的DOA估计值。另一类经典的方法是多信号分类(multiple signal classification,MUSIC),该方法利用信号和噪声子空间的正交性获得空间谱函数,然后通过谱峰搜索去获得声源信号的DOA估计值。除此之外,稀疏成分分析方法让多声源定位的研究迈上一个阶梯,其主要思想是假设在大多数时频区域内总有一个源相对于其它源占主导,也就是说这个源的能量比其它源强得多。因此,这个方法将多声源定位问题转换成多个单声源定位问题。考虑到在一个时频区域内总有一个源占主导,因此该领域研究学者提出了单声源区域检测的方法,这个方法的核心思想是通过计算麦克风阵列之间的相关性从而判断一个时频区域是否单声源区域,最后保留单声源获得多声源的DOA估计。同样地,也有基于单声源时频点检测的多源定位方法,通过相位一致性或聚类的思想进行单声源时频点检测。但是,随着录制信号环境越来越复杂,例如高混响、多声源以及小声源间距的情况,这些都会导致多声源定位的精度下降。

技术实现思路

[0004]本专利技术针对高混响和多声源环境,设计了一种利用信号时频点角度分布信息的多声源定位方法。本方法首先将每一个帧语音信号在频域上划分子带,构建各子带内时频点的方位角集合和仰角集合;其次,分别对方位角的取值范围和仰角的取值范围进行区间划分,确立方位角子区间和仰角子区间;再次,将各子带内时频点的方位角和仰角划分到对应的方位角子区间和仰角子区间,并分别选出每个子带内时频点方位角子区间和仰角子区间中时频点方位角和仰角数量最多的子区间;最后,构建一个新的方位角集合和仰角集合,通过核密度估计和峰值搜索得到多声源的DOA估计值。
[0005]设计的总体流程简述如下:
[0006]第一步,利用四通道声场麦克风进行场景数据采集,采集到多个声源发声的录制信号,此类信号记为A格式信号,然后将A格式信号通过A/B格式信号转换公式得到B格式信号,再通过短时傅里叶变换得到其时频域系数,并计算出B格式信号的时频点的活跃强度矢量,由对应公式可得到各时频点的方位角和仰角信息。第二步,对每一帧录制信号在频域上
划分子带,构建各子带内时频点的方位角集合和仰角集合。第三步,分别对方位角的取值范围和仰角的取值范围进行区间划分,确立方位角子区间和仰角子区间。第四步,将录制信号中每个子带时频点的方位角划分到对应的方位角子区间内,构建各子带中不同角度子区间的方位角集合。确定不同方位角子区间集合内方位角的数量,保留包含方位角数量最多的方位角子区间集合。第五步,将每个子带时频点的仰角划分到对应的仰角子区间内,构建各子带中不同角度子区间的仰角集合。确定不同仰角子区间集合内仰角的数量,并保留包含仰角数量最多的仰角子区间集合。第六步,利用每帧各子带保留的方位角集合,构建筛选出的方位角的集合;同时,利用每帧各子带保留的仰角集合,构建筛选出的仰角集合。最后,分别对这两个集合中的角度进行核密度估计,得到方位角和仰角的角度分布曲线,曲线中的峰值点所对应的角度值即为估计出的声源的波达方向。
[0007]本专利技术的技术方案为解决混响条件下的多声源定位问题,主要分为以下几个步骤:
[0008]步骤1,获取录制信号,并计算各时频点的方位角以及仰角信息。
[0009]步骤2,对每一帧录制信号在频域上划分子带,构建各子带内时频点的方位角集合和仰角集合。
[0010]步骤3,分别对方位角的取值范围和仰角的取值范围进行区间划分,确立方位角子区间和仰角子区间。
[0011]步骤4,将录制信号中每个子带时频点的方位角划分到对应的方位角子区间内,构建各子带中不同角度子区间的方位角集合。确定不同方位角子区间集合内方位角的数量,保留包含方位角数量最多的方位角子区间集合。
[0012]步骤5,将录制信号中每个子带时频点的方位角划分到对应的方位角子区间内,构建各子带中不同角度子区间的方位角集合。确定不同方位角子区间集合内方位角的数量,保留包含方位角数量最多的方位角子区间集合。
[0013]步骤6,利用每帧各子带保留的方位角集合,构建筛选出的方位角的集合;同时,利用每帧各子带保留的仰角集合,构建筛选出的仰角集合。最后,分别对这两个集合中的角度进行核密度估计,得到方位角和仰角的角度分布曲线,曲线中的峰值点所对应的角度值即为估计出的声源的波达方向。
[0014]1.步骤1的实现方式为,利用四通道声场麦克风进行场景数据采集,采集到多个声源发声的录制信号。分别将4个通道采集到的信号称为M
UFL
,M
DFR
,M
DBL
,M
UBR
,此类信号记为A格式信号。B格式信号由A格式信号线性转换得到,B格式信号的四个通道信号记为M
W
,M
X
,M
Y
,M
Z
,其中,M
W
表示全向通道信号,M
X
,M
Y
,M
Z
分别表示笛卡尔坐标系X、Y、Z三个坐标轴的通道信号。转换公式如下:
[0015][0016]考虑到声音信号的短时平稳性,因此在定位处理前需要对录制信号进行分帧处理。本专利技术将待处理的麦克风采集信号分为N帧,每一处理帧的帧长为K,即每一帧包含K个样点。
[0017]在得到B格式信号之后,通过对B格式信号中的每一帧做K点的短时傅里叶变换得
到时频点(n,k)的时频域系数M
W
(n,k),M
X
(n,k),M
Y
(n,k),M
Z
(n,k),其中n代表帧索引,n=1,2...N,k代表频率索引,k=1,2...K。将B格式信号的时频域系数通过如下公式计算得到时频点(n,k)的活跃强度矢量;T
X
(n,k),T
Y
(n,k),T
Z
(n,k)分别是时频点(n,k)的活跃强度矢量在xyz三个方向上的分量;
[0018][0019]其中,Re{
·
}表示计算实部,(
·
)*表示计算共轭,权重系数Q由下式求得:
[0020][0021]其中,ρ和c分别表示介质的密度和声速。时频点本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种利用信号时频点角度分布信息的多声源定位方法,其特征在于包括以下步骤:步骤1,获取录制信号,并计算各时频点的方位角以及仰角信息;步骤2,对每一帧录制信号在频域上划分子带,构建各子带内时频点的方位角集合和仰角集合;步骤3,分别对方位角的取值范围和仰角的取值范围进行区间划分,确立方位角子区间和仰角子区间;步骤4,将录制信号中每个子带时频点的方位角划分到对应的方位角子区间内,构建各子带中不同角度子区间的方位角集合;确定不同方位角子区间集合内方位角的数量,保留包含方位角数量最多的方位角子区间集合;步骤5,将每个子带时频点的仰角划分到对应的仰角子区间内,构建各子带中不同角度子区间的仰角集合;确定不同仰角子区间集合内仰角的数量,并保留包含仰角数量最多的仰角子区间集合;步骤6,利用每帧各子带保留的方位角集合,构建筛选出的方位角的集合;同时,利用每帧各子带保留的仰角集合,构建筛选出的仰角集合;最后,分别对这两个集合中的角度进行核密度估计,得到方位角和仰角的角度分布曲线,曲线中的峰值点所对应的角度值即为估计出的声源的波达方向。2.如权利要求1所述的一种利用信号时频点角度分布信息的多声源定位方法,其特征在于:获取各时频点的方位角以及仰角信息:利用四通道声场麦克风进行场景数据采集,采集到多个声源发声的录制信号;分别将4个通道采集到的信号称为M
UFL
,M
DFR
,M
DBL
,M
UBR
,此类信号记为A格式信号;B格式信号由A格式信号线性转换得到,B格式信号的四个通道信号记为M
W
,M
X
,M
Y
,M
Z
,其中,M
W
表示全向通道信号,M
X
,M
Y
,M
Z
分别表示笛卡尔坐标系X、Y、Z三个坐标轴的通道信号;转换公式如下:将待处理的麦克风采集信号分为N帧,每一处理帧的帧长为K,即每一帧包含K个样点;在得到B格式信号之后,通过对B格式信号中的每一帧做K点的短时傅里叶变换得到时频点(n,k)的时频域系数M
W
(n,k),M
X
(n,k),M
Y
(n,k),M
Z
(n,k),其中n代表帧索引,n=1,2...N,k代表频率索引,k=1,2...K;将B格式信号的时频域系数通过如下公式计算得到时频点(n,k)的活跃强度矢量:T
X
(n,k),T
Y
(n,k),T
Z
(n,k)分别是时频点(n,k)的活跃强度矢量在xyz三个方向上的分量;其中,Re{
·
}表示计算实部,(
·
)*表示计算共轭,权重系数Q由下式求得:
其中,ρ和c分别表示介质的密度和声速;时频点(n,k)的方位角μ(n,k)以及仰角η(n,k)的计算公式如下:的计算公式如下:对...

【专利技术属性】
技术研发人员:陶亮关明熙贾懋珅
申请(专利权)人:北京工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1