声源定位及语音增强方法、装置制造方法及图纸

技术编号:39069361 阅读:20 留言:0更新日期:2023-10-12 20:01
本发明专利技术公开了一种声源定位及语音增强方法、装置,属于音频信号处理技术领域,该声源定位方法,包括以下步骤:对多个麦克风进行两两配对,根据麦克风对的位置、所需的定位精度获得至少部分的所述麦克风对中两个麦克风之间的频域相位补偿斜率张量;基于所述频域相位补偿斜率张量计算至少部分的所述麦克风对的频域互相关系数;使用分位数法扫描待拾取的空间范围,将各所述频域互相关系数之和最大的位置记为目标位置。通过设置相应的增益因子和补偿因子作用在求和结果和差分结果上,从而分别解决低频指向性差和环境噪声的问题,且可以灵活选择麦克风对的组合,提升定位效果和语音增强效果。效果。效果。

【技术实现步骤摘要】
声源定位及语音增强方法、装置


[0001]本专利技术涉及音频信号处理
,特别涉及一种声源定位及语音增强方法、装置。

技术介绍

[0002]语音增强技术,通常是指对语音信号进行降噪处理,在通讯技术日益发达的今天,有着非常广泛的应用场景。多麦克风语音增强算法利用空间信息,不仅可以抑制平稳噪声,也可以抑制非目标位置方向的非平稳噪声,其中,目标位置方向和非目标位置方向可通过算法自适应确定,也可人为规定。
[0003]常常使用多麦克风语音增强算法对目标位置方向的声音进行增强,多麦克风语音增强算法可大致分为两类:求和算法和差分算法,求和算法也称为加性算法,包括delay&sum、mvdr、gsc等算法,通用性好且失真小,但其低频指向性差;而差分算法通过设置零点虽然可以完全抑制掉非目标位置方向声音,但是低频信号经过补偿后底噪容易被放大,对麦克风的间距有一定的要求。

技术实现思路

[0004]本专利技术的目的在于提供一种声源定位及语音增强方法、装置,以解决求和算法和差分算法在低频上的问题。
[0005]为解决上述技术问题,本专利技术提供一种声源定位方法,包括以下步骤:
[0006]对多个麦克风进行两两配对,根据麦克风对的位置、所需的定位精度获得至少部分的所述麦克风对中两个麦克风之间的频域相位补偿斜率张量;
[0007]基于所述频域相位补偿斜率张量计算至少部分的所述麦克风对的频域互相关系数;
[0008]使用分位数法扫描待拾取的空间范围,将各所述频域互相关系数之和最大的位置记为目标位置。
[0009]优选地,基于所述频域相位补偿斜率张量计算至少部分的所述麦克风对的频域互相关系数的步骤包括:
[0010]选取至少部分的麦克风对,将所述麦克风对中的麦克风信号转换到频域;
[0011]对于选取的所述麦克风对,对每个所述麦克风对中其中一麦克风的频谱进行相位补偿得到补偿频谱,对其中一麦克风的补偿频谱与另一麦克风的频谱求互相关得到至少部分的所述麦克风对的频域互相关系数。
[0012]本专利技术还提供了一种语音增强方法,采用如上的声源定位方法,还包括以下步骤:
[0013]对多个麦克风进行两两配对并选取至少部分的麦克风对,使用延迟求和算法得到所述麦克风对在所述目标位置延迟求和结果;
[0014]将所述麦克风对在所述目标位置进行相位补偿后的互相关值作为增益因子;
[0015]将所述增益因子的均值作用于所述延迟求和结果。
[0016]优选地,基于如下公式获得所述增益因子:
[0017][0018]其中,k是频点索引,k1和k2表示第n个所述麦克风对中的两个麦克风,D'
k1
(k)是麦克风k1的频谱经过相位补偿后的补偿频谱,D
k2
(k)是麦克风k2的频谱信号,H是复共轭标志。
[0019]本专利技术还提供了另一种语音增强方法,采用如上的声源定位方法,还包括以下步骤:
[0020]获取声源相对于所述目标位置的至少一阻塞方向;
[0021]对多个麦克风进行两两配对并选取至少部分的麦克风对,使用差分阵列方法计算所述麦克风对在所述阻塞方向的差分结果,并将补偿因子作用于所述差分结果;
[0022]选取所述差分结果中各个所述阻塞方向具有最小值的阻塞频谱作为输出。
[0023]优选地,所述补偿因子基于如下公式获得:
[0024][0025]其中,Δω(n,q,k)为第n个所述麦克风对的频谱幅值补偿增益,k是频点索引,q表示所述阻塞方向有Q个,τ表示声波在第n个麦克风对的两个麦克风之间传递所需时间。
[0026]优选地,Δω(n,q,k)基于如下公式获得:
[0027]Δω(n,q,k)=angle
blo
(n,q,k)

angle
aim
(n,k)
[0028]angle
aim
(n,k)=slopeMatrix(ai,aj,n)*k
[0029]angle
blo
(n,q,k)=slopeMatrix(bi(q),bj(q),n)*k
[0030]其中,k是频点索引,所述目标位置坐标设置为(ai,aj),所述阻塞方向坐标设置为(bi(q),bj(q)),q表示阻塞方向有Q个,angle
aim
(n,k)和angle
blo
(n,q,k)分别表示第n个麦克风对在所述目标位置和所述阻塞方向的补偿相位。
[0031]优选地,基于如下公式将所述阻塞方向上的声音通过差分去除得到所述差分结果:
[0032]D'
k1
(n,q,k)=D
k1
(k)*exp(j*angle
blo
(n,q,k))
[0033]block(n,q,k)=D
k2

D'
k1
(n,q,k)
[0034]其中,D'
k1
(n,q,k)表示第n个麦克风对中的麦克风k1在所述阻塞方向上相位补偿后的补偿频谱,D
k2
(k)表示麦克风k2的频谱,k是频点索引。
[0035]优选地,基于如下公式将所述补偿因子作用到所述差分结果上:
[0036][0037]其中,block(n,q,k)表示第n对麦克风的所述差分结果,k是频点索引,q表示阻塞方向有Q个。
[0038]本专利技术还提供了一种语音增强装置,包括:
[0039]频域相位补偿斜率张量计算单元,用于对多个麦克风进行两两配对,根据麦克风对的位置、所需的定位精度获得至少部分的所述麦克风对中两个麦克风之间的频域相位补偿斜率张量;
[0040]麦克风相关性计算单元,基于所述频域相位补偿斜率张量计算至少部分的所述麦克风对的频域互相关系数;
[0041]声源定位单元,使用分位数法扫描待拾取的空间范围,将各所述频域互相关系数之和最大的位置记为目标位置;
[0042]第一语音增强单元,用于使用延迟求和算法得到所述麦克风对在所述目标位置延迟求和结果,将所述麦克风对在所述目标位置进行相位补偿后的互相关值作为增益因子,将所述增益因子的均值作用于所述延迟求和结果;
[0043]第二语音增强单元,用于获取相对于所述目标位置的至少一阻塞方向,对麦克风进行两两配对并选取至少部分的麦克风对,使用差分阵列方法计算所述麦克风对在所述阻塞方向的差分结果,并将补偿因子作用于所述差分结果,选取所述差分结果中各个所述阻塞方向具有最小值的阻塞频谱作为输出。
[0044]在本专利技术提供的声源定位及语音增强方法、装置中,首先可以通过利用分位数方法搜索空间区域,定位声源所在的目标位置方向或者自定义目标位置方向,然后基于所需的目标位置方向,对目标位置方向的声源进行对齐求和增强或者对阻塞方向的声源进行差分阻塞,其中,还对得到的求和结果设置本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种声源定位方法,其特征在于,包括以下步骤:对多个麦克风进行两两配对,根据麦克风对的位置、所需的定位精度获得至少部分的所述麦克风对中两个麦克风之间的频域相位补偿斜率张量;基于所述频域相位补偿斜率张量计算至少部分的所述麦克风对的频域互相关系数;使用分位数法扫描待拾取的空间范围,将各所述频域互相关系数之和最大的位置记为目标位置。2.如权利要求1所述的声源定位方法,其特征在于,基于所述频域相位补偿斜率张量计算至少部分的所述麦克风对的频域互相关系数的步骤包括:选取至少部分的麦克风对,将所述麦克风对中的麦克风信号转换到频域;对于选取的所述麦克风对,对每个所述麦克风对中其中一麦克风的频谱进行相位补偿得到补偿频谱,对其中一麦克风的补偿频谱与另一麦克风的频谱求互相关得到至少部分的所述麦克风对的频域互相关系数。3.一种语音增强方法,其特征在于,采用如权利要求1

2任一项所述的声源定位方法获取声源所在的目标位置,还包括以下步骤:对多个麦克风进行两两配对并选取至少部分的麦克风对,使用延迟求和算法得到所述麦克风对在所述目标位置延迟求和结果;将所述麦克风对在所述目标位置进行相位补偿后的互相关值作为增益因子;将所述增益因子的均值作用于所述延迟求和结果。4.如权利要求3所述的语音增强方法,其特征在于,基于如下公式获得所述增益因子:其中,k是频点索引,k1和k2表示第n个所述麦克风对中的两个麦克风,D'
k1
(k)是麦克风k1的频谱经过相位补偿后的补偿频谱,D
k2
(k)是麦克风k2的频谱信号,H是复共轭标志。5.一种语音增强方法,其特征在于,采用如权利要求1

2任一项所述的声源定位方法获取声源所在的目标位置,还包括以下步骤:获取声源相对于所述目标位置的至少一阻塞方向;对多个麦克风进行两两配对并选取至少部分的麦克风对,使用差分阵列方法计算所述麦克风对在所述阻塞方向的差分结果,并将补偿因子作用于所述差分结果;选取所述差分结果中各个所述阻塞方向具有最小值的阻塞频谱作为输出。6.如权利要求5所述的语音增强方法,其特征在于,所述补偿因子基于如下公式获得:其中,Δω(n,q,k)为第n个所述麦克风对的频谱幅值补偿增益,k是频点索引,q表示所述阻塞方向有Q个,τ表示声波在第n个麦克风对的两个麦克风之间传递所需时间。7.如权利要求6所述的语音增强方法,其特征在于,Δω(n,q,k)基于如下公式获得:Δω(n,q,k)=angle
blo
(n,q,k)

angle
aim

【专利技术属性】
技术研发人员:罗本彪邹灵琦董鹏宇居彩霞尹东
申请(专利权)人:上海富瀚微电子股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1