一种基于分布式传感器的多音区语音算法制造技术

技术编号:35855802 阅读:15 留言:0更新日期:2022-12-07 10:42
本发明专利技术涉及语音信号处理,具体涉及一种基于分布式传感器的多音区语音算法,对麦克风阵列采集的多路语音信号进行预处理;通过能量探测器探测到的语音能量获取声源方位信息,同时根据声源方位信息对麦克风阵列中各信号通道进行时延补偿;将时延补偿后的多路语音信号输入降噪通道进行波束成形,得到波束成形信号,同时将时延补偿后的多路语音信号输入噪声提取通道进行噪声提取,得到噪声信号;对波束成形信号和噪声信号进行自适应滤波,并对自适应滤波后的语音信号进行去噪,得到多音区增强语音信号;本发明专利技术提供的技术方案能够有效克服现有技术所存在的抗干扰能力差、混响过大、语音信号信噪比较低的缺陷。信号信噪比较低的缺陷。信号信噪比较低的缺陷。

【技术实现步骤摘要】
一种基于分布式传感器的多音区语音算法


[0001]本专利技术涉及语音信号处理,具体涉及一种基于分布式传感器的多音区语音算法。

技术介绍

[0002]随着人工智能地不断发展,越来越多的生活场景需要更多地体现智能化,如车载场景、家居场景、教室场景、会议场景等,这些场景中通常会应用多种智能化设备,如在家中使用智能交互式设备,或者在教室、会议室使用语音增强设备等。不论是交互式设备还是语音增强设备,其最重要的就是要准确识别出声源方位信息。
[0003]现有的拾音算法非常多,采用较多的一种是球形麦克风阵列拾音算法,球形麦克风阵列拾音算法是基于波束成形的原理,在复杂环境中对期望语音信号进行拾取,即只拾取期望方向(声源方位)传播来的语音信号,而对其他方向的噪声、干扰信号进行抑制,从而达到目标语音增强的效果。
[0004]然而,在拾取语音信号的过程中会存在一定问题,例如在复杂环境中抗干扰能力差、混响过大;另外,当声源与语音增强设备的距离较远时,得到语音信号的信噪比会大幅下降,导致语音信号不易被理解,严重影响语音增强设备的使用效果。

技术实现思路

[0005](一)解决的技术问题
[0006]针对现有技术所存在的上述缺点,本专利技术提供了一种基于分布式传感器的多音区语音算法,能够有效克服现有技术所存在的抗干扰能力差、混响过大、语音信号信噪比较低的缺陷。
[0007](二)技术方案
[0008]为实现以上目的,本专利技术通过以下技术方案予以实现:
[0009]一种基于分布式传感器的多音区语音算法,包括以下步骤:
[0010]S1、对麦克风阵列采集的多路语音信号进行预处理;
[0011]S2、通过能量探测器探测到的语音能量获取声源方位信息,同时根据声源方位信息对麦克风阵列中各信号通道进行时延补偿;
[0012]S3、将时延补偿后的多路语音信号输入降噪通道进行波束成形,得到波束成形信号,同时将时延补偿后的多路语音信号输入噪声提取通道进行噪声提取,得到噪声信号;
[0013]S4、对波束成形信号和噪声信号进行自适应滤波,并对自适应滤波后的语音信号进行去噪,得到多音区增强语音信号。
[0014]优选地,S2中通过能量探测器探测到的语音能量获取声源方位信息,包括:
[0015]采用下式计算声源方位信息:
[0016]β=Δθ
·
argmax[E(n)][0017]其中,Δθ为能量探测器中相邻探测通道之间的角度,E(n)为能量探测器中各探测通道探测到的语音能量,n为探测通道编号。
[0018]优选地,S2中根据声源方位信息对麦克风阵列中各信号通道进行时延补偿,包括:
[0019]采用下式对麦克风阵列中各信号通道进行时延补偿:
[0020]s
N
(k)=s
N
(k')
[0021][0022]其中,s
N
(k)为时延补偿后的语音信号,N为麦克风阵列中麦克风子阵编号,d为麦克风子阵之间的间距,f
s
为麦克风阵列的采样频率,β为声源方位信息,v为声速。
[0023]优选地,所述能量探测器中的探测通道包括圆锥形反射器件,多个所述圆锥形反射器件位于同一平面内且形成的收声范围覆盖声源区域,所述圆锥形反射器的顶部设置有第二麦克风且顶部相交于一点。
[0024]优选地,S1中对麦克风阵列采集的多路语音信号进行预处理,包括:
[0025]利用麦克风阵列进行多通道语音信号的采集,并对采集的多路语音信号进行低通滤波和加窗分帧处理。
[0026]优选地,所述麦克风阵列包括等间距排列的麦克风子阵,所述麦克风子阵包括第一麦克风、前置放大电路和控制器;
[0027]所述第一麦克风、第二麦克风共用前置放大电路,所述控制器对第一麦克风、第二麦克风进行切换工作。
[0028]优选地,S3中将时延补偿后的多路语音信号输入降噪通道进行波束成形,得到波束成形信号,包括:
[0029]采用下式计算t时刻的波束成形信号:
[0030][0031]其中,M为麦克风阵列中麦克风子阵数量,N为麦克风阵列中麦克风子阵编号,τ
N
为第N个麦克风子阵对应信号通道的语音信号相对于参考通道语音信号的时延。
[0032]优选地,S3中将时延补偿后的多路语音信号输入噪声提取通道进行噪声提取,得到噪声信号,包括:
[0033]利用小波函数对时延补偿后的多路语音信号进行小波分解,得到语音信号和噪声信号的小波系数;
[0034]基于预设阈值对小波系数进行筛选,得到目标小波系数,并利用目标小波系数进行噪声重构,得到t时刻的噪声信号。
[0035]优选地,S4中对自适应滤波后的语音信号进行去噪,得到多音区增强语音信号,包括:
[0036]获取自适应滤波后语音信号的第一幅值信息Y(f,m)和相位信息y(f,m),并采用下式对第一幅值信息Y(f,m)进行处理得到第二幅值信息:
[0037][0038]其中,Y'(f,m)为第二幅值信息,W为神经网络去噪因子,f为语音信号频率,m为语音信号帧数;
[0039]采用下式基于相位信息y(f,m)和第二幅值信息Y'(f,m)进行重构,得到多音区增
强语音信号的频谱:
[0040]F(f,m)=Y'(f,m)
·
e
i
·
y(f,m)

[0041]对多音区增强语音信号的频谱F(f,m)进行逆短时傅里叶变化,得到多音区增强语音信号。
[0042](三)有益效果
[0043]与现有技术相比,本专利技术所提供的一种基于分布式传感器的多音区语音算法,具有以下有益效果:
[0044]1)通过能量探测器探测到的语音能量获取声源方位信息,同时根据声源方位信息对麦克风阵列中各信号通道进行时延补偿,通过确定声源方位,再利用声源方位对麦克风阵列中各信号通道的语音信号进行延时补偿,能够有效提升在复杂环境中的抗干扰能力,并且能够有效解决混响问题;
[0045]2)将时延补偿后的多路语音信号输入降噪通道进行波束成形,得到波束成形信号,同时将时延补偿后的多路语音信号输入噪声提取通道进行噪声提取,得到噪声信号,通过对波束成形信号和噪声信号进行自适应滤波,并且利用神经网络去噪因子对自适应滤波后的语音信号进行去噪,能够有效提高语音信号的信噪比,使得输出的多音区增强语音信号更加清晰,保证多音区语音增强的效果。
附图说明
[0046]为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍。显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0047]图1为本专利技术的流程示意图;
[0048]图2为本专利技术中图1的详本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于分布式传感器的多音区语音算法,其特征在于:包括以下步骤:S1、对麦克风阵列采集的多路语音信号进行预处理;S2、通过能量探测器探测到的语音能量获取声源方位信息,同时根据声源方位信息对麦克风阵列中各信号通道进行时延补偿;S3、将时延补偿后的多路语音信号输入降噪通道进行波束成形,得到波束成形信号,同时将时延补偿后的多路语音信号输入噪声提取通道进行噪声提取,得到噪声信号;S4、对波束成形信号和噪声信号进行自适应滤波,并对自适应滤波后的语音信号进行去噪,得到多音区增强语音信号。2.根据权利要求1所述的基于分布式传感器的多音区语音算法,其特征在于:S2中通过能量探测器探测到的语音能量获取声源方位信息,包括:采用下式计算声源方位信息:β=Δθ
·
argmax[E(n)]其中,Δθ为能量探测器中相邻探测通道之间的角度,E(n)为能量探测器中各探测通道探测到的语音能量,n为探测通道编号。3.根据权利要求2所述的基于分布式传感器的多音区语音算法,其特征在于:S2中根据声源方位信息对麦克风阵列中各信号通道进行时延补偿,包括:采用下式对麦克风阵列中各信号通道进行时延补偿:s
N
(k)=s
N
(k')其中,s
N
(k)为时延补偿后的语音信号,N为麦克风阵列中麦克风子阵编号,d为麦克风子阵之间的间距,f
s
为麦克风阵列的采样频率,β为声源方位信息,v为声速。4.根据权利要求2所述的基于分布式传感器的多音区语音算法,其特征在于:所述能量探测器中的探测通道包括圆锥形反射器件,多个所述圆锥形反射器件位于同一平面内且形成的收声范围覆盖声源区域,所述圆锥形反射器的顶部设置有第二麦克风且顶部相交于一点。5.根据权利要求4所述的基于分布式传感器的多音区语音算法,其特征在于:S1中对麦克风阵列采集的多路语音信号进行预处理,包括:利用麦克风阵列进行多通道语音信号的采集,并对采集的多路...

【专利技术属性】
技术研发人员:胡程远
申请(专利权)人:南京声象信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1