改进ACRANC与波束形成的微型阵列语音降噪方法技术

技术编号:20162422 阅读:28 留言:0更新日期:2019-01-19 00:15
本发明专利技术公开了一种改进ACRANC与波束形成的微型阵列语音降噪方法,涉及语音信号处理技术领域,解决的技术问题是如何进一步提高ACRANC方法进行语音降的噪声抑制性能,包括以下步骤:(一)对ACRANC方法进行改进,具体分步骤如下:(1)通过多路自适应噪声抵消获得多路降噪后的畸变语音信号;(2)将多路畸变语音信号作为ACRANC系统中恢复滤波器的输入,从而获得降噪语音;(二)波束形成,具体分步骤如下:(1)建立多个改进ACRANC子系统以及自适应模式控制AMC子系统,获得多路降噪语音;(2)对多路降噪语音通过波束形成获得更好的降噪语音。本发明专利技术可使输出语音的效果更好,并进一步改善语音降噪效果。

【技术实现步骤摘要】
改进ACRANC与波束形成的微型阵列语音降噪方法
本专利技术涉及语音信号处理
,尤其涉及一种改进ACRANC与波束形成的微型阵列语音降噪方法。
技术介绍
语音降噪技术能有效提高语音质量和语音识别系统的识别率,微型阵列语音降噪技术是一种有效的语音降噪方法。微型麦克风阵是指阵列孔径很小的阵列,阵列孔径通常都在5厘米以内,而且阵元个数较少。由于微型阵列更易于嵌入多种应用设备,因此,具有广泛的应用价值。基于VAD(VoiceActivityDetector)的广义旁瓣抵消(GeneralizedSidelobeCancellation)方法(简记为VAD-GSC)是一种常用且有效的微型麦克风阵语音降噪方法。而阵列抗串扰自适应噪声抵消(ArrayCrosstalkResistantAdaptiveNoiseCancellation,简记为ACRANC)也是一种有效的微型麦克风阵语音降噪方法,而且ACRANC方法在许多场合,尤其是语音源距离阵列较近的场合,具有比VAD-GSC及其许多改进方法更好的降噪效果。在ACRANC中,第二级滤波器的输入只有一路信号,该输入其实是一路畸变的语音信号,亦即第一级滤波器的输出,第二级滤波器的功能其实是通过畸变的语音信号恢复纯净语音信号,亦即使其输出接近主麦克风中的纯净语音信号。由于音频信号在实际环境中传播的复杂性以及ACRANC第一级滤波器对语音信号引起的畸变性,第二级滤波器恢复输出的语音效果仍有不足之处。
技术实现思路
针对现有技术的不足,本专利技术所解决的技术问题是如何进一步提高ACRANC方法的噪声抑制性能。为解决上述技术问题,本专利技术采用的技术方案是一种改进ACRANC与波束形成的微型阵列语音降噪方法,通过输入多路畸变语音输入到恢复滤波器并与DAS(DelayAndSum,延迟求和)波束形成相结合进行语音降噪,包括以下步骤:(一)对ACRANC方法进行改进,具体分步骤如下:(1)通过多路自适应噪声抵消获得多路降噪后的畸变语音信号,具体过程如下:假设语音信号为s(k),噪声信号为n(k),它们通过多条路径分别到达麦克风Mi并转化成信号si(k)和ni(k);从语音源和噪声源到达麦克风Mi的传播冲激响应假设为hsi(k)和hni(k);麦克风Mi实际拾取的信号表示为xi(k)=si(k)+ni(k),其中i=1,2,…N,k=0,1,2,…,式中N表示阵列中麦克风的个数,k是离散时间序号,得出:xi(k)=si(k)+ni(k)(1)si(k)=hsi(k)*s(k)(2)ni(k)=hni(k)*n(k)i=1,2,…,N(3)式中*是卷积运算符号;设语音信号si到语音信号sj的中间传播的冲击响应为而噪声信号ni到噪声信号nj的中间传播冲击响应为则:该分步骤中,对每一个麦克风Mi,以麦克风Mi获得的信号xi(k)作为主路信号,而其它N-1个麦克风获得的信号xj(k)(j=1,…,i-1,i+1,…,N)作为参考信号;在全局无声阶段,即各路信号都为无声的阶段,通过滤波器Ai用多路参考信号中的噪声去自适应地抵消主路中的噪声;而在非全局无声阶段,保持滤波器Ai的系数不变,只作滤波输出;于是,可获得多路畸变语音信号。原因如下:由于在全局无声阶段的语音信号si(k)=0,i=1,2,…,N,因此有:xi(k)=yi1(k)+ei1(k)(6)ni(k)=wini(k)+erri(k)(7)式中xi(k)=ni(k),ei1(k)=erri(k)是预测误差,yi1=wini(k)是滤波器Ai的输出,wi是1×(N-1)(L+1)维的滤波器Ai的系数行向量,即:wi=(wi1,…,wi(i-1),wi(i+1)…,wN)(8)式中wij=(wij0,wij1,…,wijL),ni(k)是(N-1)(L+1)×1维的噪声信号列向量;ni(k)=[ni1(k),…,ni(i-1)(k),ni(i+1)(k),…,niN(k)]T(9)式中nij(k)=[nij(k),nij(k-1),…,nij(k-L)]T,L是参考通道噪声信号延迟的样点数;设最小误差功率为而相应的最优系数向量为:为求得上述和只需调节滤波器Ai的系数以使ei1的平方和最小即可;在紧随全局无声阶段后面的阶段,在假定噪声环境是不变或缓慢变化的条件下,保持滤波器Ai的最优系数不变,只作滤波输出,于是有:式中xi(k)和si(k)分别表示拾取的含噪语音向量和纯语音向量,由式(6)与式(11)有:其中:上述ei1(k)是一路含有残余噪声的畸变语音,pi(k)便是其中的畸变的语音,由式(13)可见,它其实由N路中的纯净语音信号畸变而来;ei1(k)是将第i路信号作为主信号,其它信号作为参考信号而得到的,如果让i从1至N,即分别将各路信号当作主信号,其余信号作为参考信号,那么就可得到N路含残余噪声的畸变语音信号ej1(k)(j=1,2,…N)。(2)将多路畸变语音信号作为ACRANC系统中恢复滤波器的输入,获得降噪后的语音信号,具体过程如下:将多路畸变语音信号ej1(k)(j=1,2,…N),输入ACRANC系统中的第二级滤波器Bi,在全局无声阶段以外的阶段,调节滤波器Bi的系数以使其输出e2i(k)的平方和最小,其中:||ei2(k)||2=||xi(k)-yi2(k)||2=||si(k)+ni(k)-yi2(k)||2=||ni(k)||2+||si(k)-yi2(k)||2+2ni(k)[si(k)-yi2(k)](14)由式(15)可见,最小化等价于最小化E[si(k)-yi2(k)2],而后者相当于最小化yi2(k)与语音si(k)的误差,故滤波器Bi的输出yi2(k)能够逼近纯净语音信号si(k)。由于滤波器Bi的输入不仅仅是单路而是多路畸变语音信号,因而可获得比ACRANC更好的语音降噪效果,记更好的语音降噪信号为(二)波束形成,通过将改进ACRANC与波束形成相结合,进一步提高语音降噪效果,具体分步骤如下:(1)建立多个改进ACRANC子系统以及自适应模式控制AMC子系统,获得多路降噪语音,具体过程如下:以每一路信号作为主信号,其余信号作为参考信号,都建立一个改进的ACRANC,从而建立起N个这样的子系统。在每个改进的ACRANC中,滤波器Bi的输入是所有滤波器Ai(i=1,2,…N)的输出,而非一个滤波器Ai的输出;自适应模式控制AMC用于控制这些子系统中的滤波器何时更新系数以及何时固定系数不变;在没有语音的无声阶段即NVP阶段,可通过调整滤波器Ai的最优系数来补偿环境因素变化引起的误差。为此,定义一个全局无声阶段即ONVP阶段,各个子系统的第一级滤波器Ai只在ONVP期间调整最优系数;由麦克风Mi拾取得第i路含噪语音信号xi(k)的无声阶段设为NVP(i),NVP(i)由一系列离散区间组成,即:其中离散区间:[k'ij,k”ij]={k'ij,k'ij+1,…,k”ij}该离散区间为xi(k)的第j个NVP,显然NVP(i1)未必与NVP(i2)相等,i1≠i2,i1,i2∈{1,2,…,N}.但NVP(i1)只是NVP(i2)在时间轴上的平移结果;定义ONVP为:于是,容易证明:其中:如果k”j<k'j,则本文档来自技高网...

【技术保护点】
1.一种改进ACRANC与波束形成的微型阵列语音降噪方法,其特征在于,通过输入多路畸变语音到恢复滤波器并与波束形成相结合进行语音降噪,包括以下步骤:(一)对ACRANC方法进行改进,具体分步骤如下:(1)通过多路自适应噪声抵消获得多路降噪后的畸变语音信号;(2)将多路畸变语音信号作为ACRANC系统中恢复滤波器的输入,从而获得降噪语音;(二)波束形成,通过将改进ACRANC与波束形成相结合,进一步提高语音降噪效果,具体分步骤如下:(1)建立多个改进ACRANC子系统以及自适应模式控制AMC子系统,获得多路降噪语音;(2)通过延迟求和DAS波束形成获得最终降噪语音。

【技术特征摘要】
1.一种改进ACRANC与波束形成的微型阵列语音降噪方法,其特征在于,通过输入多路畸变语音到恢复滤波器并与波束形成相结合进行语音降噪,包括以下步骤:(一)对ACRANC方法进行改进,具体分步骤如下:(1)通过多路自适应噪声抵消获得多路降噪后的畸变语音信号;(2)将多路畸变语音信号作为ACRANC系统中恢复滤波器的输入,从而获得降噪语音;(二)波束形成,通过将改进ACRANC与波束形成相结合,进一步提高语音降噪效果,具体分步骤如下:(1)建立多个改进ACRANC子系统以及自适应模式控制AMC子系统,获得多路降噪语音;(2)通过延迟求和DAS波束形成获得最终降噪语音。2.如权利要求1所述的改进ACRANC与波束形成的微型阵列语音降噪方法,其特征在于,步骤(一)中分步骤(1)的具体过程如下:假设语音信号为s(k),噪声信号为n(k),它们通过多条路径分别到达麦克风Mi并转化成信号si(k)和ni(k);从语音源和噪声源到达麦克风Mi的传播冲激响应假设为hsi(k)和hni(k);麦克风Mi实际拾取的信号表示为xi(k)=si(k)+ni(k),其中i=1,2,…N,k=0,1,2,…,式中N表示阵列中麦克风的个数,k是离散时间序号,得出:xi(k)=si(k)+ni(k)(1)si(k)=hsi(k)*s(k)(2)ni(k)=hni(k)*n(k)i=1,2,…,N(3)式中*是卷积运算符号;设语音信号si到语音信号sj的中间传播的冲击响应为而噪声信号ni到噪声信号nj的中间传播冲击响应为则:该分步骤中,对每一个麦克风Mi,以麦克风Mi获得的信号xi(k)作为主路信号,而其它N-1个麦克风获得的信号xj(k)(j=1,…,i-1,i+1,…,N)作为参考信号;在全局无声阶段,即各路信号都为无声的阶段,通过滤波器Ai用多路参考信号中的噪声去自适应地抵消主路中的噪声;而在非全局无声阶段,保持滤波器Ai的系数不变,只作滤波输出;于是,可获得多路畸变语音信号;原因如下:由于在全局无声阶段的语音信号si(k)=0,i=1,2,…,N,因此有:xi(k)=yi1(k)+ei1(k)(6)ni(k)=wini(k)+erri(k)(7)式中xi(k)=ni(k),ei1(k)=erri(k)是预测误差,yi1=wini(k)是滤波器Ai的输出,wi是1×(N-1)(L+1)维的滤波器Ai的系数行向量,即:wi=(wi1,…,wi(i-1),wi(i+1)…,wN)(8)式中wij=(wij0,wij1,…,wijL),ni(k)是(N-1)(L+1)×1维的噪声信号列向量;ni(k)=[ni1(k),…,ni(i-1)(k),ni(i+1)(k),…,niN(k)]T(9)式中nij(k)=[nij(k),nij(k-1),…,nij(k-L)]T,L是参考通道噪声信号延迟的样点数;设最小误差功率为P[erri0(k)],而相应的最优系数向量为:为求得上述和P[erri0(k)],只需调节滤波器Ai的系数以使ei1的平方和最小即可;在紧随全局无声阶段后面的阶段,在假定噪声环境是不变或缓慢变化的条件下,保持滤波器Ai的最优系数不变,只作滤波输出,于是有:式中xi(k)和si(k)分别表示拾取的含噪语音向量和纯语音向量,由式(6)与式(11)有:其中:上述ei1(k)是一路含有残余噪声的畸变语音,pi(k)便是其中的畸变的语音,由式(13)可见,它其实由N路中的纯净语音信号畸变而来;ei1(k)是将第i路信号作为主信号,其它信号作为参考信号而得到的,如果让i从1至N,即分别将各路信号当作主信号,其余信号作为参考信号,那么就可得到N路含残余噪声的畸变语音信号ej1(k)(j=1,2,…N)。3.如权利要求1所述的改进ACRANC与波束形成的微型阵列语音降噪方法,其特征在于,步骤(一)中分步骤(2)的具体过程如下:将多路畸变语音信号ej1(k)(j=1,2,…N),输入ACRANC系统中的第二级滤波器Bi,在全局无声阶段以外的阶段,调节滤波器Bi的系数以使其输出e2i(k)的平方和最小,其中:||ei2(k)||2=||xi(k)-yi2(k)||2=||si(k)+ni(k)-y...

【专利技术属性】
技术研发人员:曾庆宁罗瀛方韶劻林凤梅谢先明龙超
申请(专利权)人:深圳市昂思科技有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1