一种基于时变遗忘因子的MCLP语言去混响方法及系统技术方案

技术编号:38857285 阅读:24 留言:0更新日期:2023-09-17 10:02
本发明专利技术公开了语音采集技术领域的一种基于时变遗忘因子的MCLP语言去混响方法及系统,包括以下步骤:进行信号采集,将信号转换到时频域;将采集到的时频域信号引入到MCLP模型,得到线性预测滤波器的预测系数矩阵;计算采集信号的功率谱密度,得到混响预测滤波器的加权系数,求解预测系数时在最小二乘法基础上引入矩阵QR分解并加入时变遗忘因子,提高去混响的能力和稳定性,并根据预测系数矩阵计算后期混响;对每一帧信号重复步骤3,将后期混响代入步骤2的表达式并对结果进行逆短时傅里叶变换得到期望信号即去混响语音信号。本发明专利技术方法拥有快速的收敛速度,提高了系统的稳定性,具有更好的语音消混响性能,音频质量更好。音频质量更好。音频质量更好。

【技术实现步骤摘要】
一种基于时变遗忘因子的MCLP语言去混响方法及系统


[0001]本专利技术属于语音采集
,具体涉及一种基于时变遗忘因子的MCLP语言去混响方法及系统。

技术介绍

[0002]在封闭空间(如录音棚)进行语音录制,通话会由于墙壁、地板、天花板的反射,采集到的语音信号不可避免会包含混响,混响会降低语音信号的辨识度和质量,影响助听器系统、降低语音自动识别系统的性能,给听众带来不便。因此,近年来对去混响算法的研究变得非常活跃。
[0003]语音去混响的算法大致包括三类:逆滤波、光谱增强和基于概率模型的方法。逆滤波是一种经常被研究的去混响方案,它依赖于房间声学特性,在适用性上有一定的局限性。此外,麦克风阵列技术在多通道语音去混响中也众所周知的,它可以通过空间区分不同方向的声音,在一定程度上抑制混响。在多通道线性预测的原理是设计一个线性预测器,估计出语音的混响部分,从混响语音中减去被估计出的部分就能估计出期望的语音信号。其中,Jukic等人提出了一种基于MCLP和WPE的具有稀疏先验的语音去混响算法,该算法包括两种多通道方案:具有复广义高斯(CGG)先验的WPE和使用迭代重加权最小二乘(IRLS)方法的WPE。两种方案在混响环境下都有显著的性能。
[0004]但是RLS算法在矩阵逆变换的过程中条件数会增多,使该算法存在潜在的不稳定问题,以及使用常数遗忘因子而导致系统突然变化时收敛缓慢等问题。前者可以用QR分解解决,而后者常用自适应遗忘因子来解决。然而,目前算法的VFF控制设计主要依赖于估计误差。
专利
技术实现思路

[0005]针对现有技术的不足,本专利技术的目的在于提供一种基于时变遗忘因子的MCLP语言去混响方法及系统,以解决上述
技术介绍
中提出的问题。
[0006]本专利技术的目的可以通过以下技术方案实现:
[0007]一种基于时变遗忘因子的MCLP语言去混响方法,包括以下步骤:
[0008]步骤1、先在单声源的环境下用麦克风阵列进行信号采集,通过短时傅里叶变换将信号转换到时频域;
[0009]步骤2、将步骤1采集到的时频域信号引入到MCLP模型,得到线性预测滤波器的预测系数矩阵与期望信号、后期混响和原始采集信号有关的表达式;
[0010]步骤3、计算采集信号的功率谱密度,得到混响预测滤波器的加权系数,求解预测系数时在最小二乘法基础上引入矩阵QR分解并加入时变遗忘因子,提高去混响的能力和稳定性,并根据预测系数矩阵计算后期混响;
[0011]步骤4、对每一帧信号重复步骤3,将后期混响代入步骤2的表达式并对结果进行逆短时傅里叶变换得到期望信号即去混响语音信号。
[0012]优选地,所述步骤1中麦克风捕阵列捉到的信号如下:
[0013]y(n)=x(n)+v(n)
[0014]式中,y(n)表示麦克风捕捉到的信号,x(n)表示语音信号,v(n)是加性噪声;
[0015]对时域信号采用短时傅里叶变换,第m个麦克风捕获到的信号表示如下:
[0016]x
m
(k,n)=d
m
(k,n)+u
m
(k,n)
[0017]式中,x
m
(k,n)表示第m个麦克风在时间帧为n,频率为k时候的信号,d
m
(k,n)表示语音的早期反射和直达声的信号,需要保留,为期望信号,u
m
(k,n)表示后期混响。
[0018]优选地,所述步骤2中通过MCLP模型得到需要的估计信号如下:
[0019][0020]其中:
[0021][0022][0023]式中,“^”表示估计值,H代表复杂共轭,是预测系数矩阵,τ为预测延时,直接语音部分和最早的反射部分保留为所需要的语音成分,直接语音信号通过减去来自混音的u(n)来获得。
[0024]优选地,所述步骤3中通过最大化时频域内期望语音信号的稀疏性来获得预测滤波器,如下式:
[0025][0026]式中,w(n)用来表示加权系数,γ的取值介于(0,1),表示为遗忘因子;
[0027]所述加权系数表示如下:
[0028][0029]式中,ε是个无穷小的数,保证w(n)是一个非负数,p代表形状参数,d(n)的功率谱密度如下:
[0030][0031]其中:
[0032][0033][0034][0035]式中,表示信号的功率谱密度,α表示衰减系数,Td用来表示最早反射的语音部分持续时间,T
60
代表混响时间,n
τ
表示每一帧对应的时延,β是平滑因子。
[0036]优选地,所述w(n)表示如下:
[0037][0038][0039]后期混响的估计值如下式:
[0040][0041]采用最小二乘法递归求解表示为:
[0042][0043][0044][0045]优选地,所述时变遗忘因子控制基于滤波器系数的近似导数,如下:
[0046][0047][0048][0049]式中,w
i
(n)表示的是第i个滤波器的抽头,是它的近似时间倒数,η是计算平滑抽头权重的遗忘因子,||
·
||1表示一个向量的l1范数,通过将自适应滤波器的收敛状态映射到时变遗忘因子γ(n)的期望方差,计算的近似导数的绝对值为G
c
(n):
[0050][0051]并计算通过一个时间长度为T的时间窗内对其取平均为取的平均值再用来表示,将和进行归一化,得到用γ
L
和γ
H
来表示上下界,并且在每次迭代更新时候的γ(n)如下式:
[0052][0053]一种基于时变遗忘因子的MCLP语言去混响系统,包括:
[0054]语音采集模块,用于通过麦克风模拟人耳,对接收的信号进行分帧处理;
[0055]后期混响估计模块,用于计算得到预测系数矩阵;
[0056]期望信号计算模块,用于计算得到期望信号。
[0057]优选地,所述后期混响估计模块包括功率谱密度计算模块和滤波器系数预测模块。
[0058]本专利技术的有益效果:
[0059]本专利技术基于时变遗忘因子的MCLP语言去混响方法使用最小二乘法计算预测线性矩阵,拥有快速的收敛速度,对语音信号处理过程中在最小二乘法的基础上加入矩阵QR分解,提高了系统的稳定性,并使用时变遗忘因子,使其具有更好的语音消混响性能,处理完的语音信号拥有更高的PESQ得分,音频质量更好。
附图说明
[0060]为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0061]图1是本专利技术实施例中基于时变遗忘因子的MCLP去混响系统结构示意图;
[0062]图2是本专利技术实施例中算法去混响的效果本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于时变遗忘因子的MCLP语言去混响方法,其特征在于,包括以下步骤:步骤1、先在单声源的环境下用麦克风阵列进行信号采集,通过短时傅里叶变换将信号转换到时频域;步骤2、将步骤1采集到的时频域信号引入到MCLP模型,得到线性预测滤波器的预测系数矩阵与期望信号、后期混响和原始采集信号有关的表达式;步骤3、计算采集信号的功率谱密度,得到混响预测滤波器的加权系数,求解预测系数时在最小二乘法基础上引入矩阵QR分解并加入时变遗忘因子,提高去混响的能力和稳定性,并根据预测系数矩阵计算后期混响;步骤4、对每一帧信号重复步骤3,将后期混响代入步骤2的表达式并对结果进行逆短时傅里叶变换得到期望信号即去混响语音信号。2.根据权利要求1所述的一种基于时变遗忘因子的MCLP语言去混响方法,其特征在于,所述步骤1中麦克风捕阵列捉到的信号如下:y(n)=x(n)+v(n)式中,y(n)表示麦克风捕捉到的信号,x(n)表示语音信号,v(n)是加性噪声;对时域信号采用短时傅里叶变换,第m个麦克风捕获到的信号表示如下:x
m
(k,n)=d
m
(k,n)+u
m
(k,n)式中,x
m
(k,m)表示第m个麦克风在时间帧为n,频率为k时候的信号,d
m
(k,n)表示语音的早期反射和直达声的信号,需要保留,为期望信号,u
m
(k,n)表示后期混响。3.根据权利要求2所述的一种基于时变遗忘因子的MCLP语言去混响方法,其特征在于,所述步骤2中通过MCLP模型得到需要的估计信号如下:其中:其中:式中,“^”表示估计值,H代表复杂共轭,是预测系数矩阵,τ为预测延时,直接语音部分和最早的反射部分保留为所需要的语音成分,直接语音信号通过减去来自混音的u(n)来获得。4.根据权利要求3所述的一种基于时变遗忘因子的MCLP语言去混响方法,其特征在于,所述步骤3中通过最大化时频域内期望语音信号的稀疏性来获得预测滤波器,如下式:式中,w(n)用来表示加权系数,γ的取值介于(0,1),表示为遗忘因子;所述加权系数表示如下:式中,ε是个无穷小的数,保证w(n)是一个非负数,p代表形状参数,d(n)的功率谱密度如下:
其中:其中:其中:式中,表示信号的功率谱密度,α表示衰减系数,T
d
用来表示最早反射的语...

【专利技术属性】
技术研发人员:冯涛吴礼福
申请(专利权)人:南京信息工程大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1