一种消除混响的方法、装置和设备制造方法及图纸

技术编号:10272863 阅读:209 留言:0更新日期:2014-07-31 14:54
本发明专利技术实施例提供了一种消除混响的方法、装置和设备,能够准确消除语音信号中的混响信号。该方法包括:获取第i个以及其他M-1个语音输入设备输入的连续L帧语音信号的第1帧至第L帧的语音信号的能量,第1帧至第L-1帧的纯净语音信号的混响能量系数和第L帧的语音信号能量的系数,以及第i个语音输入设备的第1帧至第L-1帧的纯净语音信号的能量;对所述第i个语音输入设备的第1帧至第L-1帧的纯净语音信号的混响能量系数以及第L帧的语音信号能量的系数进行更新;估算第1帧至第L-1帧的纯净语音信号对所述第L帧语音信号产生的混响信号的混响能量;获得所述第L帧信号的纯净语音信号的能量。该方法适用于音频技术领域。

【技术实现步骤摘要】
一种消除混响的方法、装置和设备
本专利技术涉及音频
,尤其涉及一种消除混响的方法、装置和设备。
技术介绍
声波在室内传播时,要被墙壁、天花板、地板等障碍物反射,每反射一次都要被障碍物吸收一些。这样,当声源停止发声后,声波在室内要经过多次反射和吸收,最后才消失,我们就感觉到声源停止发声后声音还继续一段时间,这种现象叫做混响,这段时间叫做混响时间。在一些场景下,比如在会议系统中,混响的影响会导致语音清晰度的下降。为了提升用户体验,需要对混响进行抑制,以改善语音的清晰度。现有技术针对这一问题提出了如下两种解决方案:第一种方案:在时域对麦克风获得的信号的相位进行分析,估计出自适应滤波系数,通过估计得到的自适应滤波系数对信号进行滤波,得到消除混响后的信号。但是,采用这种方法容易受到声源与麦克风距离的影响,比如人在说话时,随着人的身体、头部的移动,声源与麦克风的距离也会发生变化,这样,麦克风获得的信号的相位也在发生变化,导致估计出的自适应滤波系数是不准确的。第二种方案:在频域基于统计模型去除混响,估计出前一帧语音信号能量的混响能量系数,从而估计出当前帧的语音能量中的混响能量,但是,基于统计模型获得的前一帧语音信号能量的混响能量系数可能会不准确,造成去混响的效果不够理想。
技术实现思路
本专利技术的实施例提供一种消除混响的方法、装置和系统,能够准确的消除语音信号中的混响信号,得到纯净的语音信号。为达到上述目的,本专利技术的实施例采用如下技术方案:第一方面,本专利技术实施例提供了一种消除混响的方法,该方法包括:获取第i个以及其他M-1个语音输入设备输入的连续L帧语音信号的第1帧至第L帧的语音信号的能量,和所述第i个以及其他M-1个语音输入设备输入的连续L帧语音信号的第1帧至第L-1帧的纯净语音信号的混响能量系数以及第L帧的语音信号能量的系数,以及第i个语音输入设备输入的连续L帧语音信号的第1帧至第L-1帧的纯净语音信号的能量,其中,所述语音信号包含纯净语音信号和混响信号,所述连续L帧语音信号为频域信号,所述L大于1;根据所述第i个以及其他M-1个语音输入设备输入的连续L帧语音信号的第1帧至第L帧的语音信号的能量,和所述第i个以及其他M-1个语音输入设备输入的连续L帧语音信号的第1帧至第L-1帧的纯净语音信号的混响能量系数以及第L帧的语音信号能量的系数,对所述第i个语音输入设备输入的连续L帧语音信号的第1帧至第L-1帧的纯净语音信号的混响能量系数以及第L帧的语音信号能量的系数进行更新;根据所述第i个语音输入设备输入的连续L帧语音信号的第1帧至第L-1帧的纯净语音信号的能量,和所述第i个语音输入设备的更新后的第1帧至第L-1帧的纯净语音信号的混响能量系数,估算所述第i个语音输入设备输入的连续L帧语音信号的第1帧至第L-1帧的纯净语音信号对所述第L帧语音信号产生的混响信号的混响能量;根据所述第i个语音输入设备输入的连续L帧语音信号的第L帧信号的能量和所述混响能量,获得所述第L帧信号的纯净语音信号的能量。在第一种可能的实施方式中,结合第一方面,所述获取第i个以及其他M-1个语音输入设备输入的连续L帧语音信号的第1帧至第L-1帧的纯净语音信号的混响能量系数以及第L帧的语音信号能量的系数具体包括:根据预设的冲激信号的能量衰减曲线的斜率q,通过第一公式,获得所述i个以及其他M-1个语音输入设备输入的连续L帧语音信号的第1帧至第L-1帧的纯净语音信号的混响能量系数g1、g2…gL-1以及第L帧的语音信号能量的系数gL,其中,所述第一公式为:其中,1<=l<=L。在第二种可能的实施方式中,结合第一方面或第一种可能的实施方式,所述L为混响时间T与帧的预设时间长度的比值取整,其中,所述混响时间T为根据所述预设的冲激信号的能量衰减曲线的斜率q,估计的所述冲激信号的能量衰减至预设能量的时间。在第三种可能的实施方式中,结合第一方面,第一种可能的实施方式或第二种可能的实施方式中的任一种,对所述第i个语音输入设备输入的连续L帧语音信号的第1帧至第L-1帧的纯净语音信号的混响能量系数进行更新具体包括:根据第二公式获得第i个语音输入设备和第j个语音输入设备的连续L帧信号的能量的差,其中,所述第二公式为:其中,当1<=l<=L-1时,所述gj,lEi,l为第j个语音输入设备的第l帧的纯净语音信号的混响能量系数与第i个语音输入设备的第l帧的信号能量的卷积,所述gi,lEj,l为第i个语音输入设备的第l帧的纯净语音信号的混响能量系数与第j个语音输入设备的第l帧的信号能量的卷积,当l=L时,所述gj,lEi,l为第j个语音输入设备的第L帧的语音信号能量的系数与第i个语音输入设备的第L帧的信号能量的卷积,所述gi,lEj,l为第i个语音输入设备的第L帧的语音信号能量的系数与第j个语音输入设备的第L帧的信号能量的卷积;根据所述第二公式获得所述第i个语音输入设备和其他M-1个语音输入设备两两之间的连续L帧信号的能量的差;根据所述第i个语音输入设备和其他M-1个语音输入设备两两之间的连续L帧信号的能量的差,获得三公式,所述第三公式为:其中,当1<=l<=L-1时,所述为第i个语音输入设备第l帧纯净语音信号的混响能量系数的更新值,所述gi,l为第i个语音输入设备第l帧纯净语音信号的混响能量系数,所述μl为预设置的第l帧的更新系数,所述h(ei,El)为根据第i个语音输入设备和其他M-1个语音输入设备两两之间的连续L帧信号的能量的差,以及其他M-1个语音输入设备的连续L帧语音信号的第1帧至第L帧的语音信号的能量得到的值;根据所述第三公式,获得所述第i个语音输入设备的所述连续L帧语音信号的第1帧至第L-1帧的纯净语音信号的混响能量系数以及第L帧的语音信号能量的系数的更新值。在第四种可能的实施方式中,结合第三种可能的实施方式,所述μl>=μl-1,其中,所述μl为预设置的第l帧的更新系数,所述μl-1为预设置的第l-1帧的更新系数,所述第l-1帧是第l帧的前一帧,所述1<=l-1。第二方面,本专利技术实施例提供了一种消除混响的方法,该方法包括:获取第i个以及其他M-1个语音输入设备输入的连续L帧语音信号的第1帧至第L帧的语音信号的幅度,和所述第i个以及其他M-1个语音输入设备输入的连续L帧语音信号的第1帧至第L-1帧的纯净语音信号的混响幅度系数以及第L帧的纯净语音信号幅度的系数,以及第i个语音输入设备输入的连续L帧语音信号的第1帧至第L-1帧的纯净语音信号的幅度,其中,所述语音信号包含纯净语音信号和混响信号,所述连续L帧语音信号为频域信号,所述L大于1;根据所述第i个以及其他M-1个语音输入设备输入的连续L帧语音信号的第1帧至第L帧的语音信号的幅度,和所述第i个以及其他M-1个语音输入设备输入的连续L帧语音信号的第1帧至第L-1帧的纯净语音信号的混响幅度系数以及第L帧的纯净语音信号幅度的系数,对所述第i个语音输入设备输入的连续L帧语音信号的第1帧至第L-1帧的纯净语音信号的混响幅度系数以及第L帧的纯净语音信号幅度的系数进行更新;根据所述第i个语音输入设备输入的连续L帧语音信号的第1帧至第L-1帧的纯净语音信号的幅度,和所述第i个语音输入设备的更新后的第1帧至第L-1帧的纯净语音信本文档来自技高网...
一种消除混响的方法、装置和设备

【技术保护点】
一种消除混响的方法,其特征在于,该方法包括:获取第i个以及其他M‑1个语音输入设备输入的连续L帧语音信号的第1帧至第L帧的语音信号的能量,和所述第i个以及其他M‑1个语音输入设备输入的连续L帧语音信号的第1帧至第L‑1帧的纯净语音信号的混响能量系数以及第L帧的语音信号能量的系数,以及第i个语音输入设备输入的连续L帧语音信号的第1帧至第L‑1帧的纯净语音信号的能量,其中,所述语音信号包含纯净语音信号和混响信号,所述连续L帧语音信号为频域信号,所述L大于1;根据所述第i个以及其他M‑1个语音输入设备输入的连续L帧语音信号的第1帧至第L帧的语音信号的能量,和所述第i个以及其他M‑1个语音输入设备输入的连续L帧语音信号的第1帧至第L‑1帧的纯净语音信号的混响能量系数以及第L帧的语音信号能量的系数,对所述第i个语音输入设备输入的连续L帧语音信号的第1帧至第L‑1帧的纯净语音信号的混响能量系数以及第L帧的语音信号能量的系数进行更新;根据所述第i个语音输入设备输入的连续L帧语音信号的第1帧至第L‑1帧的纯净语音信号的能量,和所述第i个语音输入设备的更新后的第1帧至第L‑1帧的纯净语音信号的混响能量系数,估算所述第i个语音输入设备输入的连续L帧语音信号的第1帧至第L‑1帧的纯净语音信号对所述第L帧语音信号产生的混响信号的混响能量;根据所述第i个语音输入设备输入的连续L帧语音信号的第L帧信号的能量和所述混响能量,获得所述第L帧信号的纯净语音信号的能量。...

【技术特征摘要】
1.一种消除混响的方法,其特征在于,该方法包括:获取第i个以及其他M-1个语音输入设备输入的连续L帧语音信号的第1帧至第L帧的语音信号的能量,和所述第i个以及其他M-1个语音输入设备输入的连续L帧语音信号的第1帧至第L-1帧的纯净语音信号的混响能量系数以及第L帧的语音信号能量的系数,以及第i个语音输入设备输入的连续L帧语音信号的第1帧至第L-1帧的纯净语音信号的能量,其中,所述语音信号包含纯净语音信号和混响信号,所述连续L帧语音信号为频域信号,所述L大于1;根据所述第i个以及其他M-1个语音输入设备输入的连续L帧语音信号的第1帧至第L帧的语音信号的能量,和所述第i个以及其他M-1个语音输入设备输入的连续L帧语音信号的第1帧至第L-1帧的纯净语音信号的混响能量系数以及第L帧的语音信号能量的系数,对所述第i个语音输入设备输入的连续L帧语音信号的第1帧至第L-1帧的纯净语音信号的混响能量系数以及第L帧的语音信号能量的系数进行更新;根据所述第i个语音输入设备输入的连续L帧语音信号的第1帧至第L-1帧的纯净语音信号的能量,和所述第i个语音输入设备的更新后的第1帧至第L-1帧的纯净语音信号的混响能量系数,估算所述第i个语音输入设备输入的连续L帧语音信号的第1帧至第L-1帧的纯净语音信号对所述第L帧语音信号产生的混响信号的混响能量;根据所述第i个语音输入设备输入的连续L帧语音信号的第L帧信号的能量和所述混响能量,获得所述第L帧信号的纯净语音信号的能量。2.根据权利要求1所述的方法,其特征在于,所述获取第i个以及其他M-1个语音输入设备输入的连续L帧语音信号的第1帧至第L-1帧的纯净语音信号的混响能量系数以及第L帧的语音信号能量的系数具体包括:根据预设的冲激信号的能量衰减曲线的斜率q,通过第一公式,获得所述第i个以及其他M-1个语音输入设备输入的连续L帧语音信号的第1帧至第L-1帧的纯净语音信号的混响能量系数g1、g2…gL-1以及第L帧的语音信号能量的系数gL,其中,所述第一公式为:其中,1<=l<=L。3.根据权利要求1或2所述的方法,其特征在于,所述L为混响时间T与帧的预设时间长度的比值取整,其中,所述混响时间T为根据所述预设的冲激信号的能量衰减曲线的斜率q,估计的所述冲激信号的能量衰减至预设能量的时间。4.根据权利要求1或2所述的方法,其特征在于,对所述第i个语音输入设备输入的连续L帧语音信号的第1帧至第L-1帧的纯净语音信号的混响能量系数进行更新具体包括:根据第二公式获得第i个语音输入设备和第j个语音输入设备的连续L帧信号的能量的差,其中,所述第二公式为:其中,当1<=l<=L-1时,所述gj,lEi,l为第j个语音输入设备的第l帧的纯净语音信号的混响能量系数与第i个语音输入设备的第l帧的信号能量的卷积,所述gi,lEj,l为第i个语音输入设备的第l帧的纯净语音信号的混响能量系数与第j个语音输入设备的第l帧的信号能量的卷积,当l=L时,所述gj,lEi,l为第j个语音输入设备的第L帧的语音信号能量的系数与第i个语音输入设备的第L帧的信号能量的卷积,所述gi,lEj,l为第i个语音输入设备的第L帧的语音信号能量的系数与第j个语音输入设备的第L帧的信号能量的卷积;根据所述第二公式获得所述第i个语音输入设备和其他M-1个语音输入设备两两之间的连续L帧信号的能量的差;根据所述第i个语音输入设备和其他M-1个语音输入设备两两之间的连续L帧信号的能量的差,获得第三公式,所述第三公式为:g’i,l=gi,l±μl*h,其中,当1<=l<=L-1时,所述g’i,l为第i个语音输入设备第l帧纯净语音信号的混响能量系数的更新值,所述gi,l为第i个语音输入设备第l帧纯净语音信号的混响能量系数,所述μl为预设置的第l帧的更新系数,所述h(ei,El)为根据第i个语音输入设备和其他M-1个语音输入设备两两之间的连续L帧信号的能量的差,以及其他M-1个语音输入设备的连续L帧语音信号的第1帧至第L帧的语音信号的能量得到的值;根据所述第三公式,获得所述第i个语音输入设备的所述连续L帧语音信号的第1帧至第L-1帧的纯净语音信号的混响能量系数以及第L帧的语音信号能量的系数的更新值。5.根据权利要求4所述的方法,其特征在于,所述μl>=μl-1,其中,所述μl为预设置的第l帧的更新系数,所述μl-1为预设置的第l-1帧的更新系数,所述第l-1帧是第l帧的前一帧,所述1<=l-1。6.一种消除混响的方法,其特征在于,该方法包括:获取第i个以及其他M-1个语音输入设备输入的连续L帧语音信号的第1帧至第L帧的语音信号的幅度,和所述第i个以及其他M-1个语音输入设备输入的连续L帧语音信号的第1帧至第L-1帧的纯净语音信号的混响幅度系数以及第L帧的纯净语音信号幅度的系数,以及第i个语音输入设备输入的连续L帧语音信号的第1帧至第L-1帧的纯净语音信号的幅度,其中,所述语音信号包含纯净语音信号和混响信号,所述连续L帧语音信号为频域信号,所述L大于1;根据所述第i个以及其他M-1个语音输入设备输入的连续L帧语音信号的第1帧至第L帧的语音信号的幅度,和所述第i个以及其他M-1个语音输入设备输入的连续L帧语音信号的第1帧至第L-1帧的纯净语音信号的混响幅度系数以及第L帧的纯净语音信号幅度的系数,对所述第i个语音输入设备输入的连续L帧语音信号的第1帧至第L-1帧的纯净语音信号的混响幅度系数以及第L帧的纯净语音信号幅度的系数进行更新;根据所述第i个语音输入设备输入的连续L帧语音信号的第1帧至第L-1帧的纯净语音信号的幅度,和所述第i个语音输入设备的更新后的第1帧至第L-1帧的纯净语音信号的混响幅度系数,估算所述第i个语音输入设备输入的连续L帧语音信号的第1帧至第L-1帧的纯净语音信号对所述第L帧语音信号产生的混响信号的混响幅度;根据所述第i个语音输入设备输入的连续L帧语音信号的第L帧信号的幅度和所述混响幅度,获得所述第L帧信号的纯净语音信号的幅度。7.一种消除混响的装置,其特征在于,该装置包括:第一获得单元,第一更新单元,第一估算单元和第二获得单元;所述第一获得单元,用于获取第i个以及其他M-1个语音输入设备输入的连续L帧语音信号的第1帧至第L帧的语音信号的能量,和所述第i个以及其他M-1个语音输入设备输入的连续L帧语音信号的第1帧至第L-1帧的纯净语音信号的混响能量系数以及第L帧的语音信号能量的系数,以及第i个语音输入设备输入的连续L帧语音信号的第1帧至第L-1帧的纯净语音信号的能量,其中,所述语音信号包含纯净语音信号和混响信号,所述连续L帧语音信号为频域信号,所述L大于1;所述第一更新单元,用于根据所述第一获得单元发送的所述第i个以及其他M-1个语音输入设备输入的连续L帧语音信号的第1帧至第L帧的语音信号的能量,和所述第i个以及其他M-1个语音输入设备输入的连续L帧语音信号的第1帧至第L-1帧的纯净语音信号的混响能量系数以及第L帧的语音信号能量的系数,对所述第i个语音输入设备输入的连续L帧语音信号的第1帧至第L-1帧的纯净语音信号的混响能量系数以及第L帧的语音信号能量的系数进行更新;所述第一估算单元,用于根据所述第一获得单元发送的所述第i个语音输入设备输入的连续L帧语音信号的第1帧至第L-1帧的纯净语音信号的能量,和所述第一更新单元发送的所述第i个语音输入设备的更新后的第1帧至第L-1帧的纯净语音信号的混响能量系数,估算所述第i个语音输入设备输入的连续L帧语音信号的第1帧至第L-1帧的纯净语音信号对所述第L帧语音信号产生的混响信号的混响能量;所述第二获得单元,用于根据所述第一获得单元发送的所述第i个语音输入设备输入的连续L帧语音信号的第L帧信号的能量和所述第一估算单元发送的所述混响能量,获得所述第L帧信号的纯净语音信号的能量。8.根据权利要求7所述的装置,其特征在于,所述第一获得单元具体用于:根据预设的冲激信号的能量衰减曲线的斜率q,通过第一公式,获得所述第i个以及其他M-1个语音输入设备输入的连续L帧语音信号的第1帧至第L-1帧的纯净语音信号的混响能量系数g1、g2…gL-1以及第L帧的语音信号能量的系数gL,其中,所述第一公式为:其中,1<=l<=L。9.根据权利要求7或8所述的装置,其特征在于,所述L为混响时间T与帧的预设时间长度的比值取整,其中,所述混响时间T为根据所述预设的冲激信号的能量衰减曲线的斜率q,估计的所述冲激信号的能量衰减至预设能量的时间。10.根据权利要求7或8所述的装置,其特征在于,所述第一更新单元具体用于:根据第二公式获得第i个语音输入设备和第j个语音输入设备的连续L帧信号的能量的差,其中,所述第二公式为:其中,当1<=l<=L-1时,所述gj,lEi,l为第j个语音输入设备的第l帧的纯净语音信号的混响能量系数与第i个语音输入设备的第l帧的信号能量的卷积,所述gi,lEj,l为第i个语音输入设备的第l帧的纯净语音信号的混响能量系数与第j个语音输入设备的第l帧的信号能量的卷积,当l=L时,所述gj,lEi,l为第j个语音输入设备的第L帧的语音信号能量的系数与第i个语音输入设备的第L帧的信号能量的卷积,所述gi,lEj,l为第i个语音输入设备的第L帧的...

【专利技术属性】
技术研发人员:詹五洲邬鑫锋
申请(专利权)人:华为技术有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1