一种基于麦克风阵列的回声消除方法与系统技术方案

技术编号:18621678 阅读:30 留言:0更新日期:2018-08-08 00:50
本发明专利技术涉及一种基于麦克风阵列的回声消除方法及系统,其通过波速形成、线性回声消除与非线性回声消除三重结构抑制了拾取信号中的回声能量,其中,波束形成模块稳定抑制喇叭方位的直达声信号,不受环境变化影响;线性回声消除模块对波速形成后的残留回声进行抑制,消除回声的反射部分;而非线性回声消除模块利用参考信号与残留回声信号的长时幅度相关度进行增益抑制,进一步抑制回声能量。本发明专利技术在大幅提升对回声的抑制效果的同时保证了拾取信号的清晰、自然,与现有技术相比有更强的性能以及更好的稳定性。

An echo cancellation method and system based on microphone array

The invention relates to an echo cancellation method and system based on a microphone array, which inhibits the echo energy in the pickup signal through the wave velocity formation, linear echo cancellation and nonlinear echo cancellation three structure, in which the beamforming module steadily inhibits the direct sound signal of the horn's azimuth, and is not affected by environmental changes; The echo cancellation module inhibits the residual echo after the wave velocity formation and eliminates the reflection part of the echo, while the nonlinear echo cancellation module uses the long time correlation of the reference signal and the residual echo signal to suppress the gain, and further inhibits the echo energy. The invention ensures the clarity and nature of the pickup signal while greatly enhancing the effect of the echo suppression, and has stronger performance and better stability compared with the existing technology.

【技术实现步骤摘要】
一种基于麦克风阵列的回声消除方法与系统
本专利技术涉及音频信号处理领域,具体涉及一种基于麦克风阵列的回声消除方法与系统。
技术介绍
实时通信设备进行麦克风拾音时,会受环境噪声、混响、电路噪声的干扰,同时还受回声的干扰。当远端话者的讲话通过受话器播放时,麦克风在拾取话者声音的同时也拾取受话器信号。受话器信号会直接传达到麦克风,同样也会经过物体反射,衍射,共振等方式传递到麦克风。因此,远端话者在说话同时,会听到自己的声音从对方传回来。信号处理系统与通信的总延时超过10ms时,话者会感知到自己的回声;当回声的总延时超过数十毫秒时,话者会觉得回声干扰了自己说话。而实际通信中,信号延时往往会大于100ms以上。在语音/音频信号处理领域,已经有了很多经典而成熟的回声消除方法。其中LMS、NLMS、GSPAPA等算法已经广泛应用于话机、移动电话,保证了优质的通话音质,使用户免受回声的干扰。然而,对于免提通话以及视频会议系统等开放式通信场景中,特别是对于麦克风与喇叭安置在同一机器上的免提式通信设备,麦克风拾取的声信号中,回声能量经常会多于话者能量及SER(Signal-to-AcousticEchoes-Ratio)小于0。而SER越小,回声消除算法需要抑制的回声等级就越大。为了提升回声的抑制等级,回声消除算法需要提高自适应滤波器的精确度。而过度提高精确度导致自适应速率变慢。考虑到各方面因数,传统回声消除算法在上述环境中无法干净的消除拾取信号中的回声信号。在不得已的情况下,多数免提设备限制了扬声器输出保证的最低限度的SER。还有一些设备在扬声器播放大功率声音时动态降低输入灵敏度,保留了扬声器音量,保证了单工通信质量。然而面对多人会议环境中,不免会出现远端与近端话者同时讲话的情况。此时,远端话者会接收到忽高忽低的拾音信号,严重影了全双工通信的自然通话质量。总而言之,如何能够在免提环境下提供更有效的回声消除方法,保证自然地全双工通信成为了本领域技术人员迫切解决的问题。
技术实现思路
本专利技术的目的在于提供一种基于麦克风阵列的回声消除方法与系统,其可以大幅提高回声抑制等级,有效消除回声,保证了全双工通信的自然通话质量。为实现上述目的,本专利技术采用的技术方案是:一种基于麦克风阵列的回声消除方法,其具体包括以下步骤:步骤1、对多路输入的时域音频信号xM进行分帧,短时时频变换得到频域输入信号Xn;对参考信号ref进行分帧,短时时频变换得到频域参考信号REFn;步骤2、根据频域输入信号Xn,通过波速形成迭代算法更新自适应波速形成增益WABF;步骤3、通过步骤1得到的频域输入信号Xn与步骤2得到的波速形成增益WABF,计算波速形成后的频域信号YABF,YABF[k]=WABF[k]*Xn[k](1)其中,k=0,…,N/2-1;N=2R,R为帧长;步骤4、根据步骤3得到的波速形成后的频域信号YABF,与步骤1得到的频域参考信号REFn,通过自适应回声消除得到频域回声消除残留信号EAEC;步骤5、根据步骤4得到的频域回声消除残留信号EAEC,与步骤1得到的频域参考信号REFn,通过幅度自适应回声消除得到回声消除输出信号YAEC;步骤6、将回声消除输出信号YAEC进行时频逆变换的得到时域输出信号。所述步骤1中的短时时频变换为重叠加窗短时傅里叶变换,窗函数选择汉宁窗;所述频域输入信号Xn为:所述频域参考信号REFn为:其中,k=0,…,N/2-1;N=2R,R为帧长;m=0,…,M-1,M为麦克风阵列的麦克风总数;n为帧序号。所述步骤2具体如下:步骤2.1、根据步骤1得到的频域输入信号xM得到频域输入矩阵Xm,其中,BNABF为波速形成的分块数目;k=0,…,N/2-1;N=2R,R为帧长;m=0,…,M-1,M为麦克风阵列的麦克风总数;n为帧序号;步骤2.2、根据步骤2.1得到的频域输入矩阵Xm与自适应波速形成增益WABF,计算其中,为上一帧回声消除后的残留信号,PA为波速形成的投影矩阵,μABF为波速形成自适应步长;步骤2.3、计算更新后的自适应波速形成增益WABF,其中,为自适应增益,为约束增益。所述步骤2中的波速形成的投影矩阵PA与约束增益根据麦克风摆设及拾音方位确定,具体如下:步骤2.2.1、根据麦克风摆设位置与拾音方位计算约束矩阵计算距离dm,其中,m=1,2,…,M;x,y,z是空间坐标;步骤2.2.2、根据频点频率f计算各频率波长λ,λ[k]=c/f[k](25)其中,c为环境中声音传播速度;步骤2.2.3、根据麦克风距离dm与波长λ计算各个频率的转向矩阵a,其中,d0为参考位置的坐标;步骤2.2.4、根据转向矩阵a计算约束矩阵C,C[k]={a[k],sp[k]}(27)其中,sp为喇叭方位的转向矩阵;步骤2.2.5、根据约束矩阵C计算各个频率的约束增益其中,步骤2.2.6、根据约束矩阵C计算各个频率的投影矩阵PA,PA[k]=I-C[k]/(C*[k]C[k])C*[k](29)其中,I为单位矩阵。所述步骤4具体为:步骤4.1、根据频域参考信号REFn计算回声消除的参考矩阵XFm,BNAEC为回声消除的分块数目,k=0,…,N/2-1;N=2R,R为帧长;n为帧序号;步骤4.2、根据回声消除的参考矩阵XFm与上一帧迭代得到的回声消除自适应增益计算AAEC,其中,BNABF为波速形成的分块数目;步骤4.3、根据步骤3得到的波速形成后的频域信号YABF与步骤4.2得到的AAEC,计算回声消除后的残留信号EAEC,EAEC[k]=YABF[k]-AAEC[k](9)步骤4.4、根据步骤3得到的波速形成后的频域信号YABF计算回声消除的谱功率PAEC,其中,α为平滑系数,α∈[0,1];步骤4.5、根据步骤4.4得到的谱功率PAEC与步骤4.3得到的回声消除后的残留信号EAEC,计算回声消除的归一化残留信号步骤4.6、根据步骤4.5得到的回声消除的归一化残留信号计算回声消除的迭代因子PP,其中,n=0,…,BNAEC-1,thAEC为归一化阈值;步骤4.7、根据回声消除的迭代因子PP更新回声消除自适应增益WAEC,其中,μAEC为回声消除的迭代步长。所述步骤5中,幅频自适应回声消除具体如下:步骤5.1、根据步骤1得到的频域参考信号REFn计算幅度回声消除的参考矩阵XFmAEC_Mag,步骤5.2、根据幅度回声消除的参考矩阵XFmAEC_Mag与上一帧迭代得到的幅度回声消除的自适应增益计算AAEC_Mag,步骤5.3、根据AAEC_Mag与步骤5得到的回声消除后的残留信号EAEC得到幅度回声消除的后的残留信号EAEC_Mag,EAEC_Mag[k]=|EAEC[k]|-AAEC_Mag[k](16)步骤5.4、根据回声消除后的残留信号EAEC计算幅度回声消除的谱功率PAEC_Mag,其中,α为平滑系数,α∈[0,1];步骤5.5、根据谱功率PAEC_Mag与幅度回声消除后的残留信号EAEC_Mag计算归一化残留信号步骤5.6、根据上述归一化残留信号计算幅度回声消除的迭代因子PPMag,其中,n=0,…,BNAEC-1;步骤5.7、根据幅度回声消除的迭代因子PPMag更新幅度回声消除自适应增益WAEC_Mag,其中,μAEC_M本文档来自技高网
...

【技术保护点】
1.一种基于麦克风阵列的回声消除方法,其特征在于:所述方法具体包括以下步骤:步骤1、对多路输入的时域音频信号xM进行分帧,短时时频变换得到频域输入信号Xn;对参考信号ref进行分帧,短时时频变换得到频域参考信号REFn;步骤2、根据频域输入信号Xn,通过波速形成迭代算法更新自适应波速形成增益WABF;步骤3、通过步骤1得到的频域输入信号Xn与步骤2得到的波速形成增益WABF,计算波速形成后的频域信号YABF,YABF[k]=WABF[k]*Xn[k]  (1)其中,k=0,…,N/2‑1;N=2R,R为帧长;步骤4、根据步骤3得到的波速形成后的频域信号YABF,与步骤1得到的频域参考信号REFn,通过自适应回声消除得到频域回声消除残留信号EAEC;步骤5、根据步骤4得到的频域回声消除残留信号EAEC,与步骤1得到的频域参考信号REFn,通过幅度自适应回声消除得到回声消除输出信号YAEC;步骤6、将回声消除输出信号YAEC进行时频逆变换的得到时域输出信号。

【技术特征摘要】
1.一种基于麦克风阵列的回声消除方法,其特征在于:所述方法具体包括以下步骤:步骤1、对多路输入的时域音频信号xM进行分帧,短时时频变换得到频域输入信号Xn;对参考信号ref进行分帧,短时时频变换得到频域参考信号REFn;步骤2、根据频域输入信号Xn,通过波速形成迭代算法更新自适应波速形成增益WABF;步骤3、通过步骤1得到的频域输入信号Xn与步骤2得到的波速形成增益WABF,计算波速形成后的频域信号YABF,YABF[k]=WABF[k]*Xn[k](1)其中,k=0,…,N/2-1;N=2R,R为帧长;步骤4、根据步骤3得到的波速形成后的频域信号YABF,与步骤1得到的频域参考信号REFn,通过自适应回声消除得到频域回声消除残留信号EAEC;步骤5、根据步骤4得到的频域回声消除残留信号EAEC,与步骤1得到的频域参考信号REFn,通过幅度自适应回声消除得到回声消除输出信号YAEC;步骤6、将回声消除输出信号YAEC进行时频逆变换的得到时域输出信号。2.根据权利要求1所述的一种基于麦克风阵列的回声消除方法,其特征在于:所述步骤1中的短时时频变换为重叠加窗短时傅里叶变换,窗函数选择汉宁窗;所述频域输入信号Xn为:所述频域参考信号REFn为:其中,k=0,…,N/2-1;N=2R,R为帧长;m=0,…,M-1,M为麦克风阵列的麦克风总数;n为帧序号。3.根据权利要求1所述的一种基于麦克风阵列的回声消除方法,其特征在于:所述步骤2具体如下:步骤2.1、根据步骤1得到的频域输入信号xM得到频域输入矩阵Xm,其中,BNABF为波速形成的分块数目;k=0,…,N/2-1;N=2R,R为帧长;m=0,…,M-1,M为麦克风阵列的麦克风总数;n为帧序号;步骤2.2、根据步骤2.1得到的频域输入矩阵Xm与自适应波速形成增益WABF,计算其中,为上一帧回声消除后的残留信号,PA为波速形成的投影矩阵,μABF为波速形成自适应步长;步骤2.3、计算更新后的自适应波速形成增益WABF,其中,为自适应增益,为约束增益。4.根据权利要求3所述的一种基于麦克风阵列的回声消除方法,其特征在于:所述步骤2中的波速形成的投影矩阵PA与约束增益根据麦克风摆设及拾音方位确定,具体如下:步骤2.2.1、根据麦克风摆设位置与拾音方位计算约束矩阵计算距离dm,其中,m=1,2,…,M;x,y,z是空间坐标;步骤2.2.2、根据频点频率f计算各频率波长λ,λ[k]=c/f[k](25)其中,c为环境中声音传播速度;步骤2.2.3、根据麦克风距离dm与波长λ计算各个频率的转向矩阵a,其中,d0为参考位置的坐标;步骤2.2.4、根据转向矩阵a计算约束矩阵C,C[k]={a[k],sp[k]}(27)其中,sp为喇叭方位的转向矩阵;步骤2.2.5、根据约束矩阵C计算各个频率的约束增益其中,步骤2.2.6、根据约束矩阵C计算各个频率的投影矩阵PA,PA[k]=I-C[k]/(C*[k]C[k])C*[k](29)其中,I为单位矩阵。5.根据权利要求1所述的一种基于麦克风阵列的回声消除方法,其特征在于:所述步骤4具体为:步骤4.1、根据频域参考信号REFn计算回声消除的参考矩阵XFm,BNAEC为回声消除的分块数目,k=0,…,N/2-1;N=2R,R为帧长;n为帧序号;步骤4.2、根据回声消除的参考矩阵XFm与上一帧迭代得到的回声消除自适应增益计算AAEC,其中,BNABF为波速形成的分块数目;步骤4.3、根据步骤3得到的波速形成后的频域信号YABF与步骤4.2得到的AAEC,计算回声消除后的残留信号EAEC,EA...

【专利技术属性】
技术研发人员:张惠荣王伟廷朴志刚
申请(专利权)人:厦门亿联网络技术股份有限公司
类型:发明
国别省市:福建,35

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1