声回波消除方法和装置制造方法及图纸

技术编号:12220377 阅读:95 留言:0更新日期:2015-10-21 23:29
本发明专利技术提出一种声回波消除方法和装置,该声回波消除方法包括对参考信号和麦克风信号进行对齐处理,得到对齐处理后的信号;对所述对齐处理后的信号进行自适应滤波处理,得到自适应滤波处理后的信号;根据所述自适应滤波处理后的信号进行NLP预处理,得到NLP处理参数;根据所述NLP处理参数,对所述自适应滤波处理后的信号进行NLP后滤波处理。该方法能够提高AEC效果。

【技术实现步骤摘要】
声回波消除方法和装置
本专利技术涉及数据处理
,尤其涉及一种声回波消除(AcousticEchoCancellation,AEC)方法和装置。
技术介绍
随着智能手机等移动设备的逐渐普及和3G/4G网络的飞速发展,大量基于移动设备的互联网协议(InternetProtocol,IP)软电话产品越来越受到广大用户的青睐。在IP通话系统中,声回波消除(AcousticEchoCancellation,AEC)模块用来消除通话过程中的回波信号,已成为各个终端的不可或缺的音频处理算法。传统的AEC技术的处理流程包括:延迟估计,自适应滤波,双讲检测和非线性处理(Non-LinearProcessing,NLP)后滤波。但是,AEC的消除性能强烈依赖于延迟估计模块的对齐程度,而实际中延迟估计模块难以实现严格对齐,从而会影响AEC效果。
技术实现思路
本专利技术旨在至少在一定程度上解决相干技术中的技术问题之一。为此,本专利技术的一个目的在于提出一种声回波消除方法,该方法可以提高声回波消除方法的效果。本专利技术的另一个目的在于提出一种声回波消除装置。为达到上述目的,本专利技术第一方面实施例提出的声回波消除方法,包括:对参考信号和麦克风信号进行对齐处理,得到对齐处理后的信号;对所述对齐处理后的信号进行自适应滤波处理,得到自适应滤波处理后的信号;根据所述自适应滤波处理后的信号进行NLP预处理,得到NLP处理参数;根据所述NLP处理参数,对所述自适应滤波处理后的信号进行NLP后滤波处理。本专利技术第一方面实施例提出的声回波消除方法,通过进行NLP预处理,可以在NLP预处理时采用一些优化措施,从而提高AEC效果。为达到上述目的,本专利技术第二方面实施例提出的声回波消除装置,包括:延迟估计模块,用于对参考信号和麦克风信号进行对齐处理,得到对齐处理后的信号;自适应滤波模块,用于对所述对齐处理后的信号进行自适应滤波处理,得到自适应滤波处理后的信号;NLP预处理模块,用于根据所述滤波处理后的信号进行NLP预处理,得到NLP处理参数;NLP后滤波处理模块,用于根据所述NLP处理参数,对所述自适应滤波处理后的信号进行NLP后滤波处理本专利技术第二方面实施例提出的声回波消除装置,通过进行NLP预处理,在NLP预处理时采用一些优化措施,从而提高AEC效果。本专利技术附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本专利技术的实践了解到。附图说明本专利技术上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:图1是本专利技术一实施例提出的声回波消除方法的流程示意图;图2是本专利技术另一实施例提出的声回波消除方法的流程示意图;图3是本专利技术实施例中最佳相干系数搜索的流程示意图;图4是本专利技术实施例中NLP等级的确定流程示意图;图5是本专利技术另一实施例提出的声回波消除装置的结构示意图;图6是本专利技术另一实施例提出的声回波消除装置的结构示意图。具体实施方式下面详细描述本专利技术的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的模块或具有相同或类似功能的模块。下面通过参考附图描述的实施例是示例性的,仅用于解释本专利技术,而不能理解为对本专利技术的限制。相反,本专利技术的实施例包括落入所附加权利要求书的精神和内涵范围内的所有变化、修改和等同物。图1是本专利技术一实施例提出的声回波消除方法的流程示意图,该方法包括:S11:对参考信号和麦克风信号进行对齐处理,得到对齐处理后的信号。其中,参考信号是指语音通讯系统中的远端讲话人的语音信号,且这些信号是已知的。麦克风信号是指近端麦克风拾取到的信号,其中包括近端语音信号、扬声器播放的远端语音信号,和各种环境噪音等。在对齐处理时,先进行延迟估计,确定出最优延迟点,之后再根据最优延迟点输出对齐处理后的参考信号和麦克风信号。例如,采用如下公式计算参考信号与麦克风信号的相干系数:其中,R(t1)表示在延迟点是t1时的相干系数,spk(t-t1)是延迟了t1延时点的参考信号,mic(t)是麦克风信号,spkeng,miceng是能量长时平均估计,以spkeng(miceng可以参照运算)为例,计算公式是:spkeng(t)=a×spkeng(t-1)×(1-a)×spk(t)×spk(t),a是预设的值,满足0<a<1,spkeng(t)的初始值也是预设的,例如,选为0或者初始能量值。在实际实施时,可以枚举一些t1,t2,t3…这些值,之后采用上面的相干系数的计算公式计算相应的相干系数R,最优解就是R最大时的解,例如,R(t1)最大,最优延时点可以确定为t1。当然,可以理解的是,具体的延迟估计过程可以采用通常采用的手段实现,上述只是简化描述,例如,在确定出上述公式的最优解后还可以进行渐变以及偏移处理等,对最优解进行偏移后得到最优延迟点,例如,最优延迟点是t1偏移一定值后的值。另外,上述的t1,t2,t3…可以根据选择的范围确定,例如选择的范围是500ms,假设每帧(在语音处理时通常以帧为单位进行处理)为20ms,则可以选择1,2,…25。另外,可以理解的是,在系统处理的信号通常是数字信号,因此上述的spk(t-t1)以及mic(t)是数字信号,例如,用spk(n-n1)以及mic(n)表示。假设最优延迟点用ta表示,则对齐处理后的信号包括:spk(t-ta),mic(t)。另外,在实际运算时上述的数学期望的计算可以采用时间平滑的方式进行,例如,b是预设系数,R的初始值可以从0或者初始的开始,n0是初始时间点。参见图2,对参考信号和麦克风信号进行对齐处理的流程可以用延迟估计(S21)表示。通过延迟估计可以有效增加后续自适应滤波器估计系数的有效性,从而更好的消除干扰信号。但是,由于语音通讯系统录制麦克风信号和播放参考信号会造成相应信号的时间抖动,抖动是指信号时间点的实际值相对于理论值发生偏移。在发生抖动的情况下,严格对齐是做不到的,由于不能严格对齐引起的偏差将在后续的NLP预处理部分予以处理。S12:对所述对齐处理后的信号进行自适应滤波处理,得到自适应滤波处理后的信号。现有技术中,自适应滤波采用的是基于快速傅立叶变换(FastFourierTransformation,FFT)的频域自适应滤波器,由于FFT会造成不同频带间产生混叠,从而会降低AEC的效果。为了提高AEC的效果,参见图2,本实施例中可以采用子带自适应滤波(S22)方式。参见图2,自适应滤波流程可以具体包括:S221:对所述对齐处理后的参考信号和麦克风信号进行子带分析;S222:在每个子带内,基于该子带的参考信号和麦克风信号进行该子带的子带自适应滤波处理。子带自适应滤波的输入信号有两个,一个是参考信号,一个是麦克风信号,基于以上两个信号来完成子带自适应滤波处理,即消除远端回波信号。参考信号和麦克风信号是首先要经过子带分析单元,将全带划分成各个子带信号,然后再基于子带参考信号和对应的同一子带的麦克风信号进行子带自适应滤波处理。划分子带信号的方式有多种,例如采用均匀子带划分方式或者非均匀子带划分方式。具体的,本实施例中,可以采用均匀离散傅立叶变换(DiscreteFourierTransform,DFT)滤波器组实现子带划分本文档来自技高网...
声回波消除方法和装置

【技术保护点】
一种声回波消除方法,其特征在于,包括:对参考信号和麦克风信号进行对齐处理,得到对齐处理后的信号;对所述对齐处理后的信号进行自适应滤波处理,得到自适应滤波处理后的信号;根据所述自适应滤波处理后的信号进行NLP预处理,得到NLP处理参数;根据所述NLP处理参数,对所述自适应滤波处理后的信号进行NLP后滤波处理。

【技术特征摘要】
1.一种声回波消除方法,其特征在于,包括:对参考信号和麦克风信号进行对齐处理,得到对齐处理后的信号;对所述对齐处理后的信号进行自适应滤波处理,得到自适应滤波处理后的信号;根据所述自适应滤波处理后的信号进行非线性处理NLP预处理,得到NLP处理参数;根据所述NLP处理参数,对所述自适应滤波处理后的信号进行NLP后滤波处理;所述对所述自适应滤波处理后的信号进行NLP预处理,包括:根据所述自适应滤波处理后的信号,进行最佳相干系数搜索,得到实际的最佳相干系数;根据所述实际的最佳相干系数以及预设的固定消除等级,对所述自适应滤波处理的信号进行初步NLP滤波,并根据初步NLP滤波后的信号进行声学通道衰减量ERL更新;对所述初步NLP滤波后的信号,进行远端检测和双讲检测,得到检测结果;根据更新后的ERL,以及所述检测结果,进行NLP消除程度设定;所述NLP处理参数包括:NLP等级以及实际的最佳相干系数,所述根据所述NLP处理参数,对所述自适应滤波处理后的信号进行NLP后滤波处理,包括:根据所述NLP等级以及所述实际的最佳相干系数,确定后滤波系数;根据所述后滤波系数,对所述自适应滤波处理后的信号进行NLP后滤波处理。2.根据权利要求1所述的方法,其特征在于,所述对所述对齐处理后的信号进行自适应滤波处理,包括:对所述对齐处理后的信号进行子带自适应滤波处理。3.根据权利要求1所述的方法,其特征在于,所述进行最佳相干系数搜索,包括:获取当前帧的麦克风信号和当前帧的参考信号,所述当前帧的参考信号是与所述当前帧的麦克风信号对齐后的参考信号;获取所述当前帧的参考信号前后预设范围内的参考信号;计算所述当前帧的麦克风信号与每个获取的参考信号的相干系数,并从中确定出最大的相干系数确定为实际的最佳相干系数。4.根据权利要求1所述的方法,其特征在于,所述根据更新后的ERL,以及所述检测结果,进行NLP消除程度设定,包括:确定当前状态,当前状态包括:听筒模式或者免提模式;在当前状态是听筒模式时,根据有无远端信号,以及更新后的ERL确定NLP等级;或者,在当前状态是免提模式时,根据有无远端信号,以及更新后的ERL确定初步的NLP等级,并根据是否双讲状态以及初步的NLP等级,确定最终的NLP等级。5.根据权利要求2-4任一项所述的方法,其特征在于,还包括:对NLP后滤波处理后的信号,进行子带合成。6.一种声回波消除装置,其特征在于,包括:延迟...

【专利技术属性】
技术研发人员:郭启行魏建强崔玮玮宋辉
申请(专利权)人:百度在线网络技术北京有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1