残留回声消除方法和装置制造方法及图纸

技术编号:12151320 阅读:126 留言:0更新日期:2015-10-03 12:22
本发明专利技术提出一种残留回声消除方法和装置,该残留回声消除方法包括:通过滤波器对麦克风信号进行滤波,获得近端语音的第一次估计值;利用所述第一次估计值和所述麦克风信号对所述滤波器进行更新,获得更新后的滤波器;通过所述更新后的滤波器对所述麦克风信号进行滤波,获得所述近端语音的第二次估计值。本发明专利技术通过在自适应滤波的输入信号中引入近端语音的第一次估计值,使得滤波器的调整总是跟向麦克风信号中的回声成分,减少了近端语音估计的失真,从而可以获得更好的语音识别性能以及音频通讯质量。

【技术实现步骤摘要】
残留回声消除方法和装置
本专利技术涉及语音处理
,尤其涉及一种残留回声消除方法和装置。
技术介绍
声学回声消除(AcousticEchoChancellor;以下简称:AEC)技术是智能语音通话与语音交互系统中不可缺少的一部分。在语音通话中,特别是免提模式下,扬声器播放出来的声音经空气传播后又被麦克风录入进而传向对方,用户频频听到自己的回声会有不舒适的感觉。在车载导航等智能语音交互系统中,用户希望通过语音来控制导航“搜索目的地”或者“播报天气”等,在交互过程中导航的从文本到语音(TexttoSpeech;以下简称:TTS)会干扰用户的命令,如果TTS被当作指令来识别更会造成导航的误操作,使得智能导航不再智能。因而AEC的性能直接影响到语音产品的体验。自适应滤波加后滤波是目前AEC系统中普遍采用的方法,但是现有的方法对语音识别的性能较差,近端语音失真严重,语音听起来断断续续,用户体验度不好。
技术实现思路
本专利技术的目的旨在至少在一定程度上解决相关技术中的技术问题之一。为此,本专利技术的第一个目的在于提出一种残留回声消除方法,该方法通过在自适应滤波的输入信号中引入近端语音的第一次估计值,使得滤波器的调整总是跟向麦克风信号中的回声成分,减少了近端语音估计的失真,从而可以获得更好的语音识别性能以及音频通讯质量。本专利技术的第二个目的在于提出一种残留回声消除装置。为了实现上述目的,本专利技术第一方面实施例的残留回声消除方法,包括:通过滤波器对麦克风信号进行滤波,获得近端语音的第一次估计值;利用所述第一次估计值和所述麦克风信号对所述滤波器进行更新,获得更新后的滤波器;通过所述更新后的滤波器对所述麦克风信号进行滤波,获得所述近端语音的第二次估计值。本专利技术实施例的残留回声消除方法,通过滤波器对麦克风信号进行滤波,获得近端语音的第一次估计值,然后利用第一次估计值和麦克风信号对上述滤波器进行更新,获得更新后的滤波器,最后通过更新后的滤波器对上述麦克风信号进行滤波,获得近端语音的第二次估计值。上述方法通过在自适应滤波的输入信号中引入近端语音的第一次估计值,使得滤波器的调整总是跟向麦克风信号中的回声成分,减少了近端语音估计的失真,从而可以获得更好的语音识别性能以及音频通讯质量。为了实现上述目的,本专利技术第二方面实施例的残留回声消除装置,包括:滤波模块,用于通过滤波器对麦克风信号进行滤波,获得近端语音的第一次估计值;更新模块,用于利用所述滤波模块获得的第一次估计值和所述麦克风信号对所述滤波器进行更新,获得更新后的滤波器;所述滤波模块,还用于通过所述更新模块更新后的滤波器对所述麦克风信号进行滤波,获得所述近端语音的第二次估计值。本专利技术实施例的残留回声消除装置,滤波模块通过滤波器对麦克风信号进行滤波,获得近端语音的第一次估计值,然后更新模块利用第一次估计值和麦克风信号对上述滤波器进行更新,获得更新后的滤波器,最后滤波模块通过更新后的滤波器对上述麦克风信号进行滤波,获得近端语音的第二次估计值。上述装置通过在自适应滤波的输入信号中引入近端语音的第一次估计值,使得滤波器的调整总是跟向麦克风信号中的回声成分,减少了近端语音估计的失真,从而可以获得更好的语音识别性能以及音频通讯质量。本专利技术附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本专利技术的实践了解到。附图说明本专利技术上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:图1为本专利技术残留回声消除方法一个实施例的流程图;图2为本专利技术残留回声消除方法另一个实施例的实现方框图;图3为本专利技术残留回声消除装置一个实施例的结构示意图。具体实施方式下面详细描述本专利技术的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本专利技术,而不能理解为对本专利技术的限制。相反,本专利技术的实施例包括落入所附加权利要求书的精神和内涵范围内的所有变化、修改和等同物。图1为本专利技术残留回声消除方法一个实施例的流程图,如图1所示,该残留回声消除方法可以包括:步骤101,通过滤波器对麦克风信号进行滤波,获得近端语音的第一次估计值。步骤102,利用第一次估计值和上述麦克风信号对上述滤波器进行更新,获得更新后的滤波器。具体地,利用第一次估计值和上述麦克风信号对上述滤波器进行更新,获得更新后的滤波器可以为:将上述麦克风信号与第一次估计值的差值作为输入信号,利用回声信号作为参考信号对上述滤波器进行更新,获得更新后的滤波器。上述更新后的滤波器可以为:其中,ε(K)=[X(K)-S′(K)]-Ht′*(K)R(K);(1)式(1)中,H′t+1(K)为更新后的滤波器,H′t(K)为更新前的滤波器,R(K)为回声信号,X(K)为麦克风信号,S′(K)为第一次估计值,μ为更新步长;“*”表示共轭运算。步骤103,通过更新后的滤波器对上述麦克风信号进行滤波,获得上述近端语音的第二次估计值。具体地,通过更新后的滤波器对上述麦克风信号进行滤波,获得上述近端语音的第二次估计值可以为:根据上述更新后的滤波器计算残留回声,并对上述麦克风信号进行二次滤波,获得近端语音的第二次估计值。上述近端语音的第二次估计值可以为:其中,Rxx(K)=E{X*(K)X(K)},式(2)中,S″(K)为近端语音的第二次估计值,H′t+1(K)为更新后的滤波器,为残留回声,R(K)为回声信号,X(K)为所述麦克风信号,“*”表示共轭运算,E{·}表示数学期望。本实施例中的滤波器可以为后滤波器,例如维纳滤波器,本实施例对此不作限定。上述残留回声消除方法,通过滤波器对麦克风信号进行滤波,获得近端语音的第一次估计值,然后利用第一次估计值和麦克风信号对上述滤波器进行更新,获得更新后的滤波器,最后通过更新后的滤波器对上述麦克风信号进行滤波,获得近端语音的第二次估计值。上述方法通过在自适应滤波的输入信号中引入近端语音的第一次估计值,使得滤波器的调整总是跟向麦克风信号中的回声成分,减少了近端语音估计的失真,从而可以获得更好的语音识别性能以及音频通讯质量。本专利技术在获取残留回声的传递函数的过程中,将近端语音的第一次估计值作为最小均方算法(LeastMeanSquareAlgorithm;以下简称:LMS)自适应滤波的一个输入信号,可以达到保护近端语音的目的。此时将收敛好的传递函数带入第二个维纳滤波器就可以估计出近端语音。图2为本专利技术残留回声消除方法另一个实施例的实现方框图,图2以频域信号为例对信号模型进行说明。图2中,S(K)为近端语音,即期望信号;R(K)为回声信号,即参考信号;X(K)为麦克风信号,即观测信号;Ht(K)为扬声器到麦克风的路径传递函数。S′(K)与S″(K)分别为S(K)的第一次估计值和第二次估计值,H′t+1(K)为H′t(K)在引入近端语音的第一次估计值S′(K)后的一次更新。麦克风信号是近端语音与残留回声的叠加,可以表示为:X(K)=S(K)+H*(K)R(K)(3)其中,“*”表示共轭运算。于是,根据维纳滤波的计算公式可以获得近端语音的第一次估计值:其中,Rxx(K)=E{X*(K)X(K)},式(4)中,本文档来自技高网...
残留回声消除方法和装置

【技术保护点】
一种残留回声消除方法,其特征在于,包括:通过滤波器对麦克风信号进行滤波,获得近端语音的第一次估计值;利用所述第一次估计值和所述麦克风信号对所述滤波器进行更新,获得更新后的滤波器;通过所述更新后的滤波器对所述麦克风信号进行滤波,获得所述近端语音的第二次估计值。

【技术特征摘要】
1.一种残留回声消除方法,其特征在于,包括:通过滤波器对麦克风信号进行滤波,获得近端语音的第一次估计值;利用所述第一次估计值和所述麦克风信号对所述滤波器进行更新,获得更新后的滤波器;通过所述更新后的滤波器对所述麦克风信号进行滤波,获得所述近端语音的第二次估计值;所述利用所述第一次估计值和所述麦克风信号对所述滤波器进行更新,获得更新后的滤波器包括:将所述麦克风信号与所述第一次估计值的差值作为输入信号,利用回声信号作为参考信号对所述滤波器进行更新,获得更新后的滤波器;所述更新后的滤波器为:其中,其中,H′t+1(K)为更新后的滤波器,H′t(K)为更新前的滤波器,R(K)为回声信号,X(K)为所述麦克风信号,S′(K)为所述第一次估计值,μ为更新步长;“*”表示共轭运算。2.根据权利要求1所述的方法,其特征在于,所述通过所述更新后的滤波器对所述麦克风信号进行滤波,获得所述近端语音的第二次估计值包括:根据所述更新后的滤波器计算残留回声,并对所述麦克风信号进行二次滤波,获得所述近端语音的第二次估计值。3.根据权利要求2所述的方法,其特征在于,所述近端语音的第二次估计值为:其中,Rxx(K)=E{X*(K)X(K)},其中,S″(K)为所述近端语音的第二次估计值,H′t+1(K)为更新后的滤波器,为残留回声,R(K)为回声信号,X(K)为所述麦克风信号,“*”表示共轭运算,E{·...

【专利技术属性】
技术研发人员:崔玮玮魏建强
申请(专利权)人:百度在线网络技术北京有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1