应用于远场识别的前处理方法和装置制造方法及图纸

技术编号:11790025 阅读:142 留言:0更新日期:2015-07-29 14:02
本发明专利技术提出一种应用于远场识别的前处理方法和装置,该应用于远场识别的前处理方法包括对要处理的声音信号进行固定波束形成处理,得到固定波束形成处理后的波束信号;对所述固定波束形成处理后的波束信号,进行声回波消除以及最优波束选择;根据声回波消除以及最优波束选择后的波束信号,得到应用于远场识别的前处理后的信号。该方法能够提高前处理效果,并且可选的,在声音信号数量较大时可以降低运算量。

【技术实现步骤摘要】
应用于远场识别的前处理方法和装置
本专利技术涉及数据处理
,尤其涉及一种应用于远场识别的前处理方法和装置。
技术介绍
远场识别技术,也即远距离识别技术,通常是为了解决说话人距离语音设备2米之外场景的语音识别请求。为了获取比较稳定可靠的远场识别性能,针对远场识别场景的前处理(远场拾音)技术就显得尤为迫切和重要。现有技术中,远场拾音的流程串联依次包括:声回波消除(Acousticechocancellation,AEC),声源定位,自适应波束形成(AdaptiveBeamforming,ABF),单麦增强和后处理。但是,现有技术中需要声源定位模块,声源定位模块本身准确度就不理想,而且与后续的ABF串联,还会影响ABF的性能,从而影响前处理效果,另外,先进行AEC,当要处理的声音信号的数量较大时,运算量也较大。
技术实现思路
本专利技术旨在至少在一定程度上解决相关技术中的技术问题之一。为此,本专利技术的一个目的在于提出一种应用于远场识别的前处理方法,该方法可以提高前处理效果,并且可选的,在声音信号数量较大时可以降低运算量。本专利技术的另一个目的在于提出一种应用于远场识别的前处理装置。为达到上述目的,本专利技术第一方面实施例提出的应用于远场识别的前处理方法,包括:对要处理的声音信号进行固定波束形成处理,得到固定波束形成处理后的波束信号;对所述固定波束形成处理后的波束信号,进行声回波消除以及最优波束选择;根据声回波消除以及最优波束选择后的波束信号,得到应用于远场识别的前处理后的信号。本专利技术第一方面实施例提出的应用于远场识别的前处理方法,不需要声源定位模块,可以避免声源定位不准确造成的前处理效果不好的问题,从而可以提高前处理效果,并且,可选的,先进行FBF后再进行AEC,由于通常FBF后的波束数量相对于要处理的声音信号的数量小,可以降低运算量。为达到上述目的,本专利技术第二方面实施例提出的应用于远场识别的前处理装置,包括:固定波束形成模块,用于对要处理的声音信号进行固定波束形成处理,得到固定波束形成处理后的波束信号;处理模块,用于对所述固定波束形成处理后的波束信号,进行声回波消除以及最优波束选择;获取模块,用于根据声回波消除以及最优波束选择后的波束信号,得到应用于远场识别的前处理后的信号。本专利技术第二方面实施例提出的应用于远场识别的前处理装置,不需要声源定位模块,可以避免声源定位不准确造成的前处理效果不好的问题,从而可以提高前处理效果,并且,可选的,先进行FBF后再进行AEC,由于通常FBF后的波束数量相对于要处理的声音信号的数量小,可以降低运算量。本专利技术附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本专利技术的实践了解到。附图说明本专利技术上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:图1是本专利技术一实施例提出的应用于远场识别的前处理方法的流程示意图;图2是本专利技术另一实施例提出的应用于远场识别的前处理方法的流程示意图;图3是本专利技术另一实施例提出的应用于远场识别的前处理方法的流程示意图;图4是本专利技术另一实施例提出的应用于远场识别的前处理装置的结构示意图;图5是本专利技术另一实施例提出的应用于远场识别的前处理装置的结构示意图;图6是本专利技术另一实施例提出的应用于远场识别的前处理装置的结构示意图。具体实施方式下面详细描述本专利技术的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的模块或具有相同或类似功能的模块。下面通过参考附图描述的实施例是示例性的,仅用于解释本专利技术,而不能理解为对本专利技术的限制。相反,本专利技术的实施例包括落入所附加权利要求书的精神和内涵范围内的所有变化、修改和等同物。图1是本专利技术一实施例提出的应用于远场识别的前处理方法的流程示意图,该方法包括:S11:对要处理的声音信号进行固定波束形成处理,得到固定波束形成处理后的波束信号。其中,要处理的声音信号可以是指麦克风信号,麦克风信号指麦克风拾取到的信号,其中包括近端语音信号(语音控制指令),房间混响和各种环境噪音等。在远场识别时,为了提高识别性能,通常会采用麦克风阵列(定向麦克风或者全向麦克风),因此,要处理的声音信号可以具体是指麦克风阵列信号,麦克风阵列信号包括多路麦克风信号。波束形成技术可以包括现有技术中采用的ABF,还包括固定波束形成(FixedBeamforming,FBF)。ABF的空间波束特性是自适应变化的,而FBF的空间波束特性是固定不变的。空间波束特性例如特定方向的信号增益响应。FBF处理时,可选的,所述固定波束形成处理采用的固定波束的个数为多个,每个固定波束覆盖部分空间,所有固定波束形成对整个空间的覆盖。通过波束对空间的全覆盖,可以保证用户位于空间任意位置时都可以检测到用户讲话,避免对用户位置的限制。当要处理的声音信号(如麦克风阵列信号)的数量较大时,为了降低运算量,FBF采用的固定波束的数量可以小于要处理的声音信号的数量。例如,所述固定波束的个数是3个,不同的固定波束分别覆盖不同的120度的空间;或者,所述固定波束的个数是6个,不同的固定波束分别覆盖不同的60度的空间。S12:对所述固定波束形成处理后的波束信号,进行声回波消除以及最优波束选择。其中,为了消除干扰信号,语音识别交互系统中通常会包括声回波消除(Acousticechocancellation,AEC)模块,AEC模块通常称为BargeIn功能模块。干扰信号例如为语音识别交互系统(以下简称为系统)产生的音乐,语音合成(texttospeech,TTS)信号等。由于AEC模块除了要追踪学习从系统的扬声器到麦克风的声学传递函数(Acoustictransferfunction,ATF),还要学习各种在它之前的处理模块产生的随时间变化的成分,如果这些变化快于AEC中自适应滤波器的收敛速度,就会出现AEC模块一直无法理想对这些快速变化进行学习的问题,进而导致对于系统播放的干扰信号无法很好消除。由于ABF的空间波束特性是变化的,并且,通常ABF的滤波器的变化速度远远大于AEC模块的滤波器的变化速度,所以,现有技术中不能将ABF放在AEC之前来提高信噪比。而AEC的处理效果依赖于信噪比,信噪比越高处理效果越好。由于不能将ABF放在AEC之前以提高信噪比,因此,现有技术不能将ABF放在AEC之前进行处理的方式,会影响AEC效果,进而会影响远场识别效果。而本实施例中,采用FBF,由于FBF的空间波束特性是固定不变的,对于AEC模块来讲就是已知的,不需要AEC模块进行追踪学习,因此,本实施例中可以将FBF放在AEC之前。由于经过FBF处理后,会提高信噪比,因此,将FBF放在AEC之前,就会提高AEC的处理效果,进而提高远场识别效果。另一方面,在麦克风阵列信号包括的信号的数量较大(比如大于6)时,现有技术中,先进行AEC,那么需要的AEC模块的个数就与麦克风信号的数量相同,也就比较大。而本实施例中,先进行FBF再进行AEC,需要的AEC模块的数量与FBF波束的个数相同,而FBF的波束个数通常小于数量较大的麦克风信号的数量,例如FBF的波束数量是3个或6个,那么就可以显著降低需要的AEC模块的数量,降低运算量。最优波束选择时,本文档来自技高网...
应用于远场识别的前处理方法和装置

【技术保护点】
一种应用于远场识别的前处理方法,其特征在于,包括:对要处理的声音信号进行固定波束形成处理,得到固定波束形成处理后的波束信号;对所述固定波束形成处理后的波束信号,进行声回波消除以及最优波束选择;根据声回波消除以及最优波束选择后的波束信号,得到应用于远场识别的前处理后的信号。

【技术特征摘要】
1.一种应用于远场识别的前处理方法,其特征在于,包括:对要处理的声音信号进行固定波束形成处理,得到固定波束形成处理后的波束信号;对所述固定波束形成处理后的波束信号,进行声回波消除以及最优波束选择;根据声回波消除以及最优波束选择后的波束信号,得到应用于远场识别的前处理后的信号。2.根据权利要求1所述的方法,其特征在于,所述固定波束形成处理采用的固定波束的个数为多个,每个固定波束覆盖部分空间,所有固定波束形成对整个空间的覆盖。3.根据权利要求2所述的方法,其特征在于,所述固定波束的个数是3个,不同的固定波束分别覆盖不同的120度的空间;或者,所述固定波束的个数是6个,不同的固定波束分别覆盖不同的60度的空间。4.根据权利要求1所述的方法,其特征在于,所述固定波束形成处理采用的固定波束的个数为多个,且,所述固定波束的数量小于要处理的声音信号的数量。5.根据权利要求1-4任一项所述的方法,其特征在于,当所述固定波束形成处理后的波束信号是多个时,所述对所述固定波束形成处理后的波束信号,进行声回波消除以及最优波束选择,包括:采用与所述固定波束形成处理后的波束信号个数相同的声回波消除模块,对每个固定波束形成处理后的波束信号进行声回波消除,得到多个声回波消除后的波束信号;在声回波消除后的多个波束信号中,进行最优波束选择,选择出最优波束信号。6.根据权利要求1-4任一项所述的方法,其特征在于,当所述固定波束形成处理后的波束信号是多个时,且,当不存在系统干扰信号时,所述对所述固定波束形成处理后的信号波束信号,进行声回波消除以及最优波束选择,包括:从多个固定波束形成处理后的波束信号中,进行最优波束选择,选择出一个最优波束信号;采用一个声回波消除模块,对所述最优波束信号进行声回波消除。7.根据权利要求1-4任一项所...

【专利技术属性】
技术研发人员:魏建强崔玮玮宋辉王昕姜俊
申请(专利权)人:百度在线网络技术北京有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1