用于基于多麦克风的语音增强的系统、方法及设备技术方案

技术编号:5462020 阅读:250 留言:0更新日期:2012-04-11 18:40
本发明专利技术描述用于处理M通道输入信号的系统、方法及设备,其包括输出由多个空间分离滤波器中的选定一者所产生的信号。本发明专利技术描述用以从有噪声环境中分离出声学信号的应用,且本发明专利技术还描述可实施于多麦克风手持式装置上的配置。

【技术实现步骤摘要】
【国外来华专利技术】根据35U.S.C.§119主张优先权本专利申请案主张以下临时申请案的优先权:2007年12月19日申请的题为“用于手持机中的基于多麦克风的语音增强的系统及方法(SYSTEM AND METHOD FORMULTI-MICROPHONE BASED SPEECH ENHANCEMENT IN HANDSETS”的第61/015,084号临时申请案;2007年12月26日申请的题为“用于手持机中的基于多麦克风的语音增强的系统及方法(SYSTEM AND METHOD FOR MULTI-MICROPHONEBASED SPEECH ENHANCEMENT IN HANDSETS)”的第61/016,792号临时申请案;2008年6月30日申请的题为“用于手持机中的基于多麦克风的语音增强的系统及方法(SYSTEM AND METHOD FOR MULTI-MICROPHONE BASED SPEECHENHANCEMENT IN HANDSETS)”的第61/077,147号临时申请案;及2008年7月9日申请的题为“用于基于多麦克风的语音增强的系统、方法及设备(SYSTEMS,METHODS,AND APPARATUS FOR MULTI-MICROPHONE BASED SPEECHENHANCEMENT)”的第61/079,359号临时申请案,所述申请案均转让给本受让人。
本专利技术涉及语音处理。
技术介绍
可能在不可避免地为有噪声的环境中俘获信息信号。因此,可能需要从包括来自所要信息源的信号及来自一个或一个以上干扰源的信号的若干源信号的叠加及线性组合当中区分信息信号。此问题可能出现于用于话音通信(例如,电话)的各种声学应用中。一种用以从此混合物中分离出信号的方法是以公式表示近似混合环境的逆环境的非混合矩阵。然而,实际俘获环境通常包括例如时间延迟、多路径、反射、相位差、回声及/或混响等效应。这些效应产生源信号的卷积混合物,其可能引起传统线性模型化方法所具有的问题且还可为频率相依的。需要开发出用于从所述混合物中分离出一个或一个以上所要信号的信号处理方法。一人可能需要使用话音通信信道来与另一人通信。所述信道可(例如)由移动无线手持机或头戴式耳机、步话机、双向无线电、汽车套件或其它通信装置提供。当人讲话时,通信装置上的麦克风接收人的话音的声音且将其转换为电子信号。麦克风还可能从各种噪声源接收声音信号,且因此,电子信号还可能包括噪声分量。由于麦克风可能位于距人的嘴的某距离处,且环境可能具有许多不可控制的噪声源,所以噪声分量可能为信号的实质分量。此实质噪声可能引起令人不满意的通信体验及/或可能致使通信装置以低效方式操作。声学环境通常为有噪声的,从而使得难以可靠地检测所要信息信号且对所要信息信号做出反应。在一个特定实例中,语音信号在有噪声环境中产生,且语音处理方法用以分离语音信号与环境噪声。此语音信号处理在日常通信的许多领域中为重要的,因为噪声在真实世界条件下几乎一直存在。噪声可经定义为干扰所关注语音信号或使所关注语音信号-->降级的所有信号的组合。真实世界充满了包括单点噪声源在内的多个噪声源,所述多个噪声源通常侵入多个声音,从而导致混响。除非将所要语音信号与背景噪声分离及隔离,否则可能难以可靠且有效地使用所要语音信号。背景噪声可包括由一般环境所产生的众多噪声信号及由其他人的背景谈话所产生的信号,以及从所述信号中的每一者所产生的反射及混响。对于通信发生于有噪声环境中的应用来说,可能需要分离所要语音信号与背景噪声。用于分离所要声音信号与背景噪声信号的现有方法包括简单滤波过程。虽然这些方法对于声音信号的实时处理可能为足够简单且快速的,但其不能容易地适于不同声音环境且可导致所要语音信号的实质降级。举例来说,过程可能根据包含过度的噪声特性的预定假设集合而移除分量,使得将所要语音信号的部分分类为噪声且将其移除。或者,过程可能根据包含过少的噪声特性的预定假设集合而移除分量,使得将背景噪声的部分(例如,音乐或谈话)分类为所要信号且将其保留于经滤波输出语音信号中。如PDA及蜂窝式电话等手持机正作为精选的移动语音通信装置而快速地出现,从而充当用于对蜂窝式及因特网网络的移动接入的平台。先前在安静办公室或家庭环境中的桌上型计算机、膝上型计算机及办公室电话上所执行的越来越多的功能正在如汽车、街道或咖啡厅等日常情形中得以执行。此趋势意味着实质量的话音通信正发生于用户由其他人包围的环境中,所述环境具有在人倾向于聚集的情况下通常所遭遇的噪声内容种类。此噪声种类(包括例如竞争谈话者、音乐、串音、机场噪声)的特征通常为非静止的且靠近于用户自身的频率特征,且因此,此噪声可能难以使用传统单重麦克风或固定波束成形类型方法来模型化。此噪声还倾向于在电话谈话中使用户分心或烦恼。此外,许多标准自动化商业交易(例如,账户结余或股票报价核查)使用基于话音辨识的数据查询,且这些系统的精确度可能受到干扰噪声显著地妨碍。因此,可能需要基于多麦克风的高级信号处理(例如)以支持有噪声环境中的手持机使用。
技术实现思路
根据通用配置,一种处理包括语音分量及噪声分量的M通道输入信号(M为大于一的整数)以产生经空间滤波输出信号的方法包括:将第一空间处理滤波器应用于输入信号;及将第二空间处理滤波器应用于输入信号。此方法包括:在第一时间处,确定第一空间处理滤波器开始优于第二空间处理滤波器而分离语音与噪声分量;及响应于在第一时间处的所述确定,产生基于第一经空间处理信号的信号作为输出信号。此方法包括:在第一时间之后的第二时间处,确定第二空间处理滤波器开始优于第一空间处理滤波器而分离语音与噪声分量;及响应于在第二时间处的所述确定,产生基于第二经空间处理信号的信号作为输出信号。在此方法中,第一及第二经空间处理信号是基于输入信号。还描述此方法的实例。在一个此类实例中,一种处理包括语音分量及噪声分量的M通道输入信号(M为大于一的整数)以产生经空间滤波输出信号的方法包括:将第一空间处理滤波器应用于输入信号以产生第一经空间处理信号;及将第二空间处理滤波器应用于输入信号以产生第二经空间处理信号。此方法包括:在第一时间处,确定第一空间处理滤波器开始优于第二空间处理滤波器而分离语音与噪声分量;及响应于在第一时间处的所述确定,产生第一经空间处理信号作为输出信号。此方法包括:在第一时间之后的第二时间处,确定第二空间处理滤波器开始优于第一空间处理滤波器而分离语音与噪声分量;及响应于-->在第二时间处的所述确定,产生第二经空间处理信号作为输出信号。根据另一通用配置,一种用于处理包括语音分量及噪声分量的M通道输入信号(M为大于一的整数)以产生经空间滤波输出信号的设备包括:用于对输入信号执行第一空间处理操作的装置;及用于对输入信号执行第二空间处理操作的装置。所述设备包括:用于在第一时间处确定用于执行第一空间处理操作的装置开始优于用于执行第二空间处理操作的装置而分离语音与噪声分量的装置;及用于响应于来自所述用于在第一时间处确定的装置的指示而产生基于第一经空间处理信号的信号作为输出信号的装置。所述设备包括:用于在第一时间之后的第二时间处确定用于执行第二空间处理操作的装置开始优于用于执行第一空间处理操本文档来自技高网
...

【技术保护点】
一种处理包括语音分量及噪声分量的M通道输入信号以产生经空间滤波输出信号的方法,M为大于一的整数,所述方法包含:将第一空间处理滤波器应用于所述输入信号;将第二空间处理滤波器应用于所述输入信号;在第一时间处,确定所述第一空间处理滤波器开始优于所述第二空间处理滤波器而分离所述语音与噪声分量;响应于在第一时间处的所述确定,产生基于第一经空间处理信号的信号作为所述输出信号;在所述第一时间之后的第二时间处,确定所述第二空间处理滤波器开始优于所述第一空间处理滤波器而分离所述语音与噪声分量;及响应于在第二时间处的所述确定,产生基于第二经空间处理信号的信号作为所述输出信号,其中所述第一及第二经空间处理信号是基于所述输入信号。

【技术特征摘要】
【国外来华专利技术】US 2007-12-19 61/015,084;US 2007-12-26 61/016,792;1.一种处理包括语音分量及噪声分量的M通道输入信号以产生经空间滤波输出信号的方法,M为大于一的整数,所述方法包含:将第一空间处理滤波器应用于所述输入信号;将第二空间处理滤波器应用于所述输入信号;在第一时间处,确定所述第一空间处理滤波器开始优于所述第二空间处理滤波器而分离所述语音与噪声分量;响应于在第一时间处的所述确定,产生基于第一经空间处理信号的信号作为所述输出信号;在所述第一时间之后的第二时间处,确定所述第二空间处理滤波器开始优于所述第一空间处理滤波器而分离所述语音与噪声分量;及响应于在第二时间处的所述确定,产生基于第二经空间处理信号的信号作为所述输出信号,其中所述第一及第二经空间处理信号是基于所述输入信号。2.根据权利要求1所述的方法,其中所述第一及第二空间处理滤波器中的至少一者的多个系数值是基于在多个不同声学情境下所记录的多个多通道训练信号。3.根据权利要求1所述的方法,其中所述第一及第二空间处理滤波器中的至少一者的多个所述系数值是根据基于多个多通道训练信号的经收敛滤波器状态获得的,其中所述多个多通道训练信号是在多个不同声学情境下记录的。4.根据权利要求1所述的方法,其中所述第一空间处理滤波器的多个所述系数值是基于在第一多个不同声学情境下所记录的多个多通道训练信号,且其中所述第二空间处理滤波器的多个所述系数值是基于在第二多个不同声学情境下所记录的多个多通道训练信号,所述第二多个不同声学情境不同于所述第一多个不同声学情境。5.根据权利要求1所述的方法,其中所述将所述第一空间处理滤波器应用于所述输入信号产生所述第一经空间处理信号,且其中所述将所述第二空间处理滤波器应用于所述输入信号产生所述第二经空间处理信号。6.根据权利要求5所述的方法,其中所述产生基于第一经空间处理信号的信号作为所述输出信号包含产生所述第一经空间处理信号作为所述输出信号,且其中所述产生基于第二经空间处理信号的信号作为所述输出信号包含产生所述第二经空间处理信号作为所述输出信号。7.根据权利要求1所述的方法,其中所述第一空间处理滤波器是通过第一系数值矩阵而特征化,且所述第二空间处理滤波器是通过第二系数值矩阵而特征化,且其中所述第二矩阵至少大体上等于围绕中心垂直轴线翻转所述第一矩阵的结果。8.根据权利要求1所述的方法,其中所述方法包含确定所述第一空间处理滤波器在紧接于所述第一时间之后的第一延迟时间间隔上继续优于所述第二空间处理滤波器而分离所述语音与噪声分量,且其中所述产生基于第一经空间处理信号的信号作为所述输出信号在所述第一延迟时间间隔之后开始。9.根据权利要求8所述的方法,其中所述方法包含确定所述第二空间处理滤波器在紧接于所述第二时间之后的第二延迟时间间隔上继续优于所述第一空间处理滤波器而分离所述语音与噪声分量,且其中所述产生基于第二经空间处理信号的信号作为所述输出信号在所述第二延迟时间间隔之后发生,且其中所述第二延迟时间间隔长于所述第一延迟时间间隔。10.根据权利要求1所述的方法,其中所述产生基于第二经空间处理信号的信号作为所述输出信号包括在第一合并时间间隔上将所述输出信号从基于所述第一经空间处理信号的所述信号转变为基于所述第二经空间处理信号的信号,且其中所述转变包括在所述第一合并时间间隔期间产生基于所述第一及第二经空间处理信号两者的信号作为所述输出信号。11.根据权利要求1所述的方法,其中所述方法包含:将第三空间处理滤波器应用于所述输入信号;在所述第二时间之后的第三时间处,确定所述第三空间处理滤波器开始优于所述第一空间处理滤波器且优于所述第二空间处理滤波器而分离所述语音与噪声分量;及响应于在第三时间处的所述确定,产生基于第三经空间处理信号的信号作为所述输出信号,其中所述第三经空间处理信号是基于所述输入信号。12.根据权利要求11所述的方法,其中所述产生基于第二经空间处理信号的信号作为所述输出信号包括在第一合并时间间隔上将所述输出信号从基于所述第一经空间处理信号的所述信号转变为基于所述第二经空间处理信号的信号,且其中所述产生基于第三经空间处理信号的信号作为所述输出信号包括在第二合并时间间隔上将所述输出信号从基于所述第二经空间处理信号的所述信号转变为基于所述第三经空间处理信号的信号,其中所述第二合并时间间隔长于所述第一合并时间间隔。13.根据权利要求1所述的方法,其中所述将第一空间处理滤波器应用于所述输入信号产生第一经滤波信号,且其中所述将第二空间处理滤波器应用于所述输入信号产生第二经滤波信号,且其中在第一时间处的所述确定包括检测所述输入信号的通道与所述第一经滤波信号的通道之间的能量差大于所述输入信号的所述通道与所述第二经滤波信号的通道之间的能量差。14.根据权利要求1所述的方法,其中所述将第一空间处理滤波器应用于所述输入信号产生第一经滤波信号,且其中所述将第二空间处理滤波器应用于所述输入信号产生第二经滤波信号,且其中在第一时间处的所述确定包括检测所述第一经滤波信号的两个通道之间的相关的值小于所述第二经滤波信号的两个通道之间的相关的值。15.根据权利要求1所述的方法,其中所述将第一空间处理滤波器应用于所述输入信号产生第一经滤波信号,且其中所述将第二空间处理滤波器应用于所述输入信号产生第二经滤波信号,且其中在第一时间处的所述确定包括检测所述第一经滤波信号的通道之间的能量差大于所述第二经滤波信号的通道之间的能量差。16.根据权利要求1所述的方法,其中所述将第一空间处理滤波器应用于所述输入信号产生第一经滤波信号,且其中所述将第二空间处理滤波器应用于所述输入信号产生第二经滤波信号,且其中在第一时间处的所述确定包括检测所述第一经滤波信号的通道的语音测量的值大于所述第二经滤波信号的通道的所述语音测量的值。17.根据权利要求1所述的方法,其中所述将第一空间处理滤波器应用于所述输入信号产生第一经滤波信号,且其中所述将第二空间处理滤波器应用于所述输入信号产生第二经滤波信号,且其中在第一时间处的所述确定包括计算所述输入信号的两个通道当中的到达时间差。18.根据权利要求1所述的方法,其中所述方法包含应用基于所述输出信号的至少一个通道的噪声参考以降低所述输出信号的另一通道中的噪声。19.一种用于处理包括语音分量及噪声分量的M通道输入信号以产生经空间滤波输出信号的设备,M为大于一的整数,所述设备包含:用于对所述输入信号执行第一空间处理操作的装置;用于对所述输入信号执行第二空间处理操作的装置;用于在第一时间处确定所述用于执行第一空间处理操作的装置开始优于所述用于执行第二空间处理操作的装置而分离所述语音与噪声分量的装置;用于响应于来自所述用于在第一时间处确定的装置的指示而产生基于第一经空间处理信号的信号作为所述输出信号的装置;用于在所述第一时间之后的第二时间处确定所述用于执行第二空间处理操作的装置开始优于所述用于执行第一空间处理操作的装置而分离所述语音与噪声分量的装置;及用于响应于来自所述用于在第二时间处确定的装置的指示而产生基于第二经空间处理信号的信号作为所述输出信号的装置,其中所述第一及第二经空间处理信号是基于所述输入信号。20.根据权利要求19所述的设备,其中(A)所述用于执行第一空间处理操作的装置及(B)所述用于执行第二空间处理操作的装置中的至少一者的多个系数值是基于在多个不同声学情境下所记录的多个多通道训练信号。21.根据权利要求19所述的设备,其中所述用于对所述输入信号执行所述第一空间处理操作的装置经配置以产生所述第一经空间处理信号,且其中所述用于对所述输入信号执行所述第二空间处理操作的装置经配置以产生所述第二经空间处理信号,且其中所述用于产生基于第一经空间处理信号的信号作为所述输出信号的装置经配置以产生所述第一经空间处理信号作为所述输出信号,且其中所述用于产生基于第二经空间处理信号的信号作为所述输出信号的装置经配置以产生所述第二经空间处理信号作为所述输出信号。22.根据权利要求19所述的设备,其中所述设备包含用于确定所述用于执行第一空间处理操作的装置在紧接于所述第一时间之后的第一延迟时间间隔上继续优于所述用于执行第二空间处理操作的装置而分离所述语音与噪声分量的装置,且其中所述用于产生基于第一经空间处理信号的所述信号作为所述输出信号的装置经配置以在所述第一延迟时间间隔之后开始产生所述信号。23.根据权利要求19所述的设备,其中所述用于产生基于第二经空间处理信号的信号作为所述输出信号的装置包括用于在第一合并时间间隔上将所述输出信号从基于所述第一经空间处理信号的所述信号转变为基于所述第二经空间处理信号的信号的装置,且其中所述用于转变的装置经配置以在所述第一合并时间间隔期间产生基于所述第一及第二经空间处理信号两者的信号作为所述输出信号。24.根据权利要求19所述的设备,其中所述用于对所述输入信号执行第一空间处理操作的装置产生第一经滤波信号,且其中所述用于对所述输入信号执行第二空间处理操作的装置产生第二经滤波信号,且其中所述用于在第一时间处确定的装置包括用于检测所述输入信号的通道与所述第一经滤波信号的通道之间的能量差大于所述输入信号的所述通道与所述第二经滤波信号的通道之间的能量差的装置。25.根据权利要求19所述的设备,其中所述用于对所述输入信号执行第一空间处理操作的装置产生第一经滤波信号,且其中所述用于对所述输入信号执行第二空间处理操作的装置产生第二经滤波信号,且其中所述用于在第一时间处确定的装置包括用于检测所述第一经滤波信号的两个通道之间的相关的值小于所述第二经滤波信号的两个通道之间的相关的值的装置。26.根据权利要求19所述的设备,其中所述用于对所述输入信号执行第一空间处理操作的装置产生第一经滤波信号,且其中所述用于对所述输入信号执行第二空间处理操作的装置产生第二经滤波信号,且其中所述用于在第一时间处确定的装置包括用于检测所述第一经滤波信号的通道之间的能量差大于所述第二经滤波信号的通道之间的能量差的装置。27.根据权利要求19所述的设备,其中所述用于对所述输入信号执行第一空间处理操作的装置产生第一经滤波信号,且其中所述用于对所述输入信号执行第二空间处理操作的装置产生第二经滤波信号,且其中所述用于在第一时间处确定的装置包括用于检测所述第一经滤波信号的通道的语音测量的值大于所述第二经滤波信号的通道的所述语音测量的值的装置。28.根据权利要求19所述的设备,其中所述设备包含麦克风阵列,所述麦克风阵列经配置以...

【专利技术属性】
技术研发人员:詹国梁杰里米托曼埃里克维瑟朴雄靖
申请(专利权)人:高通股份有限公司
类型:发明
国别省市:US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1