本发明专利技术涉及包括通过分数延迟过滤来用于去噪语音信号的装置的音频设备。本发明专利技术的设备包括两个话筒、采样装置、以及去噪装置。该去噪装置是非频率噪声减少装置,包括具有自适应过滤器的组合器,该自适应过滤器执行迭代搜索设法以另一个话筒传感器给出的噪声参考为基础消除所述话筒中的一个所获取的噪声。该自适应过滤器是分数延迟过滤器,其模制短于采样周期的延迟。该设备还具有语音活动检测器装置,该装置传递代表来自该设备的使用者的语音存在或不存在的信号。该自适应过滤器接收这个信号作为输入从而使该过滤器能选择性地动作:i)或是在语音信号不存在时执行对过滤器参数的自适应搜索;ii)或是在语音信号存在时“冻结”过滤器的这些参数。
【技术实现步骤摘要】
本专利技术涉及处理嘈杂环境中的语音。本专利技术特别涉及处理由在嘈杂环境中使用的“免提”类型的电话设备所获取的语音信号。
技术介绍
这些应用具有一个或多个敏感话筒,这些话筒不仅获取使用者的话音还获取周围的噪声,这些噪声在特定环境下构成干扰元素,甚至可使得使用者的语音难以辨别。如果期望实现话音识别技术,也会有同样的情况,因为对于被高级别噪声所掩埋的话语(word)非 常难以执行形状识别。与周围噪声相关联的这个困难特别地限制了机动车辆中的“免提设备”,不论该设备是否包括结合于车辆内的设备,或形式为结合了用于处理电话通信的信号的所有组件与功能的可移动单元的配件。话筒(被放置在仪表板上或位于车厢顶壁的顶部转角处)和说话者(其位置由驾驶位置所决定)之间的较大距离意味着相对高级别的噪声被获取,藉此使得难以提取出掩埋在噪声中的有用信号。进一步,车辆环境的非常嘈杂的周围环境呈现出不稳定的频谱特性,即,以不可预测的方式应变于驾驶条件经过崎岖的道路或鹅卵石、工作中的车辆无线电,坐寸ο当该设备是音频头戴式耳机(组合话筒和耳机类型,除了用于听取来自该头戴式耳机所连接至的器具的音频源(如,音乐)之外,还被用于诸如“免提”电话功能之类的通信功能)时,会出现同样的困难。在这样的环境下,重要的是确保由话筒所获取的信号(S卩,来自近旁讲话者(头戴式耳机的佩戴者)的语音信号)的足够的可分辨性。不幸的是,头戴式耳机可被用在噪杂的环境中(地铁、繁忙的街道、列车等),从而话筒不仅获取了头戴式耳机的佩戴者的语音,还获取了周围的干扰噪声。头戴式耳机确实保护佩戴者免于这些噪声的干扰,特别如果该头戴式耳机是具有将耳朵与外界隔离的封闭式耳机的类型的话,且如果该头戴式耳机被设置有“主动噪声控制”的话更是如此。反之,远处讲话者(如,位于通信频道另一端的讲话者)将忍受由话筒所获取的干扰噪声,且这些噪声变得重叠在来自近旁讲话者(头戴式耳机的佩戴者)的语音信号上并干扰该语音信号。特定地,对于理解话音至为重要的特定语音峰段经常被淹没在日常环境中通常会遇到的噪声分量中。本专利技术特别涉及去噪技术,该技术用多个话筒实现,通常是两个话筒,从而将这两个话筒同时获取的信号以合适的方式组合,用于将有用的语音分量从干扰噪声分量中隔离出来。常规技术是放置并定向其中一个话筒,从而该话筒主要获取讲话者的话音,同时另一个话筒被设置为获取噪声分量,该噪声分量大于由主话筒所获取的噪声分量。通过使用相对简单的软件手段来分析两个信号之间的空间一致性,比较所获取的信号,然后能使话音从周围噪声中被提取出来。US 2008/0280653A1描述了一个这样的设置,其中话筒中的一个(主要获取话音的话筒)是由车辆的驾驶者所佩戴的无线耳机的话筒,而另一个话筒(主要获取噪声的话筒)是电话用具的话筒,被较远地放置在车厢内,例如,附着至仪表板,无论如何,这个技术表现出如下缺点,需要彼此间隔放置的两个话筒,且技术的有效性随着这两个话筒之间的距离的增加而增加。作为结果,这个技术不适用于其中两个话筒靠近的设备,如,两个话筒被结合在机动车辆的车载无线电前面、或两个话筒放置在音频头戴式耳机的耳机的其中一个的外壳上。另一个技术,被称为“波束形成”,是使用软件手段来创建方向性,该方向性用于改进话筒阵列或“天线”的信噪比。us 2007/0165879A1描述了一个这样的技术,应用于背对背放置的一对没有方向性的话筒。对于它们所获取的信号的自适应过滤能导出输出信号,此输出信号中语音分量被增强。 无论如何,发现这样的方法仅在至少具有八个话筒的阵列的条件下提供良好结果,而当仅使用两个话筒时性能非常有限。专利技术目的和内容在这样的背景下,本专利技术的一般问题在于有效地减少噪声从而将表示近旁讲话者(车辆驾驶者或头戴式耳机的佩戴者)所发出的语音的话音信号传送给远处讲话者,这通过如下来达成从所述信号中移除存在于近旁讲话者的环境中的外部噪声。在这样的情况下,本专利技术的问题也还在于能够使用一组话筒,其中话筒的数量较小(有利地仅两个)且这些话筒还相对地靠近在一起(一般间隔仅数厘米)。这个问题的另一个重要方面是需要回放自然且易于理解的语音信号,S卩,没有失真,且其中没有经降噪处理移除有用的频谱。为此目的,本专利技术提出了在上述US 2008/0280653A1中所公开的一般类型的语音设备,即,包括一组两个话筒传感器,适用于获取该设备的使用者的语音并用于传递各自的噪声语音信号;采样装置,用于采样由该话筒传感器所传递的语音信号;以及去噪装置,用于对语音信号去噪,该去噪装置接收由所述两个话筒传感器所传递的语音信号的样本作为输入并传递表示该设备的使用者所发出的语音的经去噪的语音信号作为输出。该去噪装置是非频率噪声减少装置,包括自适应过滤器组合器,用于将由所述两个话筒传感器所传递的信号组合、以另一个话筒传感器所传递的信号所给出的噪声参考为基础通过迭代搜索操作设法消除由话筒传感器中的一个所获取的噪声。根据本专利技术,该自适应过滤器是分数延迟过滤器,适用于模制比采样装置的采样周期短的延迟。该设置还包括话音活动检测器装置,适用于传递表示来自该设备的使用者的语音的存在或不存在的信号,且该自适应过滤器还接收该语音存在或不存在信号作为输入来选择性地动作i)或是在语音信号不存在时执行对过滤器参数的自适应搜索;ii)或是在语音信号存在时“冻结”过滤器的这些参数。自适应过滤器特别适用于估算最优过滤器H,从而H = G F其中1'( ) = <5 01'( )且6(10=8;[11。(1^+ τ /Te),应表示用于为包括分数延迟的脉冲响应而在两个话筒传感器之间转移噪声的所估算的最优过滤器H;0表示在两个话筒传感器之间的所估算的分数延迟过滤器G ;#表示所估算的环境的声学响应; 表示卷积;X (η)是输入至过滤器H的信号的一系列样本;X’ (η)是由延迟τ偏置的序列χ (η);Te是输入至过滤器H的信号的采样周期;τ是所述分数延迟,等于Te的约数;且 sine表示基本正弦函数。优选地,自适应过滤器是具有最小均方(LMS)类型的线性预测算法的过滤器。在一个实施例中,该设备包括指向该设备的使用者且适用于获取该使用者的图像的视频摄像头;且话音活动检测器装置包括视频分析装置,适用于分析由该摄像头所产生的信号并作为响应传递表示使用者语音的存在或不存在的所述信号。在另一个实施例中,该设备包括生理学传感器,适用于与该设备的使用者的头部相接触从而该生理学传感器被耦合至头部,从而获取由内骨导传输的非声学发音振动;且话音活动检测器装置包括适用于分析由该生理学传感器所传递的信号并作为响应传递表示所述使用者语音的存在或不存在的所述信号,这特别是通过评估由该生理学传感器所传递的信号的能量并将该能量与阈值相比较来达成。特定地,该设备可以是组合的话筒和耳机类型的音频头戴式听筒,该头戴式耳机包括耳机,每一个耳机包括用于重现音频信号的声音的换能器,且耳机被容纳于设置在围绕耳朵的垫片中的外壳内;所述两个话筒传感器设置在所述耳机中的一个的外壳上;且所述生理学传感器结合在所述耳机中的一个的垫片中,且生理学传感器位于其中适于与头戴式耳机的佩戴者的脸颊或鬓角相接触的区域中。这两个话筒传感器优选地对齐作为在指向该设置的使用者的口本文档来自技高网...
【技术保护点】
音频设备,包括:·一组两个话筒传感器,适用于获取所述设备的使用者的语音并用于传递各自的噪声语音信号;·采样装置,用于采样由所述话筒传感器所传递的语音信号;·用于去噪语音信号的去噪装置,所述去噪装置接收由所述两个话筒传感器所传递的语音信号的样本作为输入,并传递表示所述设备的使用者所发出的语音的经去噪的语音信号作为输出;其中:·所述去噪装置是非频率噪声减少装置,包括自适应过滤器组合器,用于将由所述两个话筒传感器所传递的信号组合、以另一个话筒传感器所传递的信号所给出的噪声参考为基础通过迭代搜索操作设法消除由所述话筒传感器中的一个所获取的噪声;·所述自适应过滤器是分数延迟过滤器,适用于模制比所述采样装置的采样周期短的延迟;·所述设备还包括语音活动检测器装置,所述装置适用于传递表示来自所述设备的使用者的语音存在或不存在的信号;且·所述自适应过滤器还将所述语音存在或不存在信号作为输入从而选择性地动作:i)或是在语音信号不存在时执行对所述过滤器参数的自适应搜索;ii)或是在语音信号存在时“冻结”所述过滤器的这些参数。
【技术特征摘要】
...
【专利技术属性】
技术研发人员:G·怀特,M·赫夫,
申请(专利权)人:鹦鹉股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。