用于产生音频信号的系统和方法技术方案

技术编号:8983411 阅读:126 留言:0更新日期:2013-08-01 02:14
本发明专利技术提供了一种产生代表用户的语音的信号的方法,所述方法包括:使用与用户接触的传感器来获得代表用户的语音的第一音频信号;使用空气传导传感器来获得第二音频信号,所述第二音频信号代表用户的语音,并且包括来自用户周围的环境的噪声;检测所述第一音频信号中的语音周期;将语音增强算法应用于第二音频信号以降低第二音频信号中的噪声,所述语音增强算法使用在第一音频信号中所检测到的语音周期;使用降噪后的第二音频信号来均衡第一音频信号以产生代表用户的语音的输出音频信号。

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及一种,并且尤其涉及一种从使用诸如骨-传导或接触麦克风之类的接触传感器获得的音频信号中产生代表用户语音的音频信号的系统和方法。
技术介绍
移动设备频繁地用在听觉上恶劣的环境(即存在许多背景噪声的环境)中。除了移动设备的用户在双向通信期间能够听到远端方(far-end party)的问题之外,困难的是获得代表用户语音的“干净”(即没有噪声或噪声基本上降低)的音频信号。在捕获的信噪比(SNR)较小的环境中,在可以利用“乐音”假象(artifact)使近端语音信号(即由移动设备中的麦克风获得的信号)失真之前,传统的语音处理算法仅仅可以执行有限量的噪声抑制。公知的是,与使用诸如麦克风(即与通过空气产生声音的对象相分离的麦克风)之类的空气-传导(AC)传感器获得的音频信号相比,使用诸如骨-传导(BC)或接触麦克风(即与产生声音的对象物理接触的麦克风)之类的接触传感器获得的音频信号相对不受背景噪声的影响,因为由BC麦克风所测量的声音振动是通过用户的身体传播,而不是如用普通的AC麦克风那样通过空气传播,所述普通的AC麦克风除了捕获期望的音频信号之外也拾取背景噪声。此外,使用BC麦克风获得的音频信号的强度通常比使用AC麦克风获得的音频信号的强度高得多。因此,已经考虑将BC麦克风用于可能在嘈杂的环境中使用的设备。图1示出了在相同嘈杂的环境 中使用BC麦克风获得的音频信号相对于使用AC麦克风获得的音频信号的高SNR特性。然而,使用BC麦克风获得语音的问题在于其质量和清晰度通常比使用AC麦克风获得的语音的质量和清晰度低得多。清晰度的这种降低一般源自骨头和组织的滤波特性,其可以严重地衰减音频信号的高频成分。使用BC麦克风获得的语音的质量和清晰度取决于其在用户上的具体位置。麦克风设置得离在喉咙和颈部区域周围的喉头和声带越近,所得到的BC音频信号的质量和强度越好。此外,由于BC麦克风与产生声音的对象物理接触,所以得到的信号与AC音频信号相比具有更高的SNR,该AC音频信号也拾取背景噪声。然而,虽然使用在颈部区域中或在颈部区域周围设置的BC麦克风获得的语音将具有高得多的强度,但是信号的清晰度仍将非常低,其归因于通过在颈部区域中或在颈部区域周围的骨头和软组织对声门信号进行的滤波以及声道传送功能的缺失。使用BC麦克风获得的音频信号的特性也取决于BC麦克风的壳体(即它是否与环境中的背景噪声屏蔽开了)以及用于建立与用户的身体的接触而施加至BC麦克风的压力。虽然存在旨在改进从BC麦克风获得的语音的清晰度的滤波或语音增强方法,但是这些方法需要存在干净的语音参考信号,从而构建均衡滤波器以应用于来自BC麦克风的音频信号,或者需要使用来自AC麦克风的干净的音频信号来训练特定于用户的模型。因此,这些方法不适合于真实世界的应用,在所述真实世界的应用中,不总能得到干净的语音参考信号(例如,在嘈杂的环境中)或数个不同用户中的某些用户会使用特定的设备。因此,需要一种用于从使用BC麦克风获得的音频信号中产生代表用户语音的音频信号的替代的系统和方法,其可以用在嘈杂的环境中,并且不需要用户在使用前训练算法。
技术实现思路
根据本专利技术的第一方案,提供了一种产生代表用户的语音的信号的方法,所述方法包括:使用与所述用户接触的传感器获得代表用户的语音的第一音频信号;使用空气传导传感器获得第二音频信号,所述第二音频信号代表所述用户的语音并包括来自所述用户周围的环境的噪声;检测所述第一音频信号中的语音周期;将语音增强算法应用于所述第二音频信号以降低所述第二音频信号中的噪声,所述语音增强算法使用所述检测到的所述第一音频信号中的语音周期;使用降噪后的所述第二音频信号来均衡所述第一音频信号以产生代表所述用户的所述语音的输出音频信号。该方法具有以下的优点:虽然降噪后的AC音频信号可能仍包含噪声和/或假象,但是它可以用来改进BC音频信号(其通常不包含假象)的频率特性,从而使其听起来更清晰。优选地,检测第一音频信号中的语音周期的步骤包括检测第一音频信号中的音频信号的幅值在阈值以上的部分。优选地,应用语音增强算法的步骤包括对所述第二音频信号应用频谱处理。在优选的实施例中,应用语音增强算法以降低所述第二音频信号中的噪声的步骤包括使用所述检测到的第一音频信号中的语音周期来估计在第二音频信号的谱域中的本底噪声。在优选的实施例中,均衡 所述第一音频信号的步骤包括对所述第一音频信号和降噪后的所述第二音频信号两者执行线性预测分析以构建均衡滤波器。尤其是,执行线性预测分析的步骤优选地包括:(i)估计用于所述第一音频信号和降噪后的所述第二音频信号两者的线性预测系数;(ii)使用用于所述第一音频信号的所述线性预测系数来产生用于所述第一音频信号的激励信号;(iii)使用用于降噪后的所述第二音频信号的所述线性预测系数来构建频域包络;以及(iv)使用频域包络来均衡用于所述第一音频信号的激励信号。替代地,均衡所述第一音频信号的步骤包括:(i)使用长程频谱法来构建均衡滤波器,或(ii )使用第一音频信号作为自适应滤波器的输入,所述自适应滤波器最小化所述滤波器输出与降噪后的所述第二音频信号之间的均方差。在一些实施例中,在均衡步骤之前,所述方法进一步包括将语音增强算法应用于所述第一音频信号以降低在所述第一音频信号中的噪声的步骤,所述语音增强算法利用在第一音频信号中检测到的语音周期,并且其中,所述均衡步骤包括使用降噪后的所述第二音频信号来均衡所述降噪后的第一音频信号,以产生代表所述用户的所述语音的所述输出音频信号。在具体实施例中,所述方法进一步包括以下步骤:使用第二空气传导传感器获得第三音频信号,所述第三音频信号代表所述用户的语音并包括来自所述用户周围的所述环境的噪声;以及使用波束成形技术来将所述第二音频信号和所述第三音频信号组合并产生组合音频信号;并且其中,应用语音增强算法的步骤包括将所述语音增强算法应用于所述组合音频信号以降低在所述组合音频信号中的所述噪声,所述语音增强算法使用在第一音频信号中检测到的语音周期。在具体实施例中,所述方法进一步包括以下的步骤:使用与所述用户接触的第二传感器获得代表用户的语音的第四音频信号;以及使用波束成形技术以将所述第一音频信号和所述第四音频信号组合并产生第二组合音频信号;并且其中,检测语音周期的步骤包括检测所述第二组合音频信号中的语音周期。根据本专利技术的第二方案,提供了一种用于产生代表用户的语音的音频信号的设备,所述设备包括:处理电路,其配置为从与所述用户接触的传感器接收代表所述用户的所述语音的第一音频信号;从空气传导传感器中接收第二音频信号,所述第二音频信号代表所述用户的所述语音并包括来自在所述用户周围的所述环境的噪声;检测所述第一音频信号中的语音周期;将语音增强算法应用至所述第二音频信号以降低第二音频信号中的所述噪声,所述语音增强算法使用在所述第一音频信号中检测到的语音周期;并且使用降噪后的所述第二音频信号均衡所述第一音频信号以产生代表所述用户的所述语音的输出音频信号。在优选的实施例中,所述处理电路配置为通过以下方式来均衡所述第一音频信号:对所述第一音频信号和降噪后的所述第二音频信号两者执行线性预测分析,以构建均衡滤波器。在优选的实施例中,所述处理电路配置为通过以下本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员:P·克基基安W·A·M·A·M·范登敦根
申请(专利权)人:皇家飞利浦电子股份有限公司
类型:
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1