在语音通信系统中语音增强的方法和装置制造方法及图纸

技术编号:3047505 阅读:202 留言:0更新日期:2012-04-11 18:40
语音通信系统包括一个接收单元(14),它接收语音数据和使用该数据以便输出语音(15)。在语音输出之前,由处理单元(10)基于收听人当前的背景噪声的分析改变由解码单元接收的语音的特性以便增强到收听人的语音的清晰度。分析单元(12)确定使用麦克风(13)的背景噪声的类型和等级。判定单元(11)则确定当前接收和重放的语音对在当前的背景噪声中的平均的收听人是否是易理解的。如果判定单元确定该语音是容易理解的,则不需要处理并且处理单元(10)不改变已经传递到它的语音。然而,如果判定单元(11)确定该语音是无法了解的,则必须处理并且在传递它到输出端之前处理单元(10)改变该语音以便使语音更容易理解。也描述一种操作该装置的方法。在特别优选的实施例中,通过改变表示该语音的线路频谱对来改变语音特性。(*该技术在2018年保护过期,可自由使用*)

【技术实现步骤摘要】

本专利技术涉及在语音通信系统中语音增强的方法和装置,特别涉及用于增强语音以便使它对于在多噪声的环境中的收听人更加易理解的这样的一个方法和装置。语音通信系统例如移动电话机和无线电设备经常用于多噪声的环境中,例如在汽车内。此外,在会话期间这个环境噪声可能变化。这个变化环境噪声可能对于收听人很难懂得由他们的电话机或者无线电设备输出的语音。根据本专利技术的一个方面,提供对于使用该系统的收听人增加由语音通信系统输出的语音的清晰度的一个方法,包括分析该语音通信系统的当前的背景声频噪声环境;使用背景噪声分析的结果确定输出给收听人的语音对在当前的背景噪声中的收听人是否是易理解的;以及在所述确定的基础上改变由语音通信系统输出的语音的特性,使得由语音通信系统输出的改变的语音对在当前的背景噪声中的收听人具有增强的清晰度。根据本专利技术的第二方面,提供一个语音通信系统,包括分析该语音通信系统的当前的背景声频噪声环境的装置;使用背景噪声分析的结果确定由语音通信系统输出的语音对在当前的背景噪声中的收听人是否是易理解的装置;以及根据所述确定装置的输出改变由语音通信系统输出的语音的特性,以便增强对在当前的背景噪声中的收听人的语音的清晰度。因此本专利技术监视正在使用语音通信系统的背景噪声(即,在收听人邻近的外部环境的声频噪声)和可以调整由语音通信系统输出给该收听人的语音的特性,使它在当前的背景声频噪声中更容易理解。因此提供在用于多噪声的环境时例如由移动电话机或者无线电设备的扬声器或者耳机听起来的语音输出的增强的清晰度。此外,因为本专利技术分析当前的背景噪声,它可以考虑背景噪声的变化以及因此增强该语音。在本专利技术中因此背景声频噪声最好连续地分析和在该分析的基础上连续地改变语音。这提供了语音的动态增强,并且在背景噪声可以连续地和显著地变化的环境中例如在汽车中是特别有利的。背景声频环境噪声可以通过各种的技术分析,如在本领域已知的技术。它例如可以使用拾取语音通信系统的用户的语音的通常的麦克风(例如移动电话机或者无线电设备)或者一个单独的麦克风拾取或者取样。一个实例的背景噪声分析系统是一个过程,即检测(使用许多通常的技术例如在给定的时间间隔加上所有的输入噪声值和比较这些噪声与阈值)用户的语音(例如麦克风信号)和在语音周期之间的间隙期间分析声频的背景噪声。然后分析(也许使用线性预测)取样的噪声,以便确定它的频谱内容和它的幅度。由线性预测分析得到的LPC(线性预测系数)值包含足够的频谱信息和可用于相关LPC参数的相对幅度与绝对幅度的一个增益参数。在当前的背景噪声中由语音通信系统输出的语音的清晰度可以使用任何已知的标准技术确定,以便确定该语音对在当前的背景噪声中一个平均的收听人是否是易理解的(即用于评价该语音的收听人的感觉的噪声效果的任何适当的技术)。最好,比较以频谱分析和幅度定标因数(增益)的形式描述该语音和背景噪声,以便确定该语音对在该噪声中的收听人是否是听得见的。在一个优选的实施例中,该语音首先区分为两个或者更多个类别,在一个或者更多个频率的语音类别之一的幅度与在那些频率的噪声幅度比较。在一个这样的比较过程中,语音内容在开始可以区分为非语音,有声的语音或者无声的语音。如果存在非语音(也许在字之间的停顿),则这个可听度是不重要的,因此可以忽略。如果存在有声的语音,则需要确定它的清晰度。这最好分别在峰值或者共振峰的频率具有噪声幅度的有声的语音中通过比较一个或者多个或者最好每个频谱的峰值和/或一个或者多个或者最好每个共振峰(如在本领域已知的,有声的语音包含称为共振峰的在变化频率的一系列谐振的峰值,它传递大量的信息和在该语音的频谱曲线中频谱的峰值经常对应该信息)的幅度进行。如果考虑一个以上的峰值或者共振峰,则每个峰值或者共振峰的幅度应该与在相应的峰值或者共振峰的频率的噪声幅度比较。最好,如果在任何共振峰频率或者频谱的峰值或者在特定数量的共振峰或者频谱的峰值频率的噪声幅度超过相应的共振峰或者频谱的峰值振幅,则确定该语音是无法了解的。在具有背景噪声的语音中频谱峰值和共振峰的相对幅度的这样的比较给出语音清晰度的好的指示,因为它根据清晰度的收听人模型有效地确定语音的清晰度,即它以接近收听人的语音的实际的感觉的模型的方式评价该语音的清晰度。正如熟知的音质理论指出的,给定频率的声音被类似的频率的第二一致的声音掩蔽,而如果第二声音足够大声的,则早先的声音将听不见。因此本申请人认为在语音情况下,具有类似于语音中的共振峰或者频谱峰值的频率的大声的噪音将掩蔽该语音。因此在该语音中一个或者多个或者每个共振峰或者一个或多个或者每个频谱峰值的幅度与在相应的频率或者多频率的噪声幅度的比较将给出那个(或者那些)共振峰或者频谱峰值的可听度的好的指示,因此给出对收听人的语音清晰度的好的指示。如果期望可以使用另外的语音类别与类别。例如,语音可以区分为元音和子音声音(或者另外的话音声音)。最好使用对确定清晰度是有益的或者适当的类别。因此最好正如在上面的例子中,该类别包括包含语音的共振峰(最好仅仅包含共振峰)的一个类别和那个类别与噪声比较。最好该类别是共振峰包含和非共振峰包含类别。一旦已经确定了语音的清晰度,该语音可以根据该确定改变,使它更易理解。最好,如果确定该语音是无法了解的,则改变该语音特性,否则不改变。语音特性的替代可以以各种方式如本领域已知的方式进行。最好增加音量(幅度)和/或改变语音成分的频率,特别是改变该语音中的共振峰和/或频谱峰值。在特别地优选的这样的安排中,将通过调节语音频谱曲线中共振峰和/或频谱峰值的位置改变语音特性。这样的替代对收听人的语音具有更可察觉的效果以及因此对于增加语音的清晰度是特别地有效。例如,一个或者多个峰值或者共振峰可以在频率中向上或者向下偏移,或者一个或者多个峰值或者共振峰的幅度可以增加(相应于带宽减小),或者一个或者多个峰值或者共振峰的带宽可以增加(相应于幅度减小)。因此,例如,共振峰的音量可以增加,使得他们在该背景噪声是听得见的。然而,这可能是不希望的改变语音特性的方式,因为足够引起听觉损耗的语言音量电平(如果支持)可以要求使该语音在一定的情形中是易理解的,显著地在多噪声的电动机汽车内的情形。因此最好调节语音分量的频率例如语音频谱中共振峰或者峰值。这最好是移动它们到噪声电平低的一个频率,使得在该频率该分量例如峰值或者共振峰是听得见的(即具有大于该噪声的幅度)。语音特性的替代最好根据背景噪声分析的结果实现,并且可以取决于噪声的存在或者过去值。使用噪声的当前值,可能进行直接比较和对该语音特性进行替代;使用过去值,进行预测变化是可能的。例如,如果噪声分析指示在特定的频率噪声幅度降低到目前听不见的共振峰是可听得见的电平,该语音特性可以改变以便变化共振峰的频率为那个特定的频率。语音特性的实际的替代可以以许多种方式如本领域已知的方式进行。例如,语言信号可以通过一个自适应滤波,例如知觉的差错加权滤波器(正如在IEEE J.Scl.Ateas Commum.1992年,10.(5)第830-849页,CHEN,J.H.,Cok,E.V.,LIN,Y.,JAYANT,N.,和MIECHER,M.J.的文章“A loW delay CELPcoder for the 本文档来自技高网...

【技术保护点】
一种增加由语音通信系统输出语音对使用该系统的收听人的清晰度的方法,包括:分析该收听人的当前的背景声频噪声环境;使用背景噪声分析的结果确定输出给收听人的语音对在它们的当前的背景噪声中的收听人是否是易理解的;以及在所述确定的基础上改 变由语音通信系统输出的语音的特性,使得改变的语音对在它们的当前的背景噪声环境中的收听人具有增强的清晰度。

【技术特征摘要】
GB 1997-7-2 9714001.61.一种增加由语音通信系统输出语音对使用该系统的收听人的清晰度的方法,包括分析该收听人的当前的背景声频噪声环境;使用背景噪声分析的结果确定输出给收听人的语音对在它们的当前的背景噪声中的收听人是否是易理解的;以及在所述确定的基础上改变由语音通信系统输出的语音的特性,使得改变的语音对在它们的当前的背景噪声环境中的收听人具有增强的清晰度。2.根据权利要求1的方法,其中通过分类语音的内容为至少两个类别,和比较在一个频率的一个类别中的语音幅度与在该频率的噪声幅度确定输出的语音的清晰度。3.根据权利要求1或者2的方法,其中通过分类语音内容为一个类别确定输出语音的清晰度,该类别包含语音中的共振峰,和比较包含在一个频率的语音类别的共振峰的幅度与在那个频率的噪声幅度。4.根据权利要求1至3的任何一个权利要求的方法,其中通过分类语音内容为非语音、有声的语音或者无声的语音和比较在一个频率的有声的的幅度与在那个频率的噪声幅度,确定输出语音的清晰度。5.根据权利要求1至4的任何一个权利要求的方法,其中通过分类语音内容为非语音、有声的语音或者无声的语音和比较具有一个中心频率的有声语音的频谱峰值的幅度与在该频谱峰值的中心频率的噪声幅度,确定输出语音的清晰度。6.根据权利要求1至5的任何一个权利要求的方法,其中通过分类语音内容为非语音、有声的语音或者无声的语音和比较具有一个中心频率的有声语音的共振峰的幅度与在该共振峰的中心频率的噪声幅度,确定输出语音的清晰度。7.根据权利要求1至6的任何一个权利要求的方法,其中如果大体上与在该语音中频谱峰值一样的频率的背景噪声幅度超过频谱峰值的幅度,则确定该语音是无法了解的。8.根据权利要求1至7的任何一个权利要求的方法,其中如果大体上与在该语音中共振峰一样频率的背景噪声幅度超过共振峰的幅度,则确定该语音是无法了解的。9.根据权利要求1至8的任何一个权利要求的方法,其中通过改变代表该语音的线路频谱对(LSP)数据来改变该语音特性。10.根据权利要求9的方法,其中通过移动在语音频谱中的线路频谱对改变该语音特性。11.根据权利要求1至10的任何一个权利要求的方法,其中通过改变在语音频谱中的频率分量来改变该语音特性。12.根据权利要求11的方法,其中改变在语音频谱中的共振峰的频率。13.根据权利要求12的方法,其中改变该语音中的共振峰频率以便移动该共振峰到背景噪声幅度较低的频率处。14.根据权利要求11,12或者13的方法,其中该语音频谱包括具有一个中心频率的频谱峰值,和改变在该语音频谱中的频谱峰值的中心频率。15.一个语音通信系统,包括用于分析该语音通信系统的当前背景声频噪声环境的装置;使用背景噪声分析的结果确定由语音通信系统输出给收听该语音通信系统的收听人的语音对在当前的背景噪声中的收听人是否是易理解的装置;以及根据所述确定装置的输出改变由语音通信系统输出给该收听人的语音的特性,以便增强给在当前的背景噪声中的收听人的语音的清晰度。16.根据权利要求15的系统,其中用于确定输出的语音是否是易理解的装置包括通过分类语音的内容为不同的类别的装置,和用于比较在一个频率的一个类别中的语音幅度与在该频率的噪声幅度的装置。17.根据权利要求16的系统,其中通过分类语音内容为不同的类别的装置分类语音内容为一个类别,该类别包含语音中的共振峰,和比较装置比较包含在一个频率的语音类别的共振峰的幅度与在那个频率的噪声幅度。18.根据权利要求15至17任何一个权利要求的系统,其中...

【专利技术属性】
技术研发人员:罗伯特J钱斯伊恩V麦克洛克林
申请(专利权)人:西莫克国际有限公司
类型:发明
国别省市:GB[英国]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1