具有动态阈值的频带压缩制造技术

技术编号:18599141 阅读:25 留言:0更新日期:2018-08-04 20:58
具有动态阈值的频带压缩。公开了用于动态调整压缩器的阈值的系统、装置、方法和计算机可读存储介质的示例。处理具有多个频带分量的输入音频信号。可以确定时变阈值。压缩器对每个频带分量执行具有对应时变阈值的压缩运算,以产生增益。每个增益应用于受延迟的对应频带分量,以产生受处理的带分量,其相加以产生输出信号。在一些实现方式中,例如使用失真能听度模型来确定输出信号的感知谱的时变估计以及由感知谱估计引起的失真谱的时变估计。可以预测在存在感知谱估计的情况下的失真谱估计的能听度测量,并且将其用于调整时变阈值。

Frequency band compression with dynamic threshold

A frequency band compression with a dynamic threshold. A system, device, method, and computer readable storage medium for dynamically adjusting the threshold of a compressor are disclosed. An input audio signal having multiple frequency band components is processed. The time-varying threshold can be determined. The compressor performs compression operations with corresponding time-varying thresholds for each frequency band component to generate gain. Each gain is applied to the delayed corresponding band component to generate the processed band component, which in turn generates an output signal. In some implementations, such as using the distortion energy audio model to determine the time-varying estimation of the perceptual spectrum of the output signal and the time-varying estimation of the distortion spectrum caused by the perceptual spectrum estimation. The audibility measurements of the false spectrum estimation in the presence of the perceptual spectrum estimation can be predicted and used to adjust the time-varying threshold.

【技术实现步骤摘要】
具有动态阈值的频带压缩本申请是申请日为2014年4月14日的、申请号为201480024349.7(国际申请号为PCT/US2014/034024)以及专利技术名称为“具有动态阈值的频带压缩”的专利技术专利申请的分案申请。相关申请的交叉引用该专利申请要求2013年4月29日AlanJ.Seefeldt提交的题为“DistortionReducingMulti-bandCompressorwithDynamicThresholdsbasedonaDistortionAudibilityModel”的共同未决和共同受让美国临时专利申请No.61/817,175(代理人案号No.D13064USP1)的优先权,出于所有目的通过引用而完整合并到此。
该专利申请总体上涉及音频呈现,具体地说,涉及在呈现期间的失真减小。
技术介绍
一些音频回放设备(如智能电话和平板设备)包括具有有限输出能力的放大器和扬声器。在这些设备中,音频回放可能在感知上是失真的,并且一般随着回放级别在呈现期间增加而强烈地失真。失真的特性一般对于回放设备是频率依赖性的。例如,当在特定频率处的输出信号达到或超过特定级别时,电视柜可能在受激发的特定频率处展现谐振响应,产生恼人的震颤。多带压缩可以在回放之前应用于音频信号,以减少失真并且尝试最大化回放设备上的回放级别。为信号的每个频带指定失真阈值。压缩器将独立增益应用于每个带,以确保每个带中的信号级别不超过对应失真阈值。
技术实现思路
所公开的是实现用于响应于输入音频信号而动态调整压缩器的阈值的技术的系统、装置、方法和计算机可读存储介质的一些示例。在一些实现方式中,处理具有多个频带分量的输入信号。可以根据所述频带分量来确定时变阈值。每个时变阈值通常与相应的频带分量对应。压缩器对每个频带分量执行具有对应时变阈值的压缩运算,以产生多个增益,其中,每个增益与各个频带分量对应。每个增益应用于受延迟的对应频带分量,以产生多个受处理的频带分量,其被相加以产生输出信号。在一些实现方式中,确定所述输出信号的感知谱的时变估计。此外,例如,根据失真模型的响应来确定感知谱估计所引起的失真谱的时变估计。预测在存在感知谱估计的情况下的所述失真谱估计的能听度测量。可以根据所预测的能听度测量来调整所述时变阈值。在一些实现方式中,预测所述能听度测量包括:根据感知谱估计来计算掩蔽阈值;确定失真谱估计与掩蔽阈值之间的差值;以及把所确定的差值的正数值相加,以产生预测的能听度测量。可以基于感知谱估计参照调性谱来计算所述掩蔽阈值。所述调性谱包括区分类似噪声的频带分量与类似音调的频带分量的调性值。所确定的差值的相加的正数值可以加权以使得一个或更多个上频带分量和一个或更多个下频带分量具有比上频带分量与下频带分量之间的频带分量更低的权重。在一些实现方式中,至少部分地根据固定标称阈值来确定时变阈值。因此,可以根据对应频带分量并且根据相应的固定阈值来确定每个时变阈值。在这些实现方式中,可以归一化失真的所预测的能听度测量。可以参照一个或更多个固定阈值并且根据应用于偏移值的归一化的能听度测量来提升或降低所述时变阈值。在一些实现方式中,用于响应于输入音频信号而动态调整压缩阈值的装置包括:一个或更多个控制器,可操作为使得一些或所有上述操作得以执行。此外,该装置可以包括:滤波模块,能够对所述输入信号进行滤波,以产生所述频带分量;以及多带滤波器,包括多个带通滤波器,其中,每个带通滤波器与相应的频带分量相对应。所述装置可以还包括:一个或更多个放大器,被耦合以接收并且放大所述输出信号,以产生放大的输出信号;以及一个或更多个扬声器,被耦合以接收并且播放放大的输出信号。在一些实现方式中,非瞬时计算机可读存储介质存储可由计算设备运行以使得一些或所有上述操作得以执行的指令。计算设备的非限定性示例包括服务器和台式计算机以及便携式手持设备(如智能电话、平板设备、膝上型设备、便携式音乐播放器等)。在一些实例中,一个或多个服务器可以被配置为使用所公开的技术中的一个或更多个来处理输入音频信号,并且作为基于云的服务的一部分而在互联网上把被处理的输出信号组流传送到用户的设备。附图说明所包括的附图目的是说明性的,并且仅用于提供用于所公开的本专利技术的系统、装置、方法和计算机可读存储介质的可能结构和操作的示例。这些附图绝非限制本领域技术人员在不脱离所公开的实现方式的精神和范围的情况下可以进行的形式和细节方面的任何改变。图1示出根据一些实现方式的包括用于响应于输入音频信号而动态调整压缩器的阈值的失真能听度模型(DAM)的压缩器100的示例。图2示出根据一些实现方式执行的用于响应于输入音频信号而动态调整压缩器的阈值的方法200的示例。图3示出根据一些实现方式执行的用于响应于输入音频信号而动态调整压缩器的阈值的方法300的另一示例。图4示出根据一些实现方式执行的用于在存在感知谱估计的情况下预测失真谱估计的能听度测量的方法400的示例。图5A示出根据一些实现方式的显示器设备上所显示的输入音频信号的频带分量的能量级别的图形表示500A的示例。图5B示出根据一些实现方式的显示器设备上所显示的由听者感知的所估计的输出信号谱的对应能量级别的图形表示500B的示例。图6示出根据一些实现方式的用于呈现音频信号的包括压缩器100的回放系统600的示例。具体实施方式所公开的是实现用于响应于输入音频信号而动态调整压缩器的阈值的技术的系统、装置、方法和计算机可读存储介质的一些示例。一些所公开的技术包括失真能听度模型,以确定由多带压缩器可以应用的动态阈值。失真能听度模型被配置为在存在输入信号的情况下以依赖于动态信号的方式预测由该输入信号所引起的失真的感知能听度。这种所预测的能听度可以用于动态修改压缩器的阈值。包括所公开的技术的一些设备和系统因此能够在最小感知失真的情况下增加回放级别。在一些实现方式中,失真能听度模型被配置为预测听者所收听到的信号谱的时变估计以及该信号所引起的失真谱的时变估计。失真能听度模型然后在存在信号谱估计的情况下预测该失真谱估计的能听度。以此方式,可以相应地动态调整压缩器的一个或更多个时变阈值。用于动态调整压缩阈值的所公开的技术可以结合其它压缩处理而得以使用,并且可以实现于各种设备和系统(如智能电话、平板设备、膝上型计算机、便携式音乐播放器、电视、监视器以及基于服务器的系统)中。实现所公开的技术的一些设备和系统在传统多带压缩器上改进,其显著地改动音色——听者感知的属性,其中,相等响度和音程的两种声音可以感知为不相似。当特定频率达到失真阈值而其它频率未达到时,一些传统压缩器因改动这些频率之间的相对平衡而引入缺点。所得声音显现为畸变,导致不自然的收听体验。此外,如果增益过度地强势,则可能不必要地减少回放级别。如果每个带中的阈值被设置以消除用于在该带处居中的窄带信号的感知失真,则源自穿过压缩器的宽带信号的衰减一般多于在感知上消除任何所引起的失真所要求的衰减。这归因于这种事实:宽带信号可以大大掩蔽宽带信号引起的一些失真,而窄带信号在掩蔽其所引起的失真时可能是远更无效的。图1示出根据一些实现方式的包括用于响应于输入音频信号而动态调整压缩器的阈值的失真能听度模型(DAM)的压缩器100的示例。在图1中,以滤波器组10本文档来自技高网...

【技术保护点】
1.一种用于响应于输入音频信号来动态调整压缩器的阈值的方法,所述方法包括:接收具有多个频带分量的输入音频信号;根据所述多个频带分量来确定多个阈值,每个阈值与相应的频带分量相对应;通过压缩器对每个频带分量执行具有对应的阈值的压缩运算以产生多个增益,每个增益与相应的频带分量相对应;将每个增益应用于对应的频带分量,以产生多个被处理的频带分量;确定所述被处理的频带分量的感知谱的时变估计;确定由感知谱估计所引起的失真谱的时变估计;在存在感知谱估计的情况下预测失真谱估计的能听度测量;以及根据所预测的能听度测量来调整所述阈值中的一个或更多个。

【技术特征摘要】
2013.04.29 US 61/817,1751.一种用于响应于输入音频信号来动态调整压缩器的阈值的方法,所述方法包括:接收具有多个频带分量的输入音频信号;根据所述多个频带分量来确定多个阈值,每个阈值与相应的频带分量相对应;通过压缩器对每个频带分量执行具有对应的阈值的压缩运算以产生多个增益,每个增益与相应的频带分量相对应;将每个增益应用于对应的频带分量,以产生多个被处理的频带分量;确定所述被处理的频带分量的感知谱的时变估计;确定由感知谱估计所引起的失真谱的时变估计;在存在感知谱估计的情况下预测失真谱估计的能听度测量;以及根据所预测的能听度测量来调整所述阈值中的一个或更多个。2.如权利要求1所述的方法,其中,根据失真模型对所述感知谱估计的响应来确定所述失真谱估计。3.如权利要求2所述的方法,其中,所述失真谱估计包括第一频带分量的第一估计失真,所述第一估计失真被确定为被引起进入所述第一频带分量中并且进入比所述第一频带分量更高频率的频带分量的至少一部分中的失真的最大值。4.如权利要求1至3中任一项所述的方法,其中,确定感知谱估计包括:将平滑运算应用于被处理的频带分量。5.如权利要求1至4中任一项所述的方法,其中,在存在所述感知谱估计的情况下预测所述失真谱估计的能听度测量包括:根据感知谱估计来计算掩蔽阈值;确定所述失真谱估计与所述掩蔽阈值之间的差值;以及把所确定的差值的正数值相加,以产生预测的能听度测量。6.如权利要求5所述的方法,其中,所述掩蔽阈值是基于感知谱估计参照调性谱来计算的,所述调性谱包括区分类似噪声的频带分量与类似音调的频带分量的调性值。7.如权利要求5和6中任一项所述的方法,其中,所确定的差值的相加的正数值被加权以使得一个或更多个上频带分量和一个或更多个下频带分量具有比上频带分量与下频带分量之间的频带分量更低的权重。8.如权利要求1至7中任一项所述的方法,其中,所述阈值是时...

【专利技术属性】
技术研发人员:A·J·西费尔德特
申请(专利权)人:杜比实验室特许公司
类型:发明
国别省市:美国,US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1