A frequency band compression with a dynamic threshold. A system, device, method, and computer readable storage medium for dynamically adjusting the threshold of a compressor are disclosed. An input audio signal having multiple frequency band components is processed. The time-varying threshold can be determined. The compressor performs compression operations with corresponding time-varying thresholds for each frequency band component to generate gain. Each gain is applied to the delayed corresponding band component to generate the processed band component, which in turn generates an output signal. In some implementations, such as using the distortion energy audio model to determine the time-varying estimation of the perceptual spectrum of the output signal and the time-varying estimation of the distortion spectrum caused by the perceptual spectrum estimation. The audibility measurements of the false spectrum estimation in the presence of the perceptual spectrum estimation can be predicted and used to adjust the time-varying threshold.
【技术实现步骤摘要】
具有动态阈值的频带压缩本申请是申请日为2014年4月14日的、申请号为201480024349.7(国际申请号为PCT/US2014/034024)以及专利技术名称为“具有动态阈值的频带压缩”的专利技术专利申请的分案申请。相关申请的交叉引用该专利申请要求2013年4月29日AlanJ.Seefeldt提交的题为“DistortionReducingMulti-bandCompressorwithDynamicThresholdsbasedonaDistortionAudibilityModel”的共同未决和共同受让美国临时专利申请No.61/817,175(代理人案号No.D13064USP1)的优先权,出于所有目的通过引用而完整合并到此。
该专利申请总体上涉及音频呈现,具体地说,涉及在呈现期间的失真减小。
技术介绍
一些音频回放设备(如智能电话和平板设备)包括具有有限输出能力的放大器和扬声器。在这些设备中,音频回放可能在感知上是失真的,并且一般随着回放级别在呈现期间增加而强烈地失真。失真的特性一般对于回放设备是频率依赖性的。例如,当在特定频率处的输出信号达到或超过特定级别时,电视柜可能在受激发的特定频率处展现谐振响应,产生恼人的震颤。多带压缩可以在回放之前应用于音频信号,以减少失真并且尝试最大化回放设备上的回放级别。为信号的每个频带指定失真阈值。压缩器将独立增益应用于每个带,以确保每个带中的信号级别不超过对应失真阈值。
技术实现思路
所公开的是实现用于响应于输入音频信号而动态调整压缩器的阈值的技术的系统、装置、方法和计算机可读存储介质的一些示例。在一些实现方 ...
【技术保护点】
1.一种用于响应于输入音频信号来动态调整压缩器的阈值的方法,所述方法包括:接收具有多个频带分量的输入音频信号;根据所述多个频带分量来确定多个阈值,每个阈值与相应的频带分量相对应;通过压缩器对每个频带分量执行具有对应的阈值的压缩运算以产生多个增益,每个增益与相应的频带分量相对应;将每个增益应用于对应的频带分量,以产生多个被处理的频带分量;确定所述被处理的频带分量的感知谱的时变估计;确定由感知谱估计所引起的失真谱的时变估计;在存在感知谱估计的情况下预测失真谱估计的能听度测量;以及根据所预测的能听度测量来调整所述阈值中的一个或更多个。
【技术特征摘要】
2013.04.29 US 61/817,1751.一种用于响应于输入音频信号来动态调整压缩器的阈值的方法,所述方法包括:接收具有多个频带分量的输入音频信号;根据所述多个频带分量来确定多个阈值,每个阈值与相应的频带分量相对应;通过压缩器对每个频带分量执行具有对应的阈值的压缩运算以产生多个增益,每个增益与相应的频带分量相对应;将每个增益应用于对应的频带分量,以产生多个被处理的频带分量;确定所述被处理的频带分量的感知谱的时变估计;确定由感知谱估计所引起的失真谱的时变估计;在存在感知谱估计的情况下预测失真谱估计的能听度测量;以及根据所预测的能听度测量来调整所述阈值中的一个或更多个。2.如权利要求1所述的方法,其中,根据失真模型对所述感知谱估计的响应来确定所述失真谱估计。3.如权利要求2所述的方法,其中,所述失真谱估计包括第一频带分量的第一估计失真,所述第一估计失真被确定为被引起进入所述第一频带分量中并且进入比所述第一频带分量更高频率的频带分量的至少一部分中的失真的最大值。4.如权利要求1至3中任一项所述的方法,其中,确定感知谱估计包括:将平滑运算应用于被处理的频带分量。5.如权利要求1至4中任一项所述的方法,其中,在存在所述感知谱估计的情况下预测所述失真谱估计的能听度测量包括:根据感知谱估计来计算掩蔽阈值;确定所述失真谱估计与所述掩蔽阈值之间的差值;以及把所确定的差值的正数值相加,以产生预测的能听度测量。6.如权利要求5所述的方法,其中,所述掩蔽阈值是基于感知谱估计参照调性谱来计算的,所述调性谱包括区分类似噪声的频带分量与类似音调的频带分量的调性值。7.如权利要求5和6中任一项所述的方法,其中,所确定的差值的相加的正数值被加权以使得一个或更多个上频带分量和一个或更多个下频带分量具有比上频带分量与下频带分量之间的频带分量更低的权重。8.如权利要求1至7中任一项所述的方法,其中,所述阈值是时...
【专利技术属性】
技术研发人员:A·J·西费尔德特,
申请(专利权)人:杜比实验室特许公司,
类型:发明
国别省市:美国,US
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。