使用音频信号水平的随时间变化的估计概率密度的随时间变化的音频信号水平制造技术

技术编号:4661661 阅读:268 留言:0更新日期:2012-04-11 18:40
用于平滑信号的随时间变化的水平的方法、介质和装置。该方法包括:估计信号的短期水平的随时间变化的概率密度和通过使用概率密度来平滑信号的水平。信号可以是音频信号。短期水平和平滑后的水平可以是各自具有当前时间索引和先前时间索引的时间序列。这里,在平滑之前可以计算在先前时间索引处的平滑后的水平的概率。在平滑之前可以使用概率密度来计算平滑参数。计算平滑参数可以包括:使用在先前时间索引处的平滑后的水平、在当前时间索引处的短期水平和在先前时间索引处的平滑后的水平的概率来计算平滑参数。计算平滑参数可以包括使用估计的概率密度的宽度来计算平滑参数。

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及音频信号处理。具体而言,本专利技术涉及通过平滑音频信号的短期水平来计算出随时间变化的对音频信号的水平的度量,其中至少部分地通过随时间变化的对短期水平的概率密度的估计来控制平滑处理的参数。弓I用文献且该文献通过弓I用结合于此 在Alan Jeffrey Seefeldt等人的国际专利申请公布WO 2004/111994A2 (于2004年12月23日公布,题为Method, Apparatus and ComputerProgr咖for Calculating andAdjusting the Perceived Loudness of anAudio Signal)中禾口在Alan Seefeldt等人的文章(Audio EngineeringSociety(音频工程协会)大会论文6236, 2004年10月28日旧金山,题为A New 0bj ective Measure of Perceived Loudness)中描述了在更好地理解本专利技术时有用的用于度量感知的(心理声学)响度的一些技术。所述申请WO 2004/111994A2和所述文章通过整体引用而结合于此。
技术介绍
在音频信号处理中,生成随时间变化的对音频信号水平的度量常常是必要的(这里术语水平 一般地指代水平的度量,诸如峰水平、均方根水平、响度水平等)。例如,响度计可以显示随时间变化的对音频信号的感知响度的度量,其中该度量被明显地平滑以便表明在过去数秒内的平均响度。在另一例子中,自动增益控制(Automatic Gain Control,AGC)处理可以计算随时间变化的对音频信号水平的高度平滑的度量、然后使用所得度量来生成缓慢变化的增益,该增益在应用于音频信号时可以将音频的平均水平自动移动到更接近希望的目标水平。 在许多例子中的这两个例子中,通过将某一形式的平滑滤波器应用于对短期水平的度量来计算出平滑的水平度量。(短期的意思是在比执行后续的平滑处理的间隔明显更短的时间间隔内进行计算。)例如,如在申请W0 2004/111994 A2中所述,可以在数十毫秒的间隔内计算信号的均方根水平或者感知响度水平以生成短期水平。然后,后续的对该短期水平的平滑可以涉及到数秒量级的时间常数。在以下讨论中,将该随时间变化的对短期水平的度量表示为信号L[t],而将后续的平滑后的水平度量表示为[[t],其中t表示离散的时间索引。 许多类型的平滑滤波器可以应用于L[t]以生成[[t]。可以使用有限冲激响应(Finite Impulse Response, FIR)滤波器或者多极无限冲激响应(Infinite ImpulseResponse, IIR)滤波器。所用具体滤波器不是关键的。出于示例目的,可以考虑常用的快速上升/缓慢释放的单极IIR平滑器。利用这样的滤波器,可以根据以下方程来更新平滑后的水平度量C[t]则(1)a上升丄0 _ 1] + (1 — 上升)丄|>] 丄|>] _丄[t -1 ] > 0释放Z[f — 1] + (1 一 《释放)丄P] — Z[t -1] s 0 可以选择平滑系数a上升和a释放使得a上升< a释放。这意味着[[t]在L[t]增加(上升)时比在L[t]减少(释放)时更快速地跟踪L[t]。对于AGC,例如可以选择与一秒的时间常数对应的a ±#和与四秒的时间常数对应的a k。这样,[[t]随时间很缓慢变化,结果,修改音频的对应增益也缓慢变化,由此维持原音频的短期动态性。然而,当使用这样大的时间常数时可能出现问题。假设为了在节目之间和在各种频道之间维持一致的平均水平,使用这样的AGC对电视机的音频进行操作。在这样的情形中,AGC处理的音频信号的内容可能骤然改变(例如在频道改变时),而相关的音频信号的平均水平因此也可能骤然改变。然而,AGC由于它的时间常数大而需要大量时间来收敛至新水平和使所处理的音频的修改水平符合希望的目标水平。在这样的调整时间期间,电视的观看者可以感觉到音频的水平太响或者太低。结果,观看者可能快速去拿遥控器以调节音量——而没有想到自己只是在AGC收敛时与它对抗。 现有技术通常使用基于短期水平L[t]与平滑水平[[t]的相对关系来改变的时间常数来解决刚才描述的问题。例如,如果信号的短期水平明显大于或者少于由平滑水平周围的一些阈值边界所限定的平滑水平,则平滑操作分别向较快的上升时间常数和/或释放时间常数切换,直至短期水平回落至平滑水平周围的阈值边界内。随后,系统切换回原来较慢时间常数。可以修改方程l以通过包括四种情况而不是两种情况来实施这一更复杂的平滑技术a快上升丄1> _ + (1 _ a快上升)丄1>]上升Z[f —1] + (l-a;上升)丄[f]Z[,-1] + (l-a释放)朋释放丄W-丄[t]〉AL,决0〈i:[f] — Z[t]sAL快(2)快释放丄[f —1] + (1_ 快释放)化]_训《-M快 在方禾呈2中,a快上升< a上升禾口 a快释放< a释放意b未着a快上升禾口 a快释放分另lJX寸应于比a上升和a释放更快的时间常数。如果a上升和a释放分别对应于1秒和4秒的时间常数,则可以选择例如分别与0. 1秒和0. 4秒的时间常数(快至十倍)对应的a ^^和a ttffiK。必须合理地选择快速时间常数阈值ALft,使得向这些较快的时间常数的切换没有太频繁地出现,造成不希望的平滑后的水平[[t]的不稳定。例如,如果水平度量L[t]和[[t]表示以分贝为单位的均方根水平,则可以将ALft设置为10dB,约为感知响度的两倍。 虽然相对于方程1中的平滑带来了改善,但是方程2的平滑对于许多信号仍然有次优表现。 一般而言,对于任意合理阈值ALft,可以存在如下信号,对于这些信号而言,短期水平L[t]的原来希望的动态性在平均水平[[t]周围的阈值边界以外波动,因此使平滑处理错误地向快速上升或者释放模式切换。 为了更好地理解其中方程2的平滑如希望的那样表现以及其中该平滑表现不充分的情况,可以设想短期水平L[t]随时间的分布。可以将这一分布设想为随时间变化的如下概率密度,该概率密度预测在当前时间索引t附近的时间间隔内遇到短期水平L的任何特定值的概率。这一间隔的持续时间应当与方程2的平滑滤波器中所用的较慢的一组时间常数相当。 现在针对之前描述的电视频道改变的例子来考虑这种概率密度的行为。假定针对给定频道的短期水平的动态范围有些限制,那么短期水平L[t]的概率密度函数呈现为位于平滑水平[[t]周围的相当窄的峰的形式。当频道改变时,假设新频道的平均水平明显高于原频道,那么概率密度函数将开始改变新峰增长到位于新频道的更高平均水平周围,而原峰降低。 图l描绘了在描述的转变开始时的概率密度函数。在图中,水平轴表示水平而竖直轴表示概率。实线表示短期水平在转变开始时的概率密度。注意左侧为降低的峰(表示与旧频道的选择相关联的概率的降低)而右侧为增长的峰(表示与新频道的选择相关联的概率的升高)。在转变开始时,平滑水平[[t-l]仍然落在旧频道选择的峰内,而短期水平L[t]落在新频道的峰内。在图中,短期水平L[t]比[[t-l]超出大于ALft的数量,因此根据等式2,快速本文档来自技高网...

【技术保护点】
一种用于平滑信号的随时间变化的水平的方法,所述方法包括:  估计所述信号的短期水平的随时间而变化的概率密度;以及  使用所述概率密度来平滑所述信号的水平。

【技术特征摘要】
【国外来华专利技术】US 2007-7-13 60/959,442一种用于平滑信号的随时间变化的水平的方法,所述方法包括估计所述信号的短期水平的随时间而变化的概率密度;以及使用所述概率密度来平滑所述信号的水平。2. 根据权利要求1所述的方法,其中 所述信号是音频信号。3. 根据权利要求1所述的方法,其中平滑后的水平和估计出的概率密度以近似相同的速率随时间变化。4. 根据权利要求1所述的方法,其中所述短期水平和所述平滑后的水平为时间序列,其每个具有当前时间索引和先前时间 索引;以及在所述平滑之前进行以下操作计算在所述先前时间索引处所述平滑后的水平的概率。5. 根据权利要求1所述的方法,其中 在所述平滑之前进行以下操作使用所述概率密度来计算平滑参数。6. 根据权利要求5所述的方法,其中 所述平滑参数的计算包括使用在所述先前时间索引处的所述平滑后的水平、在所述当前时间索引处的所述短期 水平和在所述先前时间索引处的所述平滑后的水平的概率来计算所述平滑参数。7. 根据权利要求5所述的方法,其中 所述平滑参数的计算包括使用所述估计出的概率密度的宽度来计算所述平滑参数。8. 根据权利要求6所述的方法,其中 所述平滑参数的计算包括当在所述先前时间索引处的所述平滑后的水平不大于阈值概率时,使用第一上升时间 常数和释放时间常数;以及相反,当在所述先前时间索引处的所述平滑后的水平大于所述阈值概率时,使用如下 的上升时间常数和释放时间常数,所述上升时间常数和释放时间常数之一比其对应的第一 时间常数更慢。9. 根据权利要求8所述的方法,其中上升常数和释放常数的使用包括 使用如下的上升时间常数和释放时间常数,所述上升时间常数和释放时间常数都比其对应的第一时间常数更慢。10. 根据权利要求6所述的方法,其中 所述阈值概率是可变的。11. 根据权利要求10所述的方法,其中 可变阈值概率是所述估计出的概率密度的函数。12. 根据权利要求l-ll中的任一权利要求所述的方法,其中所述平滑包括使用所述概 率密度来平滑所述短期水平。13. 根据权利要求1-11中的任一权利要求所述的方法,其中估计所述概率密度包括将参数表达与所述短期水平的以往值拟合。14. 根据权利要求13所述的方法,其中所述拟合包括 将高斯混合模型与所述短期水平的所述以往值拟合。15. 根据权利要求1-11中的任一权利要求所述的方法,其中估计所述概率密度包括 计算所述短期水平的以往值的直方图。16. —种计算机可读存储器,包含用于实...

【专利技术属性】
技术研发人员:阿兰杰弗里西费尔特
申请(专利权)人:杜比实验室特许公司
类型:发明
国别省市:US[美国]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1