具有基于场景切换分析器引导的失真可听度模型的动态阈值的减少失真的多带压缩器制造技术

技术编号：28049105 阅读：44 留言：0更新日期：2021-04-09 23:41

本申请案涉及响应于输入音频信号而动态地调整压缩器的阈值的方法、系统及计算机程序产品。场景切换分析器接收具有多个频带分量的输入音频信号。所述场景切换分析器确定所述输入音频信号中是否已发生场景切换。处理所述输入音频信号的所述频带分量。响应于确定尚未发生场景切换，失真可听度系统将缓慢平滑应用到所述频带分量的压缩器阈值。响应于确定已发生场景切换，所述失真可听度系统将快速平滑应用到所述频带分量的所述压缩器阈值或不将平滑应用到所述频带分量的所述压缩器阈值。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】具有基于场景切换分析器引导的失真可听度模型的动态阈值的减少失真的多带压缩器相关申请案的交叉引用本申请案要求2018年9月28日提交的第PCT/CN2018/108287号国际专利申请案、2019年1月29日提交的第62/798,149号美国临时专利申请案及2019年2月4日提交的第19155298.3号欧洲专利申请案的优先权益，所有这些专利申请案均以引用的方式全部并入本文中。
本申请公开大体上涉及音频呈现，且特定来说，涉及呈现期间的失真减少。
技术介绍
许多音频重放系统含有放大器及扬声器，其具有有限的输出能力。手机及平板计算机是两个极端的例子，它们的设计受到装置的尺寸及功率要求的严格限制。在此类系统中，随着重放电平的增加，音频失真是很常见的，且这种失真的特性通常是频率相关的。因此，通常的做法是在重放之前将多带压缩应用到音频信号以减少失真并尝试在重放装置上最大化重放电平。为信号的每一频带指定失真阈值，且压缩器将独立增益应用到每一频带以确保每一频带中的信号电平不超过对应的失真阈值。这种压缩器的一个问题是，...

【技术保护点】
1.一种响应于输入音频信号而动态地调整压缩器的阈值的方法，所述方法包括：/n由场景切换分析器接收具有多个频带分量的输入音频信号；/n由所述场景切换分析器确定所述输入音频信号中是否已发生场景切换，其中当所述输入音频信号从为宽带信号转变到为窄带信号或从为窄带信号转变到为宽带信号时，确定已发生场景切换；/n由所述场景切换分析器向失真可听度模型提供一或多个控制信号，以通过引导平滑器的攻击时间常数及/或释放时间常数的改变而将平滑引导到所述频带分量的压缩器阈值；及/n处理所述输入音频信号的所述频带分量，其包含：/n响应于确定尚未发生场景切换，所述控制信号指示使用大时间常数，由此将缓慢平滑应用到所述频带分量...

【技术特征摘要】
【国外来华专利技术】20190204 EP 19155298.3;20190129 US 62/798,149;20181.一种响应于输入音频信号而动态地调整压缩器的阈值的方法，所述方法包括：
由场景切换分析器接收具有多个频带分量的输入音频信号；
由所述场景切换分析器确定所述输入音频信号中是否已发生场景切换，其中当所述输入音频信号从为宽带信号转变到为窄带信号或从为窄带信号转变到为宽带信号时，确定已发生场景切换；
由所述场景切换分析器向失真可听度模型提供一或多个控制信号，以通过引导平滑器的攻击时间常数及/或释放时间常数的改变而将平滑引导到所述频带分量的压缩器阈值；及
处理所述输入音频信号的所述频带分量，其包含：
响应于确定尚未发生场景切换，所述控制信号指示使用大时间常数，由此将缓慢平滑应用到所述频带分量的压缩器阈值；及
响应于确定已发生场景切换，所述一或多个控制信号指示使用小或零值时间常数，由此将快速平滑应用到所述频带分量的所述压缩器阈值或不将平滑应用到所述频带分量的所述压缩器阈值。

2.根据权利要求1所述的方法，其中所述宽带信号对应于歌唱声或专业电影内容，且所述窄带信号对应于器乐声或低质量窄带用户生成内容UGC。

3.根据权利要求1或2所述的方法，其中确定所述输入音频信号中是否已发生场景切换是基于输入音频信号的所有频带分量。

4.根据权利要求3所述的方法，其中确定所述输入音频信号中是否已发生场景切换是基于信号功率谱质心的时变估计。

5.根据权利要求4所述的方法，其中所述场景切换分析器至少通过执行包括以下各者的操作来计算所述信号功率谱质心的所述时变估计：
通过使每一频带分量信号平滑来估计信号功率谱；及
使用所述估计的信号功率谱确定所述信号功率谱的所述质心。

<...

【专利技术属性】
技术研发人员：马远星，
申请(专利权)人：杜比实验室特许公司，
类型：发明
国别省市：美国;US

全部详细技术资料下载我是这个专利的主人