当前位置: 首页 > 专利查询>苹果公司专利>正文

用于动态范围控制的推迟响度调节制造技术

技术编号:33372213 阅读:17 留言:0更新日期:2022-05-11 22:38
比特流由解码端获得,该解码端包含音频信号的编码版本和该音频信号的瞬时响度序列。该瞬时响度序列尚未被响度归一化。通过利用响度归一化将该瞬时响度序列应用于DRC特性来产生动态范围控制DRC增益序列。该DRC增益序列应用于经解码的音频信号。也描述了其他方面并要求对其他方面进行保护。对其他方面进行保护。对其他方面进行保护。

【技术实现步骤摘要】
用于动态范围控制的推迟响度调节

技术介绍

[0001]声音节目,例如音乐、播客、实况录制的短视频剪辑或功能胶片,具有限定其动态和动态范围的响亮片段和软片段。在许多情况下,例如在嘈杂环境中通过头戴式耳机听或在夜间场景中通过家中的扬声器来听,希望减小播放声音的动态和动态范围以改善听者的体验。动态范围压缩器用于该目的。它们是数字信号处理器,该数字信号处理器将时变增益应用于 (声音节目的)输入数字音频信号,以便放大软片段并衰减该音频信号的响亮片段。为了避免可由音频信号的动态范围压缩引起的可听泵送伪影,可执行响度归一化过程,该响度归一化过程将输入音频信号“对准”到压缩特性或配置文件,同时根据该压缩特性压缩该音频信号。这可以通过用其节目响度抵消该输入音频信号的瞬时响度来完成,其中节目响度是旨在描述声音节目的总体响度(也称为集成响度)的计算值。

技术实现思路

[0002]音频编码标准定义了用于动态范围压缩的方法,这些方法在正在创建或准备分发或存储/存档声音节目的编码端生成动态范围控制DRC增益。该 DRC增益在这里被称为DRC增益序列,该DRC增益序列与其相关联的声音节目时间对齐,使得该序列中的一个或多个增益值将被应用于该声音节目的对应数字音频帧。然后该DRC增益序列被格式化为,例如与声音节目相关联的元数据,成为一个或多个比特流。如果该解码端需要(通常在经解码的音频信号的播放期间),解码端会获取比特流并应用流内DRC增益来压缩经解码的音频信号的动态范围。此类基于元数据的方法的优点是质量改善,这是由于与实时压缩相比,DRC增益的离线编码的前行时间间隔可能更大。另一个优点是,例如,可根据声音节目创建器或分配器的专业知识在编码端控制压缩特性。
[0003]对于在线应用程序中基于元数据的DRC(例如,实况音频流传输以及将实况音频录制到文件),如果正在流播或写入文件进行存储的声音节目的节目响度尚不清楚(因为声音节目尚未结束),则存在挑战。这是因为如果该声音节目的实际节目响度(其只能在声音节目结束后确定)显著偏离预期或预测的节目响度,则压缩器特性可能无法正确调整(或响度归一化)。
[0004]本公开的一些方面描述了将用于动态范围控制(DRC)的响度调节 (响度归一化)从编码端推迟到解码端的新型数字信号处理方法。其他方面描述了进行基于元数据的DRC增益序列处理时,使用响度归一化改变解码端的压缩器特性的技术。这些方面对于例如,实况流传输以及实况录制到文件等应用程序尤其有益。
[0005]以上概述不包括本公开的所有方面的详尽列表。可预期的是,本公开包括可由上文概述的各个方面以及在下文的具体实施方式中公开并且在权利要求书部分特别指出的各个方面的所有合适的组合来实践的所有系统和方法。此类组合可具有未在上述
技术实现思路
中具体阐述的特定优点。
附图说明
[0006]本公开的各方面以举例的方式进行说明,而不仅限于各个附图的图示,在附图中类似的附图标号指示类似的元件。应当指出的是,在本公开中提到“一”或“一个”方面未必是同一方面,并且其意指至少一个。另外,为了简洁以及减少附图的总数,可使用给定附图示出本公开的不止一个方面的特征部,并且对于给定方面,可能并非需要该附图中的所有元件。
[0007]图1示出了DRC特性曲线的示例。
[0008]图2是在解码端应用DRC并且在编码端不执行响度归一化的音频编解码器系统的框图。
[0009]图3是在解码端应用DRC并且在编码端不执行响度归一化的适用于实况流传输的音频编解码器系统的框图。
[0010]图4是在解码端应用DRC并且在编码端不执行响度归一化的适用于实况录制以存储或存档的音频编解码器系统的框图。
[0011]图5描绘了在解码端应用DRC的符合MPEG

D DRC的音频编解码器系统的一部分。
[0012]图6描绘了在解码端应用DRC并且在编码端应用响度归一化的符合 MPEG

D DRC的音频编解码器系统的一部分。
[0013]图7描绘了在解码端应用DRC和响度归一化的符合MPEG

D DRC的音频编解码器系统的一部分。
[0014]图8是可生成向后兼容和非向后兼容的MPEG

D DRC比特流扩展的新编码端过程的流程图。
[0015]图9是可使用向后兼容或非向后兼容的MPEG

D DRC比特流扩展来产生DRC增益序列的新解码端过程的流程图。
[0016]图10A和图10B是符合MPEG

D DRC的音频编解码器系统的框图,其中向后兼容的编码端产生由新解码器和传统解码器两者处理的向后兼容的比特流。
具体实施方式
[0017]现在将参考所附附图来解释本公开的各方面。每当所描述的部件的形状、相对位置和其它方面未明确限定时,本专利技术的范围并不仅局限于所示出的部件,所示出的部件仅用于例证的目的。另外,虽然阐述了许多细节,但应当理解,本公开的一些方面可在没有这些细节的情况下被实施。在其他情况下,未详细示出熟知的电路、结构和技术,以免模糊对该描述的理解。
[0018]为了将动态范围控制适当地应用于音频信号,应将压缩器特性(DRC 特性,DRC配置文件)与该音频信号的该响度水平范围“对齐”。例如,参考图1,沿着输入水平轴对齐,使得DRC特性曲线的过零点大致在该音频信号的响度水平范围的中心处。过零点处的电平也被称为DRC输入响度目标—在图1所示的一组特性曲线示例中,该电平约为

31dB。该响度水平范围的中心,例如可以是声音节目的平均水平,或声音节目中的平均对话水平。实现这种对齐的过程在此被称为响度归一化,结合音频信号的 DRC,以达到给定响度目标。例如,音频信号(声音节目)的响度可以是称为集成响度的单个值。集成响度是音频信号的响度量度,其类似于均方根RMS,但在人类听觉方面更真实。集成响度可等同于节目响度,因为它测
量声音节目在其整个持续时间内的响度。为了实现响度归一化,当以分贝(dB)为单位给出集成响度时,可以从DRC输入响度目标中减去集成响度以导出以dB为单位的归一化增益。将该归一化增益添加到响度模型输出,该响度模型计算该音频信号(声音节目)的瞬时响度。该瞬时响度可以是响度值的序列,每个响度值基于构成输入数字音频信号的相应数字音频帧(并且表示人类感知的响度)来计算。实现响度归一化的另一种方式是将图1中描绘的DRC特性曲线向零dB的右侧或左侧移位(由归一化增益的大小决定)。在图1的示例中,曲线已经向左移位到

31dB(该示例中的响度目标),并且因此与具有

31dBA(A加权)或LKFS(响度K加权电平满标度)的集成响度的声音节目正确对齐(并且因此可以直接应用于该声音节目)

换句话说,在这种情况下的归一化增益将为零dBA。
[0019]如果当该动态范围控制信号处理正在进行时声音节目的集成响度仍然未知,如实况音频的情况,则需要进行预本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种音频解码器装置,包括:处理器;以及存储器,所述存储器在其中存储有指令,所述指令将所述处理器配置为获得比特流,所述比特流包括:音频信号的编码版本;第一动态范围控制DRC增益序列,所述第一动态范围控制DRC增益序列由将所述音频信号应用于第一DRC特性的编码端过程确定;响度归一化增益,所述响度归一化增益在确定所述第一DRC增益序列时由所述编码端应用;所述第一DRC特性的索引,其中所述索引识别或指向所述第一DRC特性;以及随时间推移集成响度更新的多个实例。2.根据权利要求1所述的音频解码器装置,其中响应于具有第一值的所述索引,所述处理器在将DRC应用于所述音频信号时执行响度归一化。3.根据权利要求1所述的音频解码器装置,其中所述比特流指示所述处理器在将逆DRC特性应用于所述DRC增益序列之后执行响度归一化,通过使用所述比特流中的所述响度归一化增益来补偿或撤销在确定所述DRC增益序列时由所述编码端应用的响度归一化增益。4.根据权利要求1至3中任一项所述的音频解码器装置,其中所述存储器在其中存储有指令,所述指令将所述处理器配置为:通过将所述第一DRC增益序列应用于所述第一DRC特性的逆特性来恢复响度序列;对所恢复的响度序列执行响度归一化;通过将所恢复的所述响度序列应用于第二DRC特性来产生第二DRC增益序列;以及将所述第二DRC增益序列应用于所述音频信号。5.根据权利要求4所述的音频解码器装置,其中所述响度归一化增益以dB为单位,并且执行响度归一化包括将所述响度归一化增益与所恢复的所述响度序列和所述集成响度更新的实例相结合。6.根据权利要求1至4中任一项所述的音频解码器装置,其中执行所述响度归一化包括将所述第二DRC特性沿其输入轴移位一个基于所述响度归一化增益和所述集成响度更新的实例的量。7.根据权利要求1至6中任一项所述的音频解码器装置,其中对于所述集成响度更新的每个实例,所述处理器计算对归一化增益的更新,作为DRC输入响度目标与所述集成响度更新的实例之间的差异,并且在将归一化响度序列应用于所述第二DRC特性以产生所述第二DRC增益序列之前,将所述归一化增益添加到所恢复的所述响度序列以产生所述归一化响度序列。8.根据权利要求1至7中任一项所述的音频解码器装置,其中所述集成响度更新的相邻实例相隔一至十秒。9.根据权利要求1至8中任一项所述的音频解码器装置,其中所述集成响度更新表示所述音频信号的运行平均集成响度。10.根据权利要求1所述的音频解码器装置,其中所述处理器被配置为:
从所述比特流提取所述第一DRC特性的所述索引并使用所提取的所述索引来获得所述第一DRC特性的逆特性;通过将所述第一DRC增益序列应用于所述第一DRC特性的所述逆特性来恢复响度序列;如果所述索引具有第一预定义值,则针对集成响度更新的每个实例计算归一化增益更新,作为i)DRC输入响度目标与ii)所述集成响度更新实例和由编码端过程使用的编码端响度归一化增益之和之间的差值,以及将所述归一化增益更新添加到所恢复的所述响度序列以产生归一化响度序列;通过将所述归一化响度序列应用于第二DRC特性来产生第二DRC增益序列;以及将所述第二DRC增益序列应用于所述音频信号。11.根据权利要求10所述的音频解码器装置,其中所述处理器被配置为如果所述索引具有第二预定义值,则通过将没有响度归一化的所恢复的所述响度序列应用于所述第二DRC特性来产生所述第二DRC增益序列。12.一种音频解码器装置,包括:处理器;以及存储器,所述存储器在其中存储有指令,所述指令将所述处理器配置为获得比特流,所述比特流包括:音频信号的编码版本;第一动态范围控制DRC增益序列,所述第一动态范围控制DRC增益序列由将所述音频信号应用于第一DRC特性的编码端过程确定;所述第一DRC特性的索引,其中所述索引识别或指向所述第一DRC特性;随时间推移集成响度更新的多个实例;以及标志,其中当所述标志具有第一值时,所述比特流包含编码端响度归一化增益,或者当所述标志具有第二值时,所述比特流不包含所述编码端响度归一化增益。13.根据权利要求12所述的音频解码器装置,其中响应于具有所述第一值的所述标志,所述处理器使用第二DRC特性将DRC应用于所述音频信号,并且使用i)所述编码端响度归一化增益和ii)集成响度更新的所述多个实例进行响度归一化。14.根据权利要求12所述的音频解码器装置,其中响应于i)具有所述第二值的所述标志以及ii)当所述索引具有第一值时,所述处理器使用第二DRC特性将DRC应用于所述音频信号,并且使用集成响度更新的所述多个实例,但不使用编码端响度归一化增益进行响度归一化。15.根据权利要求14所述的音频解码器装置,其中响应于所述索引是不同于所述第一值的第二值,所述处理器使用所述第二DRC特性,在没有响度归一化的情况下将DRC应用于所述音频信号。16.一种音频解码器装置,包括:处理器;以及存储器,所述存储器在其中存储有指令,所述指令将所述处理器配置为获得比特流,所述比特流包括:音频信号的编码版本;第一动态范围控制DRC增益序列,所述第一动态范围控制DRC增益序列由将所述音频信
号应用于第一DRC特性的编码端过程确定;所述第一DRC特性的索引,其中所述索引识别或指向所述第一DRC特性;随时间推移集成响度更新的多个实例;以及标志,并且当所述标志具有第一值时,所述处理器用包含在所述比特流中的新扩展有效载荷中的DRC特性索引值替换所述比特流中的传统扩展有效载荷的一些或所有传统DRC特性索引值。17.一种音频解码器装置,包括:处理器;以及存储器,所述存储器在其中存储有指令,所述指令将所述处理器配置为获得比特流,所述比特流包括:音频信号的编码版本;第一动态范围控制DRC增益序列,所述第一动态范围控制DRC增益序列由将所述音频信号应用于第一DRC特性的编码端过程确定;所述第一DRC特性的索引,其中所述索引识别或指向所述第...

【专利技术属性】
技术研发人员:F
申请(专利权)人:苹果公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1