高效DRC配置文件传输制造技术

技术编号:29679503 阅读:14 留言:0更新日期:2021-08-13 22:02
本公开涉及高效DRC配置文件传输。描述了一种用于对编码音频信号进行解码的方法。编码音频信号包括帧序列,并且指示用于对应的多个不同渲染模式的多个不同的动态范围控制(DRC)配置文件。所述方法包括:从所述多个不同的渲染模式确定第一渲染模式;从帧序列的当前帧内所包括的DRC配置文件子集确定一个或多个DRC配置文件;确定所述一个或多个DRC配置文件中的至少一个是否适用于第一渲染模式;如果所述一个或多个DRC配置文件都不适用于第一渲染模式,则选择默认DRC配置文件作为当前DRC配置文件;其中,默认DRC配置文件的定义数据在解码器处是已知的;并且使用当前DRC配置文件对当前帧进行解码。

【技术实现步骤摘要】
高效DRC配置文件传输本申请是申请号为201580053702.9、申请日为2015年9月29日、专利技术名称为“高效DRC配置文件传输”的专利技术专利申请的分案申请。相关申请的交叉引用本申请要求2014年10月1日提交的美国临时专利申请No.62/058,228的优先权,该申请由此通过引用而全文并入。
本文涉及音频信号处理。特别地,本文涉及一种用于以带宽高效的方式传输动态范围控制(DRC)配置文件(profile)的方法和对应系统。
技术介绍
媒体消费者设备的日益普及为用于在这些设备上回放的媒体内容的创作者和分发者以及这些设备的设计者和制造者创建了新的机会和挑战。许多消费者设备能够回放范围广泛的媒体内容类型和格式,包括通常与用于HDTV、Blu-ray(蓝光)或DVD的高质量、宽带宽和宽动态范围音频内容相关联的那些。媒体处理设备可以用于在它们自己的内部声学换能器上或在外部换能器(比如耳机或高质量家庭影院系统)上回放这种类型的音频内容;然而,所有这些回放系统和环境由于环境中的噪声水平变化或者由于回放系统不失真地再现所需声压水平的能力有限而对音频信号的动态范围提出了明显不同的要求。根据环境限制动态范围是在范围广泛的具有不同渲染能力和收听环境的不同渲染设备上(即,在范围广泛的渲染模式上)提供高质量和高可懂度的方法。本文解决了如下技术问题:为媒体内容的创作者和分发者提供使得能够在范围广泛的具有不同渲染能力的不同渲染设备上以高质量和高可懂度再现音频信号的带宽高效的手段。专利技术内容根据一方面,描述了一种用于生成编码音频信号的方法。编码音频信号包括帧序列。编码音频信号指示用于对应的多个不同渲染模式的多个不同的动态范围控制(DRC)配置文件。所述方法包括将所述多个DRC配置文件中的不同DRC配置文件子集插入到帧序列的不同帧中,以使帧序列的两个或更多个帧共同包括所述多个DRC配置文件。根据进一步的方面,描述了一种用于对编码音频信号进行解码的方法。编码音频信号包括帧序列。此外,编码音频信号指示用于对应的多个不同渲染模式的多个不同的动态范围控制(DRC)配置文件。多个DRC配置文件中的不同DRC配置文件子集被包括在所述帧序列的不同帧中,使得所述帧序列中的两个或更多个帧共同包括所述多个DRC配置文件。该方法包括从多个不同的渲染模式确定第一渲染模式,并且从帧序列的当前帧内所包括的DRC配置文件子集确定一个或多个DRC配置文件。此外,该方法包括确定所述一个或多个DRC配置文件中的至少一个是否适用于第一渲染模式。另外,该方法包括所述一个或多个DRC配置文件都不适用于第一渲染模式,则选择默认DRC配置文件作为当前DRC配置文件;其中,默认DRC配置文件的定义数据在用于对编码音频信号进行解码的解码器处是已知的。此外,该方法包括使用当前DRC配置文件对当前帧进行解码。根据进一步的方面,描述了一种包括编码音频信号的位流。编码音频信号包括帧序列。编码音频信号指示用于对应的多个不同渲染模式的多个不同的动态范围控制(DRC)配置文件。多个DRC配置文件中的不同DRC配置文件子集被包括在帧序列的不同帧中,以使帧序列中的两个或更多个帧共同包括所述多个DRC配置文件。根据另一方面,描述了一种用于生成编码音频信号的编码器。编码音频信号包括帧序列。编码音频信号指示用于对应的多个不同渲染模式的多个不同的动态范围控制(DRC)配置文件。编码器被配置为将所述多个DRC配置文件中的不同DRC配置文件子集插入到帧序列的不同帧中,以使帧序列中的两个或更多个帧共同包括所述多个DRC配置文件。根据进一步的方面,描述了一种用于对编码音频信号进行解码的解码器。编码音频信号包括帧序列。编码音频信号指示用于对应的多个不同渲染模式的多个不同的动态范围控制(DRC)配置文件。所述多个DRC配置文件中的不同DRC配置文件子集被包括在帧序列的不同帧中,以使帧序列的两个或更多个帧共同包括所述多个DRC配置文件。所述解码器被配置为:从所述多个不同的渲染模式确定第一渲染模式;从帧序列的当前帧内所包括的DRC配置文件子集确定一个或多个DRC配置文件;确定所述一个或多个DRC配置文件中的至少一个是否适用于第一渲染模式;如果所述一个或多个DRC配置文件都不适用于第一渲染模式,则选择默认DRC配置文件作为当前DRC配置文件;其中,默认DRC配置文件的定义数据在解码器处是已知的;并且使用当前DRC配置文件对当前帧进行解码。根据进一步的方面,描述了一种软件程序。所述软件程序可以适于在处理器上执行并且适于当在处理器上实施时执行本文中所概述的方法步骤。根据另一方面,描述了一种存储介质。所述存储介质可以包括软件程序,该软件程序适于在处理器上执行并且适于当在处理器上实施时执行本文中所概述的方法步骤。根据进一步的方面,描述了一种计算机程序产品。所述计算机程序产品可以包括用于当在计算机上被执行时执行本文中所概述的方法步骤的可执行指令。应注意,如本专利申请中所概述的包括其优选实施例的方法和系统可以单独使用或者与本文中所公开的其他方法和系统组合使用。此外,本专利申请中所概述的方法和系统的所有方面都可以任意组合。特别地,权利要求的特征可以以任意的方式相互组合。附图说明下面以示例性方式参照附图来对本专利技术进行说明,其中图1和图2分别例示说明示例音频解码器和示例音频编码器;图3和图4例示说明示例动态范围压缩曲线;图5例示说明示例帧序列;以及图6示出用于选择DRC配置文件的示例方法的流程图。具体实施方式如上面所指示的,本文件解决了使得音频内容的设计者和/或分发者能够针对不同类型的渲染模式控制音频内容的质量和可懂度的技术问题。示例渲染模式是家庭影院渲染模式,在家庭影院渲染模式中,在安静的环境中使用通常允许非常宽的动态范围的换能器来回放音频内容。另一个示例渲染模式是平板模式,在平板模式中,使用例如电视机的换能器来回放音频内容,这些换能器通常允许与家庭影院相比缩小的动态范围。进一步的示例渲染模式是便携式扬声器模式,在便携式扬声器模式中,使用便携式电子设备(比如智能电话)的扩音器来回放音频内容。该渲染模式的动态范围与以上提及的渲染模式相比通常小,并且环境往往是有噪声的。另一个示例渲染模式是便携式耳机模式,在便携式耳机模式中,使用结合便携式电子设备的耳机来回放音频内容。动态范围是受限的,但是通常高于便携式电子设备的扩音器提供的动态范围。为了允许不同渲染模式有高质量和高可懂度,用于不同渲染模式的不同DRC(动态范围控制)配置文件可以连同音频内容一起被提供。音频内容可以在帧序列中被传输。帧序列可以包括I(即,独立)帧,I帧可以独立于先前的或后续的帧被解码。此外,帧序列可以包括通常表现出关于前一帧和/或后一帧的相关性的其他类型的帧(例如,P帧和/或B帧)。帧序列中的至少一些帧可以包括用于多个不同的渲染模式的多个不同的DRC配置文件。具体地说,帧序列的I帧可以包括所述多个DRC配置文件。...

【技术保护点】
1.一种用于对编码音频信号进行解码的方法,其中,所述编码音频信号包括帧序列,所述帧包含编码音频数据和元数据,所述元数据包括被称为DRC的动态范围控制增益的多个不同的集合,其中,所述编码音频信号进一步包括音频信号的响度的指示,以及所述帧序列中的一个或多个帧中的DRC配置元数据,其中,所述DRC配置元数据指示与编码音频信号相关联的多个DRC配置文件,以及对于每个DRC配置文件,指示该DRC配置文件适用的输出参考水平范围,其中,每个DRC增益集合对应于所述多个DRC配置文件之一,所述方法包括:/n为解码音频信号设定期望的输出参考水平;/n识别DRC配置文件中的一个或多个,对于该一个或多个DRC配置文件,输出参考水平的适用范围包括解码音频信号的期望的输出参考水平;/n选择所识别的DRC配置文件之一;/n对编码音频信号进行解码;/n通过将与所选择的DRC配置文件对应的DRC增益应用于解码音频信号来调整解码音频信号的动态范围;/n响应于音频信号的响度的指示以及解码音频信号的期望的输出参考水平来确定响度相关增益;以及/n将响度相关增益应用于经调整的解码音频信号以获得具有期望的输出参考水平的响度经调整的解码音频信号;/n其中,所述DRC配置文件中的一个或多个适用于在有噪声的环境中的回放。/n...

【技术特征摘要】
20141001 US 62/058,2281.一种用于对编码音频信号进行解码的方法,其中,所述编码音频信号包括帧序列,所述帧包含编码音频数据和元数据,所述元数据包括被称为DRC的动态范围控制增益的多个不同的集合,其中,所述编码音频信号进一步包括音频信号的响度的指示,以及所述帧序列中的一个或多个帧中的DRC配置元数据,其中,所述DRC配置元数据指示与编码音频信号相关联的多个DRC配置文件,以及对于每个DRC配置文件,指示该DRC配置文件适用的输出参考水平范围,其中,每个DRC增益集合对应于所述多个DRC配置文件之一,所述方法包括:
为解码音频信号设定期望的输出参考水平;
识别DRC配置文件中的一个或多个,对于该一个或多个DRC配置文件,输出参考水平的适用范围包括解码音频信号的期望的输出参考水平;
选择所识别的DRC配置文件之一;
对编码音频信号进行解码;
通过将与所选择的DRC配置文件对应的DRC增益应用于解码音频信号来调整解码音频信号的动态范围;
响应于音频信号的响度的指示以及解码音频信号的期望的输出参考水平来确定响度相关增益;以及
将响度相关增益应用于经调整的解码音频信号以获得具有期望的输出参考水平的响度经调整的解码音频信号;
其中,所述DRC配置文件中的一个或多个适用于在有噪声的环境中的回放。


2.根据权利要求1所述的方法,其中,选择所识别的DRC配置文件之一包括选择适用于在有噪声的环境中的回放的DRC配置文件之一。


3.一种用于对编码音频信号进行解码的解码器;其中,所述编码音频信号包括帧序列,所述帧包含编码音频数据和元数据,所述元数据包括被称为DRC的动态范围控制增益的多个不同的集合,其中,所述编码音频信号进一步包括音频信号的响度的指示,以及所述帧序列中的一个或多个帧中的DRC配置元数据,其中,所述DRC配置元数据指示与编码音频信号相关联的多个DRC配置文件,以及对于每个DRC配置文件,指示该DRC配置文件适用的输出参考水平范围,其中,每个DRC增益集合对应于所述多个DRC配置文件之一,其中所述解码器包括一个或多个处理器,进行以下操作:
为解码音频信号设定期望的输出参考水平;
识别DRC配置文...

【专利技术属性】
技术研发人员:H·霍伊里奇J·科喷斯
申请(专利权)人:杜比国际公司
类型:发明
国别省市:荷兰;NL

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1