System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 用于音频数据的基于元数据的动态处理的方法和装置制造方法及图纸_技高网

用于音频数据的基于元数据的动态处理的方法和装置制造方法及图纸

技术编号:40979077 阅读:2 留言:0更新日期:2024-04-18 21:25
本文描述了一种用于回放的音频数据的基于元数据的动态处理方法,该方法包括:由解码器接收包括音频数据和用于动态响度调整的元数据的比特流;由解码器解码音频数据和元数据以获得解码的音频数据和元数据;由解码器从元数据中基于回放条件确定用于动态响度调整的一个或多个处理参数;将所确定的一个或多个处理参数应用于经解码的音频数据以获得经处理的音频数据;以及输出经处理的音频数据以供回放。还描述了一种将音频数据和用于动态响度调整的元数据编码到比特流中的方法。此外,描述了相应的解码器和编码器、相应的系统和计算机程序产品。

【技术实现步骤摘要】
【国外来华专利技术】

本公开总体上涉及用于回放的音频数据的基于元数据的动态处理方法,并且特别地,涉及确定一个或多个处理参数并将其应用于音频数据以进行动态响度调整和/或动态范围压缩。本公开还涉及一种将用于动态响度调整和/或动态范围压缩的元数据和音频数据编码到比特流中的方法。本公开还涉及相应的解码器和编码器以及相应的系统和计算机程序产品。虽然文中将特别参考公开内容来描述一些实施例,但是应当理解的是,本公开不限于这样的使用领域,并且可应用于更广泛的情境中。


技术介绍

1、在整个公开中对
技术介绍
的任何讨论都不应被认为是承认这些技术是公知的或构成本领域公知常识的一部分。

2、在播放音频内容时,响度是声压的个体体验。在电影或电视内容中,已经发现节目中对话的响度是决定收听者对节目响度的感知的最关键参数。

3、为了确定节目(无论是完整节目还是仅对话)的平均响度,都必须对整个节目进行分析。平均响度通常是响度合规(例如,美国的calm法案)所必需的,也用于校准动态范围控制(drc)参数。一个节目的动态范围是它最安静的声音和最响亮的声音之间的差异。节目的动态范围取决于其内容,例如,动作电影的动态范围可能与纪录片不同且更宽,并且反映了创作者的意图。然而,设备在原始动态范围内回放音频内容的能力差异很大。因此,除了响度管理之外,动态范围控制也是提供最佳收听体验的另一个关键因素。

4、为了执行响度管理和动态范围控制,必须分析整个音频节目或音频节目片段,并且可以将所得的响度和drc参数与音频数据或编码音频数据一起传送,以应用于解码器或回放设备。</p>

5、当在编码之前对整个音频节目或音频节目片段的分析不可用时,例如在实时(动态)编码中,响度处理或调平被用于确保响度合规,以及(如果适用的话)取决于回放要求的潜在动态范围约束。这种方法提供了针对单个回放环境被“优化”的经处理的音频。

6、因此,存在对基于元数据的处理的需求,该处理传递带有伴随元数据的“原始”未处理音频,允许播放设备使用元数据根据设备约束或用户要求来动态修改音频。


技术实现思路

1、根据本公开的第一方面,提供了一种用于回放的音频数据的基于元数据的动态处理方法。该方法可包括通过解码器接收包括音频数据和用于动态响度的元数据的比特流。该方法还可包括通过解码器解码音频数据和元数据以获得解码的音频数据和元数据。该方法还可包括通过解码器基于回放条件从元数据确定用于动态响度调整的一个或多个处理参数。该方法还可包括将所确定的一个或多个处理参数应用于解码的音频数据以获得经处理的音频数据。并且该方法还可包括输出经处理的音频数据以供回放。

2、用于动态响度调整的元数据可以包括多组元数据,每组对应于相应的(例如不同的)回放条件。然后,基于(特定的)回放条件从元数据确定用于动态响度调整的一个或多个处理参数可以包括响应于提供给解码器的回放条件信息,选择与该(特定的)回放条件相对应的元数据组,并且从所选择的该元数据组中提取用于动态响度调整的一个或多个处理参数。其中,回放条件信息可以指示该(特定的)回放条件或由其得出的信息。

3、在一些实施例中,元数据可以指示针对多个回放条件的用于动态响度调整的处理参数。

4、在一些实施例中,所述确定一个或多个处理参数可以进一步包括基于回放条件确定用于动态范围压缩drc的一个或多个处理参数。

5、在一些实施例中,回放条件信息可以指示特定的扬声器设置。通常,回放条件可以包括解码器的设备类型、回放设备的特性、扬声器的特性、扬声器设置、背景噪声的特性、环境噪声的特性和声学环境的特性中的一者或多者。

6、在一些实施例中,所选择的元数据组可以包括drc序列组drcset。此外,每个元数据组可以包括相应的drc序列组drcset。一般而言,所述确定一个或多个处理参数可以说进一步包括通过解码器选择对应于回放条件的drc序列组drcset、均衡器参数集eqset和下混中的至少一者。

7、在一些实施例中,所述确定一个或多个处理参数可以进一步包括识别指示所选的drcset、eqset和下混中的至少一者的元数据标识符,以从元数据确定一个或多个处理参数。具体而言,选择该元数据组可以包括识别对应于特定下混的一组元数据。该特定下混可以基于扬声器设置被确定。

8、在一些实施例中,元数据可以包括与平均响度值相关的一个或多个处理参数,并且可选地包括与动态范围压缩特性相关的一个或多个处理参数。具体而言,每组元数据可以包括这样的与平均响度值相关的一个或多个处理参数,并且可选的与动态范围压缩特性相关的一个或多个处理参数。

9、在一些实施例中,比特流还可以包括用于将被应用于解码的音频数据的静态响度调整的附加元数据。

10、在一些实施例中,比特流可以是mpeg-d drc比特流,并且可以基于mpeg-d drc比特流语法用信号通知元数据的存在。

11、在一些实施例中,loudnessinfosetextension()元素可用于携带元数据作为有效载荷。

12、在一些实施例中,元数据可以包括一个或多个元数据有效载荷,其中每个元数据有效载荷可以包括多组参数和标识符,每组包括drcset标识符drcsetid、eqset标识符eqsetid和下混标识符downmixid中的至少一者,并结合与该组中的标识符相关的一个或多个处理参数。

13、在一些实施例中,所述确定一个或多个处理参数可以包括基于由解码器选择的drcset、eqset和下混中的至少一者在有效载荷中的多个组中选择一个组,其中由解码器确定的一个或多个处理参数可以是与所选组中的标识符相关的一个或多个处理参数。

14、根据本公开的第二方面,提供了一种用于回放的音频数据的基于元数据的动态处理的解码器。该解码器可包括一个或多个处理器和非暂态存储器,所述非暂态存储器被配置为执行一种方法,所述方法包括通过解码器接收包括音频数据和用于动态响度的元数据的比特流;通过解码器解码音频数据和元数据以获得解码的音频数据和元数据;通过解码器基于回放条件从元数据确定用于动态响度调整的一个或多个处理参数;将所确定的一个或多个处理参数应用于解码的音频数据以获得经处理的音频数据;并且输出经处理的音频数据以供回放。

15、用于动态响度调整的元数据可以包括多组元数据,每组对应于相应的(例如不同的)回放条件。然后,基于(特定的)回放条件从元数据确定用于动态响度调整的一个或多个处理参数可以包括响应于提供给解码器的回放条件信息,选择与该(特定的)回放条件相对应的元数据组,并且从所选择的该元数据组中提取用于动态响度调整的一个或多个处理参数。其中,回放条件信息可以指示该(特定的)回放条件或由其得出的信息。

16、根据本公开的第三方面,提供了一种将音频数据和用于动态响度调整的元数据编码到比特流中的方法。该方法可包括将原始音频数据输入响度调平器进行响度处理,以获得经响度处理的音频数据作为响度调平器的输出。该方法还可本文档来自技高网...

【技术保护点】

1.一种用于回放的音频数据的基于元数据的动态处理方法,该方法包括:

2.根据权利要求1所述的方法,其中所述提取一个或多个处理参数还包括提取用于动态范围压缩DRC的一个或多个处理参数。

3.根据权利要求1或2所述的方法,其中回放条件信息指示特定扬声器设置。

4.根据权利要求1至3中任一项所述的方法,其中,所选择的元数据组包括一组DRC序列DRCSet。

5.根据权利要求1至4中任一项所述的方法,其中选择元数据组包括识别对应于特定下混的元数据组。

6.根据权利要求1至5中任一项所述的方法,其中,每个元数据组均包括与平均响度值相关的一个或多个处理参数,并且可选地包括与动态范围压缩特性相关的一个或多个处理参数。

7.根据权利要求1至6中任一项所述的方法,其中,所述比特流还包括用于要应用于解码的音频数据的静态响度调整的附加元数据。

8.根据权利要求1至7中任一项所述的方法,其中所述比特流是MPEG-D DRC比特流,并且基于MPEG-D DRC比特流语法用信号通知元数据的存在。

9.根据权利要求8所述的方法,其中,loudnessInfoSetExtension()元素用于携带元数据作为有效载荷。

10.根据权利要求1至9中任一项所述的方法,其中所述元数据包括一个或多个元数据有效载荷,其中每个元数据有效载荷包括多组参数和标识符,每一组包括各自的下混标识符downmixId以及与该组中的下混标识符相关的一个或多个处理参数。

11.一种用于回放的音频数据的基于元数据的动态处理的解码器,其中所述解码器包括一个或多个处理器和非暂态存储器,所述非暂态存储器被配置为执行一种方法,所述方法包括:

12.一种将音频数据和用于动态响度调整的元数据编码到比特流中的方法,该方法包括:

13.根据权利要求12所述的方法,其中,所述方法还包括生成要由解码器使用的用于静态响度调整的附加元数据。

14.根据权利要求12或13所述的方法,其中所述生成元数据包括将经响度处理的音频数据与原始音频数据进行比较,并且其中元数据是基于所述比较的结果生成的。

15.根据权利要求14所述的方法,其中所述生成元数据还包括在一个或多个预定义时间段内测量响度,并且其中所述元数据还基于所测量的响度来生成。

16.根据权利要求15所述的方法,其中所述测量包括测量音频数据的整体响度。

17.根据权利要求15所述的方法,其中所述测量包括测量音频数据中对话的响度。

18.根据权利要求12至17中任一项所述的方法,其中所述比特流是MPEG-D DRC比特流,并且基于MPEG-D DRC比特流语法用信号通知元数据的存在。

19.根据权利要求18所述的方法,其中,loudnessInfoSetExtension()元素用于携带元数据作为有效载荷。

20.根据权利要求12至19中任一项所述的方法,其中所述元数据包括多个元数据组,其中每个元数据组对应于相应的回放条件。

21.根据权利要求12至20中任一项所述的方法,其中元数据包括一个或多个元数据有效载荷,其中每个元数据有效载荷包括多组参数和标识符,每一组包括各自的下混标识符downmixId以及与该组中的下混标识符相关的一个或多个处理参数,并且其中所述一个或多个处理参数是用于解码器进行的动态响度调整的参数。

22.一种用于将原始音频数据和用于动态响度调整的元数据编码到比特流中的编码器,其中所述编码器包括一个或多个处理器和非暂态存储器,所述非暂态存储器被配置为执行一种方法,所述方法包括:

23.一种系统,包括根据权利要求22所述的用于将原始音频数据和用于动态响度调整的元数据编码到比特流中的编码器和根据权利要求11所述的用于回放的音频数据的基于元数据的动态处理的解码器。

24.一种计算机程序产品,包括具有指令的计算机可读存储介质,所述指令在由具有处理能力的设备执行时适于使该设备执行根据权利要求1至10或12至21中任一项所述的方法。

25.一种计算机可读存储介质,其存储根据权利要求24所述的计算机程序产品。

...

【技术特征摘要】
【国外来华专利技术】

1.一种用于回放的音频数据的基于元数据的动态处理方法,该方法包括:

2.根据权利要求1所述的方法,其中所述提取一个或多个处理参数还包括提取用于动态范围压缩drc的一个或多个处理参数。

3.根据权利要求1或2所述的方法,其中回放条件信息指示特定扬声器设置。

4.根据权利要求1至3中任一项所述的方法,其中,所选择的元数据组包括一组drc序列drcset。

5.根据权利要求1至4中任一项所述的方法,其中选择元数据组包括识别对应于特定下混的元数据组。

6.根据权利要求1至5中任一项所述的方法,其中,每个元数据组均包括与平均响度值相关的一个或多个处理参数,并且可选地包括与动态范围压缩特性相关的一个或多个处理参数。

7.根据权利要求1至6中任一项所述的方法,其中,所述比特流还包括用于要应用于解码的音频数据的静态响度调整的附加元数据。

8.根据权利要求1至7中任一项所述的方法,其中所述比特流是mpeg-d drc比特流,并且基于mpeg-d drc比特流语法用信号通知元数据的存在。

9.根据权利要求8所述的方法,其中,loudnessinfosetextension()元素用于携带元数据作为有效载荷。

10.根据权利要求1至9中任一项所述的方法,其中所述元数据包括一个或多个元数据有效载荷,其中每个元数据有效载荷包括多组参数和标识符,每一组包括各自的下混标识符downmixid以及与该组中的下混标识符相关的一个或多个处理参数。

11.一种用于回放的音频数据的基于元数据的动态处理的解码器,其中所述解码器包括一个或多个处理器和非暂态存储器,所述非暂态存储器被配置为执行一种方法,所述方法包括:

12.一种将音频数据和用于动态响度调整的元数据编码到比特流中的方法,该方法包括:

13.根据权利要求12所述的方法,其中,所述方法还包括生成要由解码器使用的用于静态响度调整的附加元数据。

14.根据权利要求12或13所述的方法,其中所述生成元数据包括将经响度处...

【专利技术属性】
技术研发人员:C·费尔奇S·G·诺克罗斯
申请(专利权)人:杜比实验室特许公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1