音频解码方法和装置及用于处理媒体数据的方法制造方法及图纸

技术编号:26508308 阅读:38 留言:0更新日期:2020-11-27 15:36
本申请公开一种音频解码方法、音频解码装置、包括软件程序的存储介质和用于处理媒体数据的方法。该音频解码方法,包括:通过音频解码器获得经编码的比特流,所述经编码的比特流包括音频数据和信令数据,所述信令数据指示所述经编码的比特流中包括响度值,并且还指示所述经编码的比特流中包括真正的峰数据;通过所述音频解码器从所述经编码的比特流获得所述响度值和所述真正的峰数据;以及通过所述音频解码器响应于所述响度值和所述真正的峰数据来对所述音频数据的响度进行标准化。

【技术实现步骤摘要】
音频解码方法和装置及用于处理媒体数据的方法本申请是申请日期为2011年12月1日、申请号为“201610301273.9”、专利技术名称为“用于处理媒体数据的方法和媒体处理系统”的专利技术专利申请的分案申请。专利技术专利申请“201610301273.9”是申请日期为2011年12月1日、申请号为“201180057961.0”、题为“具有多个媒体处理节点的自适应处理”的中国专利申请的分案申请。相关申请的交叉引用和优先权声明本申请要求于2010年12月3日提交的美国临时申请No.61/419,747和于2011年11月10日提交的美国临时申请No.61/558,286的优先权,两者的全部内容出于所有目的通过引用并入本文。
本专利技术一般地涉及媒体处理系统,具体地涉及基于媒体数据的媒体处理状态来自适应地处理媒体数据。
技术介绍
媒体处理单元通常以盲方式进行操作,并且不关注在接收媒体数据之前该媒体数据的处理历史。这可以在如下媒体处理框架中工作:在该媒体处理框架中,单一实体针对各种目标媒体呈现装置进行所有的媒体处理和编码,同时目标媒体呈现装置进行经编码的媒体数据的所有解码和呈现。然而,在多个媒体处理单元跨多元化网络分散或以串联(即链)的方式进行安置并且被期望为最优地执行其各自类型的媒体处理的情况下,这种盲处理不能很好地(或根本不能)工作。例如,某一媒体数据可以针对高性能媒体系统进行编码,并且可能必须被转换为适于沿着媒体处理链的移动装置的简化形式。相应地,媒体处理单元可以不必对媒体数据执行已经执行过的处理类型。例如,音量调节单元对输入音频剪辑执行处理,而无论之前是否已经对该输入音频剪辑执行过音量调节。因此,音量调节单元甚至在不必要时执行调节。该不必要的处理还可能在呈现媒体数据中的媒体内容时引起特定特征的劣化和/或去除。在本部分中描述的方法是可以推行的方法,但不一定是之前已经构思或推行的方法。因此,除非另外说明,否则不应当假定在本部分中描述的方法中的任意方法由于被包括在本部分中而仅仅作为现有技术。类似地,除非另有说明,否则在本部分的基础上关于一个或多个方法所确认的问题不应当被假定为已经在任何现有技术中进行确认。
技术实现思路
根据本专利技术的一个方面,提供了一种音频解码方法,包括:通过音频解码器获得经编码的比特流,所述经编码的比特流包括音频数据和信令数据,所述信令数据指示所述经编码的比特流中包括响度值,并且还指示所述经编码的比特流中包括真正的峰数据;通过所述音频解码器从所述经编码的比特流获得所述响度值和所述真正的峰数据;以及通过所述音频解码器响应于所述响度值和所述真正的峰数据来对所述音频数据的响度进行标准化。根据本专利技术的另一个方面,提供了一种音频解码装置,包括:处理器;以及存储器,所述存储器耦接至所述处理器并且被配置成存储指令,所述指令在由所述处理器执行时使所述处理器执行操作,所述操作包括:获得经编码的比特流,所述经编码的比特流包括音频数据和信令数据,所述信令数据指示所述经编码的比特流中包括响度值,并且还指示所述经编码的比特流中包括真正的峰数据;从所述经编码的比特流获得所述响度值和所述真正的峰数据;以及响应于所述响度值和所述真正的峰数据来对所述音频数据的响度进行标准化。根据本专利技术的又一个方面,提供一种包括软件程序的存储介质,所述软件程序适于在处理器上执行,并且适于当在计算装置上被执行时执行根据本专利技术的方法中的任一种方法。根据本专利技术的再一个方面,提供一种用于处理媒体数据的方法,包括:用媒体处理链中的第一装置计算所述媒体数据的源帧的一个或多个数据速率降低表示;以及在与所述媒体数据的源帧相关联的数据块内将所述一个或多个数据速率降低表示同时且安全地携带至所述媒体处理链中的第二装置;其中:所述数据块还包括用凭据信息加密的加密哈希值和所述媒体数据的处理状态元数据;所述加密哈希值取决于所述媒体数据的处理状态元数据和所述媒体数据两者;所述加密哈希值要由所述媒体处理链中的下游的所述第二装置认证;以及所述方法由一个或多个计算装置执行。附图说明在附图的图中作为示例而不是作为限制来示出本专利技术,并且在附图中相似的附图标记表示相似的元素,其中:图1示出根据本专利技术的一些可能实施例的示例性媒体处理链;图2示出根据本专利技术的一些可能实施例的示例性增强型媒体处理链;图3示出根据本专利技术的一些可能实施例的示例性编码器/转码器;图4示出根据本专利技术的一些可能实施例的示例性解码器;图5示出根据本专利技术的一些可能实施例的示例性后处理单元;图6示出根据本专利技术的一些可能实施例的编码器/转码器的示例性实现;图7示出根据本专利技术的一些可能实施例的、基于处理状态元数据中的和/或与处理状态元数据相关联的响度元数据的有效性来控制音量调节单元的操作模式的示例性演变解码器;图8示出根据本专利技术的一些可能实施例的使用数据隐藏来传递媒体处理信息的示例性配置;图9A和图9B示出根据本专利技术的可能实施例的示例性处理流程;图10示出根据本专利技术的可能实施例的可以在其上实现如本文中所描述的计算机或计算装置的示例性硬件平台;图11示出根据示例性实施例的媒体框架,使用该媒体框架可以传输与媒体框架中的媒体数据相关联的处理状态元数据;以及图12A至图12L示出根据本专利技术的一些可能实施例的一些示例性媒体处理节点/装置的框图。具体实施方式在本文中描述与基于媒体数据的媒体处理状态来自适应处理媒体数据有关的示例性可能实施例。在以下的描述中,出于解释的目的,阐明许多具体细节以提供对本专利技术的彻底理解。然而,将明显的是,本专利技术可以在不具有这些具体细节的情况下实践。在其他情况下,不再以详尽的细节来描述已知的结构和装置,以避免不必要地包藏、模糊或混淆本专利技术。在本文中根据以下提纲描述示例性实施例:1.总体概述2.媒体处理链3.媒体处理装置或单元4.媒体数据的示例性自适应处理5.数据隐藏6.示例性处理流程7.实现机构——硬件概述8.列举的示例性实施例9.等同物、扩展、替换及其他1.总体概述此概述呈现本专利技术的可能实施例的一些方面的基本描述。应当注意,此概述并非可能实施例的各方面的广泛或详尽总结。此外,应当注意,此概述并非意在被理解为对可能实施例的任何特别重要的方面或元素进行识别,也不被理解为刻画可能实施例尤其是本专利技术在大体上的任何范围。此概述仅以紧缩和简化的格式示出与示例性可能实施例有关的一些概念,并且应当仅被理解为以下示例性可能实施例的更详细描述的概念性前奏。描述用于基于媒体数据的媒体处理状态来自适应处理媒体数据的技术。在一些可能的实施例中,在增强型媒体处理链中的媒体处理单元被自动启用,以恢复并验证媒体处理信令和/或处理状态元数据、基于媒体处理信令和/或处理状态元数据来确定媒体数据的状态、基于媒体数据的状态来调整它们各自的处理。在增强型媒体处理链中的媒体处理单元可以包括但不限于本文档来自技高网
...

【技术保护点】
1.一种音频解码方法,包括:/n通过音频解码器获得经编码的比特流,所述经编码的比特流包括音频数据和信令数据,所述信令数据指示所述经编码的比特流中包括响度值,并且还指示所述经编码的比特流中包括真正的峰数据;/n通过所述音频解码器从所述经编码的比特流获得所述响度值和所述真正的峰数据;以及/n通过所述音频解码器响应于所述响度值和所述真正的峰数据来对所述音频数据的响度进行标准化。/n

【技术特征摘要】
20101203 US 61/419,747;20111110 US 61/558,2861.一种音频解码方法,包括:
通过音频解码器获得经编码的比特流,所述经编码的比特流包括音频数据和信令数据,所述信令数据指示所述经编码的比特流中包括响度值,并且还指示所述经编码的比特流中包括真正的峰数据;
通过所述音频解码器从所述经编码的比特流获得所述响度值和所述真正的峰数据;以及
通过所述音频解码器响应于所述响度值和所述真正的峰数据来对所述音频数据的响度进行标准化。


2.根据权利要求1所述的音频解码方法,还包括:
根据所述信令数据确定所述音频数据包括对话音频数据以及所述响度值是对话标准化值;以及
根据所述对话标准化值对所述对话音频数据进行标准化。


3.根据权利要求1所述的音频解码方法,其中,所述经编码的比特流包括第一比特流和第二比特流,所述第一比特流包括所述音频数据,所述第二比特流包括所述响度值。


4.一种音频解码装置,包括:
处理器;以及
存储器,所述存储器耦接至所述处理器并且被配置成存储指令,所述指令在由所述处理器执行时使所述处理器执行操作,所述操作包括:
获得经编码的比特流,所述经编码的比特流包括音频数据和信令数据,所述信令数据指示所述经编码的比特流中包括响度值,并且还指示所述经编码的比特流中包括真正的峰数据;
从所述经编码的比特流获得所述响度值和所述真正的峰数据;以及
响应于所述响度值和所述真正的峰数据来对所述音频数据的响度进行标准化。


5.根据权利要求4所述的音频解码装置,还包括:
根据所述信令数据确定所述音频数据包括对话音频数据以及所述响度值是对话标准化值;以及
根据所述对话标准化值对所述对话音频数据进行标准化。


6.根据权利要求4所述的音频解码装置,其中,所述经编码的比特流包括第一比特流和第二比特流,所述第一比特流包括所述音频数据,所述第二比特流包括所述响度值。


7.一种包括软件程序的存储介质,所述软件程序适于在处理器上执行,并且适于当在计算装置上被执行时执行权利要求1至3中任一项所述的方法步骤。


8.一种用于处理媒体数据的方法,包括:
用媒体处理链中的第一装置计算所述媒体数据的源帧的一个或多个数据速率降低表示;以及
在与所述媒体数据的源帧相关联的数据块内将所述一个或多个数据速率降低表示同时且安全地携带至所述媒体处理链中的第二装置;
其中:
所述数据块还包括用凭据信息加密的加密哈希值和所述媒体数据的处理状态元数据;
所述加密哈希值取决于所述媒体数据的处理状态元数据和所述媒体数据两者;
所述加密哈希值要由所述媒体处理链中的下游的所述第二装置认证;以及
所述方法由一...

【专利技术属性】
技术研发人员:杰弗里·里德米勒雷古纳森·拉达克里希南马文·普里巴迪法哈德·法哈尼迈克尔·史密瑟斯
申请(专利权)人:杜比实验室特许公司
类型:发明
国别省市:美国;US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1