音频处理单元以及对编码音频比特流进行解码的方法技术

技术编号:14354909 阅读:95 留言:0更新日期:2017-01-08 22:10
音频处理单元以及对编码音频比特流进行解码的方法。该音频处理单元包括:缓冲存储器;以及处理子系统,其耦接至缓冲存储器,其中缓冲存储器存储编码音频比特流的帧,该帧包括在该帧的保留字段的元数据段中的节目信息元数据或子流结构元数据以及在该帧的其他段中的音频数据,其中处理子系统使用比特流的元数据执行比特流的生成、音频数据的解码或音频数据的自适应处理,或使用比特流的元数据执行比特流的音频数据或元数据的认证或验证,其中,元数据段包括元数据有效载荷,元数据有效载荷包括:报头;以及在报头之后的,节目信息元数据或子流结构元数据,并且保留字段选自由跳过字段、addbsi字段、辅助数据字段、或其组合构成的组。

【技术实现步骤摘要】
本申请是申请日为2014年6月12日、申请号为“201480008799.7”、专利技术名称为“使用节目信息或子流结构元数据的音频编码器和解码器”的专利技术专利申请的分案申请。相关申请的交叉引用本申请要求在2013年6月19日提交的美国临时专利申请61/836,865号的优先权,其全部内容通过引用合并于此。
本专利技术涉及音频信号处理,以及更具体地,涉及具有指示与由比特流所指示的音频内容有关的子流结构和/或节目信息的元数据的音频数据比特流的编码和解码。本专利技术的一些实施方式以被称为杜比数字(AC-3)、杜比数字+(增强的AC-3或E-AC-3)或杜比E的格式中的一种格式生成或解码音频数据。
技术介绍
杜比、杜比数字、杜比数字+、和杜比E是杜比实验室特许公司的商标。杜比实验室提供分别被称为杜比数字和杜比数字+的AC-3和E-AC-3的专有实现。音频数据处理单元通常以盲方式(blindfashion)操作并且不关注在数据被接收之前发生的音频数据的处理历史。这可以在这样的处理框架中工作:其中单个实体进行各种目标媒体渲染装置的所有的音频数据处理和编码而目标媒体渲染装置进行编码音频数据的所有的解码和渲染。然而,该盲处理在多个音频处理单元跨多样化的网络被散布(scatter)或串联(即,链)放置并且期望它们最佳地执行其相应类型的音频处理的情形下不能很好地(或完全不)工作。例如,一些音频数据可能针对高性能媒体系统被编码,并且可能需要被转换成适合于沿着媒体处理链的移动设备的简化形式。因此,音频处理单元可能不必要地对音频数据执行已经被执行过的类型的处理。例如,音量校平(leveling)单元可能对输入音频片断执行处理,不管以前是否已经对输入音频片断执行了相同的或相似的音量校平。因此,即使当不必要时,音量校平单元也可能执行校平。该不必要的处理还可能导致当渲染音频数据的内容时具体特征的退化和/或消除。
技术实现思路
在一类实施方式中,本专利技术是能够对编码比特流进行解码的音频处理单元,该编码比特流包括比特流的至少一个帧的至少一个段中的子流结构元数据和/或节目信息元数据(可选地还包括其他元数据,例如,响度处理状态元数据)以及帧的至少一个其他段中的音频数据。在本文中,子流结构元数据(或“SSM”)表示编码比特流(或编码比特流的集合)的元数据,其指示编码比特流的音频内容的子流结构,并且“节目信息元数据”(或“PIM”)表示编码音频比特流的元数据,其指示至少一个音频节目(例如,两个或更多个音频节目),其中节目信息元数据指示至少一个所述节目的音频内容的至少一个属性或特性(例如,指示对节目的音频数据执行的处理的类型或参数的元数据,或指示节目的哪些通道是活动通道(activechannel)的元数据)。在典型的情况(例如,其中编码比特流为AC-3或E-AC-3比特流)下,节目信息元数据(PIM)指示实际上不能在比特流的其他部分中携带的节目信息。例如,PIM可以指示在编码(例如,AC-3或E-AC-3编码)之前对PCM音频所应用的处理,音频节目的哪些频带已经使用具体的音频编码技术被编码以及用于在比特流中创建动态范围压缩(DRC)数据的压缩简档(profile)。在另一类实施方式中,方法包括在比特流的每个帧(或至少一些帧中的每个帧)中将编码音频数据与SSM和/或PIM复用的步骤。在典型的解码中,解码器从比特流中提取SSM和/或PIM(包括通过对SSM和/或PIM以及音频数据进行分析和去复用),并且对音频数据进行处理以生成解码音频数据的流(以及在某些情况下还执行音频数据的自适应处理)。在一些实施方式中,解码音频数据以及SSM和/或PIM从解码器被转发至后处理器,该后处理器被配置成使用SSM和/或PIM对解码音频数据执行自适应处理。在一类实施方式中,本专利技术的编码方法生成包括音频数据段(例如,图4所示的帧的AB0至AB5段或图7所示的帧的段AB0至AB5中的全部或一些)的编码音频比特流(例如,AC-3或E-AC-3比特流),音频数据段包括编码音频数据以及与音频数据段时分复用的元数据段(包括SSM和/或PIM,可选地还包括其他元数据)。在一些实施方式中,每个元数据段(在本文中有时称为“容器”)具有包括元数据段报头(可选地还包括其他强制性的或“核心”元素)、以及在元数据段报头之后的一个或更多个元数据有效载荷。如果存在,SIM被包括在元数据有效载荷之一中(由有效载荷报头标识,并且通常具有第一类型的格式)。如果存在,PIM被包括在元数据有效载荷中的另一个中(由有效载荷报头标识,并且通常具有第二类型的格式)。类似地,元数据的每个其他类型(如果存在)被包括在元数据有效载荷中的另一个中(由有效载荷报头标识,并且通常具有特定于元数据的类型的格式)。示例性格式允许在除了比特流的解码期间之外的时间(例如,由解码之后的后处理器,或由被配置成在不执行对编码比特流的完全解码的情况下识别元数据的处理器)对SSM、PIM或其他元数据的方便的访问,并且允许在比特流的解码期间(例如,子流识别的)方便的和高效的误差检测和校正。例如,在不以示例性格式访问SSM的情况下,解码器可能错误地识别与节目相关联的子流的正确数量。元数据段中的一个元数据有效载荷可以包括SSM,元数据段中的另一元数据有效载荷可以包括PIM,并且可选地,元数据段中的至少一个其他元数据有效载荷可以包括其他元数据(例如,响度处理状态元数据或“LPSM”)。根据一个实施例,提供一种音频处理单元,其包括:缓冲存储器;以及至少一个处理子系统,其耦接至缓冲存储器,其中缓冲存储器存储编码音频比特流的至少一个帧,帧包括在帧的至少一个保留字段的至少一个元数据段中的节目信息元数据或子流结构元数据以及在帧的至少一个其他段中的音频数据,其中处理子系统被耦接并且被配置成使用比特流的元数据执行比特流的生成、音频数据的解码或音频数据的自适应处理中的至少一种,或使用比特流的元数据执行比特流的音频数据或元数据中至少之一的认证或验证中的至少一种。其中,元数据段包括至少一个元数据有效载荷,元数据有效载荷包括:报头;以及在报头之后的,节目信息元数据的至少一部分或子流结构元数据的至少一部分。并且其中,保留字段选自由跳过字段、addbsi字段、辅助数据字段或其组合构成的组。根据另一个实施例,提供一种用于对编码音频比特流进行解码的方法,该方法包括以下步骤:接收包括元数据和音频数据的编码音频比特流;以及从编码音频比特流中提取元数据或音频数据,其中元数据是或包括节目信息元数据或子流结构元数据。其中,编码音频比特流包括一系列帧并且指示至少一个音频节目,节目信息元数据和子流结构元数据指示节目,帧中的每个包括至少一个音频数据段,每个音频数据段包括音频数据的至少一部分,帧的至少一个子集中的每个帧包括元数据段,并且每个元数据段包括节目信息元数据的至少一部分以及子流结构元数据的至少一部分,其中,元数据段位于保留字段中,保留字段选自由跳过字段、addbsi字段、辅助数据字段或其组合构成的组。附图说明图1是可以被配置成执行本专利技术的方法的实施方式的系统的实施方式的框图。图2是作为本专利技术的音频处理单元的实施方式的编码器的框图。图3是作为本专利技术的音频处理单元的实施方式的解码器本文档来自技高网
...
<a href="http://www.xjishu.com/zhuanli/21/201610645174.html" title="音频处理单元以及对编码音频比特流进行解码的方法原文来自X技术">音频处理单元以及对编码音频比特流进行解码的方法</a>

【技术保护点】
一种音频处理单元,包括:缓冲存储器;以及至少一个处理子系统,其耦接至所述缓冲存储器,其中所述缓冲存储器存储编码音频比特流的至少一个帧,所述帧包括在所述帧的至少一个保留字段的至少一个元数据段中的节目信息元数据或子流结构元数据以及在所述帧的至少一个其他段中的音频数据,其中所述处理子系统被耦接并且被配置成使用所述比特流的元数据执行所述比特流的生成、所述音频数据的解码或音频数据的自适应处理中的至少一种,或使用所述比特流的元数据执行所述比特流的音频数据或元数据中至少之一的认证或验证中的至少一种,其中,所述元数据段包括至少一个元数据有效载荷,所述元数据有效载荷包括:报头;以及在所述报头之后的,所述节目信息元数据的至少一部分或所述子流结构元数据的至少一部分,并且其中,所述保留字段选自由跳过字段、addbsi字段、辅助数据字段或其组合构成的组。

【技术特征摘要】
2013.06.19 US 61/836,8651.一种音频处理单元,包括:缓冲存储器;以及至少一个处理子系统,其耦接至所述缓冲存储器,其中所述缓冲存储器存储编码音频比特流的至少一个帧,所述帧包括在所述帧的至少一个保留字段的至少一个元数据段中的节目信息元数据或子流结构元数据以及在所述帧的至少一个其他段中的音频数据,其中所述处理子系统被耦接并且被配置成使用所述比特流的元数据执行所述比特流的生成、所述音频数据的解码或音频数据的自适应处理中的至少一种,或使用所述比特流的元数据执行所述比特流的音频数据或元数据中至少之一的认证或验证中的至少一种,其中,所述元数据段包括至少一个元数据有效载荷,所述元数据有效载荷包括:报头;以及在所述报头之后的,所述节目信息元数据的至少一部分或所述子流结构元数据的至少一部分,并且其中,所述保留字段选自由跳过字段、addbsi字段、辅助数据字段或其组合构成的组。2.根据权利要求1所述的音频处理单元,其中,所述编码音频比特流指示至少一个音频节目,并且所述元数据段包括节目信息元数据有效载荷,所述节目信息元数据有效载荷包括:节目信息元数据报头;以及在所述节目信息元数据报头之后的,指示所述节目的音频内容的至少一个属性或特性的节目信息元数据,所述节目信息元数据包括指示所述节目的每个非静音通道和每个静音通道的活动通道元数据。3.根据权利要求2所述的音频处理单元,其中,所述节目信息元数据还包括下列元数据中的至少之一:下混合处理状态元数据,其指示:所述节目是否是下混合过的,以及在所述节目是下混合过的情况下应用于所述节目的下混合的类型;上混合处理状态元数据,其指示:所述节目是否是上混合过的,以及在所述节目是上混合过的情况下应用于所述节目的上混合的类型;预处理状态元数据,其指示:是否对所述帧的音频内容执行了预处理,以及在对所述帧的音频内容执行了预处理的情况下对所述音频内容执行的预处理的类型;或谱扩展处理或通道耦合元数据,其指示:是否对所述节目应用了谱扩展处理或通道耦合,以及在对所述节目应用了谱扩展处理或通道耦合的情况下应用所述谱扩展或通道耦合的频率范围。4.根据权利要求1所述的音频处理单元,其中,所述编码音频比特流指示具有音频内容的至少一个独立子流的至少一个音频节目,而所述元数据段包括子流结构元数据有效载荷,所述子流结构元数据有效载荷包括:子流结构元数据有效载荷报头;以及在所述子流结构元数据有效载荷报头之后的,指示所述节目的独立子流的数量的独立子流元数据,以及指示所述节目的每个独立子流是否具有至少一个相关联的从属子流的从属子流元数据。5.根据权利要求1所述的音频处理单元,其中,所述元数据段包括:元数据段报头;在所述元数据段报头之后的至少一个保护值,其用于所述节目信息元数据、或所述子流结构元数据、或与所述节目信息元数据或所述子流结构元数据相对应的所述音频数据中至少之一的解密、认证或验证中的至少一种;以及在所述元数据段报头之后的元数据有效载荷标识值和有效载荷配置值,其中所述元数据有效载荷在所述元数据有效载荷标识值和所述有效载荷配置值之后。6.根据权利要求5所述的音频处理单元,其中,所述元数据段报头包括标识所述元数据段的开始的同步字、以及在所述同步字之后的至少一个标识值,并且所述元数据有效载荷的所述报头包括至少一个标识值。7.根据权利要求1所述的音频处理单元,其中,所述编码音频比特流为AC-3比特流或E-AC-3比特流。8.根据权利要求1所述的音频处理单元,其中,所述缓冲存储器以非暂态方式存储所述帧。9.根据权利要求1所述的音频处理单元,其中,所述音频处理单元为编码器。10.根据权利要求9所述的音频处理单元,其中,所述处理子系统包括:解码子系统,其被配置成接收输入音频比特流并且从所述输入音频比特流中提取输入元数据和输入音...

【专利技术属性】
技术研发人员:杰弗里·里德米勒迈克尔·沃德
申请(专利权)人:杜比实验室特许公司
类型:发明
国别省市:美国;US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1