音频处理单元以及用于对编码音频比特流进行解码的方法技术

技术编号:22566727 阅读:66 留言:0更新日期:2019-11-16 12:45
本公开涉及音频处理单元以及用于对编码音频比特流进行解码的方法。一种用于包括通过将子流结构元数据(SSM)和/或节目信息元数据(PIM)以及音频数据包括在比特流中来生成编码音频比特流的设备和方法。其他方面是用于对这样的比特流进行解码的设备和方法,以及被配置成(例如,被编程成)执行该方法的任意实施方式或包括存储根据该方法的任意实施方式而生成的音频比特流的至少一个帧的缓冲存储器的音频处理单元(例如,编码器、解码器或后处理器)。

Audio processing unit and method for decoding encoded audio bitstream

The present disclosure relates to an audio processing unit and a method for decoding an encoded audio bitstream. An apparatus and method for generating an encoded audio bitstream including sub stream structure metadata (SSM) and / or program information metadata (PIM) and audio data in the bitstream. Other aspects are devices and methods for decoding such bitstreams, and audio processing units (E. G., encoders, decoders, or post processors) configured (E. G., programmed) to perform any embodiment of the method or include a buffer memory that stores at least one frame of an audio bitstream generated according to any embodiment of the method.

【技术实现步骤摘要】
音频处理单元以及用于对编码音频比特流进行解码的方法本申请是申请日为2013年7月31日、申请号为“201310329128.8”、专利技术名称为“使用节目信息或子流结构元数据的音频编码器和解码器”的专利技术专利申请的分案申请。
本专利技术涉及音频信号处理,以及更具体地,涉及具有指示与由比特流所指示的音频内容有关的子流结构和/或节目信息的元数据的音频数据比特流的编码和解码。本专利技术的一些实施方式以被称为杜比数字(AC-3)、杜比数字+(增强的AC-3或E-AC-3)或杜比E的格式中的一种格式生成或解码音频数据。
技术介绍
杜比、杜比数字、杜比数字+、和杜比E是杜比实验室特许公司的商标。杜比实验室提供分别被称为杜比数字和杜比数字+的AC-3和E-AC-3的专有实现。音频数据处理单元通常以盲方式(blindfashion)操作并且不关注在数据被接收之前发生的音频数据的处理历史。这可以在这样的处理框架中工作:其中单个实体进行各种目标媒体渲染装置的所有的音频数据处理和编码而目标媒体渲染装置进行编码音频数据的所有的解码和渲染。然而,该盲处理在多个音频处理单元跨多样化的网络被散布(scatter)或串联(即,链)放置并且期望它们最佳地执行其相应类型的音频处理的情形下不能很好地(或完全不)工作。例如,一些音频数据可能针对高性能媒体系统被编码,并且可能需要被转换成适合于沿着媒体处理链的移动设备的简化形式。因此,音频处理单元可能不必要地对音频数据执行已经被执行过的类型的处理。例如,音量校平(leveling)单元可能对输入音频片断执行处理,不管以前是否已经对输入音频片断执行了相同的或相似的音量校平。因此,即使当不必要时,音量校平单元也可能执行校平。该不必要的处理还可能导致当渲染音频数据的内容时具体特征的退化和/或消除。
技术实现思路
本专利技术公开了一种音频处理单元,包括:缓冲存储器,其存储编码音频比特流的一部分,其中编码音频比特流被分段成帧,并且至少一个帧包括至少一个帧的元数据段中的节目信息元数据以及至少一个帧的另一个段中的音频数据;以及处理子系统,其耦接至缓冲存储器,其中,处理子系统被配置成对编码音频比特流进行解码,其中,元数据段包括至少一个元数据有效载荷,元数据有效载荷包括:报头;以及在报头之后的,节目信息元数据的至少一部分。本专利技术还公开了一种用于对编码音频比特流进行解码的方法,方法包括以下步骤:接收编码音频比特流;以及从编码音频比特流中提取元数据和音频数据,其中元数据是或包括节目信息元数据,其中,编码音频比特流包括一系列帧并且指示至少一个音频节目,节目信息元数据指示节目,帧中的每个包括至少一个音频数据段,每个音频数据段包括音频数据的至少一部分,帧的至少一个子集中的每个帧包括元数据段,并且每个元数据段包括节目信息元数据的至少一部分。在一类实施方式中,本专利技术是能够对编码比特流进行解码的音频处理单元,该编码比特流包括比特流的至少一个帧的至少一个段中的子流结构元数据和/或节目信息元数据(可选地还包括其他元数据,例如,响度处理状态元数据)以及帧的至少一个其他段中的音频数据。在本文中,子流结构元数据(或“SSM”)表示编码比特流(或编码比特流的集合)的元数据,其指示编码比特流的音频内容的子流结构,并且“节目信息元数据”(或“PIM”)表示编码音频比特流的元数据,其指示至少一个音频节目(例如,两个或更多个音频节目),其中节目信息元数据指示至少一个所述节目的音频内容的至少一个属性或特性(例如,指示对节目的音频数据执行的处理的类型或参数的元数据,或指示节目的哪些通道是活动通道(activechannel)的元数据)。在典型的情况(例如,其中编码比特流为AC-3或E-AC-3比特流)下,节目信息元数据(PIM)指示实际上不能在比特流的其他部分中携带的节目信息。例如,PIM可以指示在编码(例如,AC-3或E-AC-3编码)之前对PCM音频所应用的处理,音频节目的哪些频带已经使用具体的音频编码技术被编码以及用于在比特流中创建动态范围压缩(DRC)数据的压缩配置文件(profile)。在另一类实施方式中,方法包括在比特流的每个帧(或至少一些帧中的每个帧)中将编码音频数据与SSM和/或PIM复用的步骤。在典型的解码中,解码器从比特流中提取SSM和/或PIM(包括通过对SSM和/或PIM以及音频数据进行分析和去复用),并且对音频数据进行处理以生成解码音频数据的流(以及在某些情况下还执行音频数据的自适应处理)。在一些实施方式中,解码音频数据以及SSM和/或PIM从解码器被转发至后处理器,该后处理器被配置成使用SSM和/或PIM对解码音频数据执行自适应处理。在一类实施方式中,本专利技术的编码方法生成包括音频数据段(例如,图4所示的帧的AB0至AB5段或图7所示的帧的段AB0至AB5中的全部或一些)的编码音频比特流(例如,AC-3或E-AC-3比特流),音频数据段包括编码音频数据以及与音频数据段时分复用的元数据段(包括SSM和/或PIM,可选地还包括其他元数据)。在一些实施方式中,每个元数据段(在本文中有时称为“容器”)具有包括元数据段报头(可选地还包括其他强制性的或“核心”元素)、以及在元数据段报头之后的一个或更多个元数据有效载荷。如果存在,SIM被包括在元数据有效载荷之一中(由有效载荷报头标识,并且通常具有第一类型的格式)。如果存在,PIM被包括在元数据有效载荷中的另一个中(由有效载荷报头标识,并且通常具有第二类型的格式)。类似地,元数据的每个其他类型(如果存在)被包括在元数据有效载荷中的另一个中(由有效载荷报头标识,并且通常具有特定于元数据的类型的格式)。示例性格式允许在除了比特流的解码期间之外的时间(例如,由解码之后的后处理器,或由被配置成在不执行对编码比特流的完全解码的情况下识别元数据的处理器)对SSM、PIM或其他元数据的方便的访问,并且允许在比特流的解码期间(例如,子流识别的)方便的和高效的误差检测和校正。例如,在不以示例性格式访问SSM的情况下,解码器可能错误地识别与节目相关联的子流的正确数量。元数据段中的一个元数据有效载荷可以包括SSM,元数据段中的另一元数据有效载荷可以包括PIM,并且可选地,元数据段中的至少一个其他元数据有效载荷可以包括其他元数据(例如,响度处理状态元数据或“LPSM”)。附图说明图1是可以被配置成执行本专利技术的方法的实施方式的系统的实施方式的框图。图2是作为本专利技术的音频处理单元的实施方式的编码器的框图。图3是作为本专利技术的音频处理单元的实施方式的解码器以及作为本专利技术的音频处理单元的另一实施方式的耦接至解码器的后处理器的框图。图4是包括被划分成的段的AC-3帧的图。图5是包括被划分成的段的AC-3帧的同步信息(SI)段的图。图6是包括被划分成的段的AC-3帧的比特流信息(BSI)段的图。图7是包括被划分成的段的E-AC-3帧的图。图8是根据本专利技术的实施方式生成的包括元数据段报头的编码比特流的元数据段的图,元数据段报头包括容器同步字本文档来自技高网
...

【技术保护点】
1.一种音频处理单元,包括:/n缓冲存储器,其存储编码音频比特流的一部分,其中所述编码音频比特流被分段成帧,并且至少一个帧包括所述至少一个帧的元数据段中的节目信息元数据以及所述至少一个帧的另一个段中的音频数据;以及/n处理子系统,其耦接至所述缓冲存储器,其中,所述处理子系统被配置成对所述编码音频比特流进行解码,/n其中,所述元数据段包括至少一个元数据有效载荷,所述元数据有效载荷包括:/n报头;以及/n在所述报头之后的,所述节目信息元数据的至少一部分。/n

【技术特征摘要】
20130619 US 61/836,8651.一种音频处理单元,包括:
缓冲存储器,其存储编码音频比特流的一部分,其中所述编码音频比特流被分段成帧,并且至少一个帧包括所述至少一个帧的元数据段中的节目信息元数据以及所述至少一个帧的另一个段中的音频数据;以及
处理子系统,其耦接至所述缓冲存储器,其中,所述处理子系统被配置成对所述编码音频比特流进行解码,
其中,所述元数据段包括至少一个元数据有效载荷,所述元数据有效载荷包括:
报头;以及
在所述报头之后的,所述节目信息元数据的至少一部分。


2.根据权利要求1所述的音频处理单元,其中,所述编码音频比特流指示至少一个音频节目,并且所述元数据段包括节目信息元数据有效载荷,所述节目信息元数据有效载荷包括:
节目信息元数据报头;以及
在所述节目信息元数据报头之后的,指示所述节目的音频内容的至少一个属性或特性的节目信息元数据,所述节目信息元数据包括指示所述节目的每个非静音通道和每个静音通道的活动通道元数据。


3.根据权利要求2所述的音频处理单元,其中,所述节目信息元数据还包括下列中的至少一个:
下混合处理状态元数据,其指示:所述节目是否是下混合过的,以及在所述节目是下混合过的情况下应用于所述节目的下混合的类型;
上混合处理状态元数据,其指示:所述节目是否是上混合过的,以及在所述节目是上混合过的情况下应用于所述节目的上混合的类型;
预处理状态元数据,其指示:是否对所述帧的音频内容执行了预处理,以及在对所述帧的音频内容执行了预处理的情况下对所述音频内容执行的预处理的类型;或
谱扩展处理或通道耦合元数据,其指示:是否对所述节目应用了谱扩展处理或通道耦合,以及在对所述节目应用了谱扩展处理或通道耦合的情况下应用谱扩展或通道耦合的频率范围。


4.根据权利要求1所述的音频处理单元,其中,所述元数据段包括:
元数据段报头;
在所述元数据段报头之后的至少一个保护值,其用于所述节目信息元数据、或所述子流结构元数据、或与所述节目信息元数据或所述子流结构元数据相对应...

【专利技术属性】
技术研发人员:杰弗里·里德米勒迈克尔·沃德
申请(专利权)人:杜比实验室特许公司
类型:发明
国别省市:美国;US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利