解码具有增强的频谱带复制元数据的音频位流制造技术

技术编号:20656090 阅读:23 留言:0更新日期:2019-03-23 07:37
公开了解码具有增强的频谱带复制元数据的音频位流。实施例涉及一种音频处理单元,包括缓冲器、位流有效载荷去格式化器和解码子系统。缓冲器存储编码音频位流的至少一个块。块包括以标识符开始、后面跟着填充数据的填充元素。填充数据包括识别是否对块的音频内容执行增强的频谱带复制(eSBR)处理的至少一个标志。还提供了用于对编码音频位流进行解码的对应方法。

Decoding Audio Bit Stream with Enhanced Spectral Band Replication Metadata

An audio bit stream with enhanced band replication metadata is disclosed. The embodiment relates to an audio processing unit, including a buffer, a bit stream payload deformationer and a decoding subsystem. Buffer stores at least one block of coded audio bitstream. Blocks include padding elements that begin with identifiers followed by padding data. The padding data includes at least one flag that identifies whether enhanced spectral band replication (eSBR) processing is performed on the audio content of the block. A corresponding method for decoding coded audio bitstream is also provided.

【技术实现步骤摘要】
解码具有增强的频谱带复制元数据的音频位流本申请是申请号为201680015399.8,申请日为2016年3月10日,题为“解码在至少一个填充元素中具有增强的频谱带复制元数据的音频位流”的中国专利技术专利申请的分案申请。
本专利技术涉及音频信号处理。一些实施例涉及包括用于控制增强的频谱带复制(eSBR)的元数据的音频位流(例如,具有MPEG-4AAC格式的位流)的编码和解码。其它实施例涉及通过不被配置为执行eSBR处理并且忽略这种元数据的传统解码器对这种位流进行解码,或者通过响应于位流生成eSBR控制数据来对不包括这种元数据的音频位流进行解码。
技术介绍
典型的音频位流包括指示音频内容的一个或多个声道(channel)的音频数据(例如,编码的音频数据)以及指示音频数据或音频内容的至少一个特性的元数据两者。用于生成编码音频位流的一种众所周知的格式是在MPEG标准ISO/IEC14496-3:2009中描述的MPEG-4高级音频编码(AAC)格式。在MPEG-4标准中,AAC表示“高级音频编码”,而HE-AAC表示“高效高级音频编码”。MPEG-4AAC标准定义了几个音频规范(profile),这几个音频规范确定在适用的(complaint)编码器或解码器中存在哪些对象和编码工具。这些音频规范中的三个是(1)AAC规范,(2)HE-AAC规范,和(3)HE-AACv2规范。AAC规范包括AAC低复杂度(或“AAC-LC”)对象类型。AAC-LC对象是MPEG-2AAC低复杂度规范的对应物,有一些调整,并且既不包括频谱带复制(“SBR”)对象类型也不包括参数化立体声(“PS”)对象类型。HE-AAC规范是AAC规范的超集(superset)并且还包括SBR对象类型。HE-AACv2规范是HE-AAC规范的超集,并且还包括PS对象类型。SBR对象类型包含频谱带复制工具,这是重要的编码工具,该编码工具显著提高感知音频编解码器的压缩效率。SBR在接收器侧(例如,在解码器中)重建音频信号的高频分量。因此,编码器只需要编码和发送低频分量,从而允许在低数据速率下的、高得多的音频质量。根据从编码器获得的控制数据和可用的带宽受限信号,SBR基于先前被截短以便减小数据速率的谐波序列的复制。音调与类噪声(noise-like)分量之间的比通过自适应逆滤波以及噪声和正弦波的可选添加来维持。在MPEG-4AAC标准中,SBR工具执行频谱修补,其中将数个邻接的正交镜像滤波器(QMF)子带从音频信号的所发送低频带部分复制到在解码器中生成的音频信号的高频带部分。对于某些音频类型,诸如具有相对低交叉频率的音乐内容,频谱修补可能不是理想的。因此,需要改进频谱带复制的技术。
技术实现思路
第一类实施例涉及包括存储器、位流有效载荷去格式化器和解码子系统的音频处理单元。存储器被配置为存储编码音频位流(例如,MPEG-4AAC位流)的至少一个块。位流有效载荷去格式化器被配置为对编码音频块进行解复用。解码子系统被配置为对编码音频块的音频内容进行解码。编码音频块包括具有指示填充元素的开始的标识符以及标识符之后的填充数据的填充元素。填充数据包括识别是否要对编码音频块的音频内容执行增强的频谱带复制(eSBR)处理的至少一个标志。第二类实施例涉及用于对编码音频位流进行解码的方法。该方法包括接收编码音频位流的至少一个块、对编码音频位流的至少一个块的至少一些部分进行解复用,以及对编码音频位流的至少一个块的至少一些部分进行解码。编码音频位流的至少一个块包括具有指示填充元素的开始的标识符以及标识符之后的填充数据的填充元素。填充数据包括识别是否要对编码音频位流的至少一个音频块的音频内容执行增强的频谱带复制(eSBR)处理的至少一个标志。其它类的实施例涉及编码和转码包含元数据的音频位流,该元数据识别是否要执行增强的频谱带复制(eSBR)处理。附图说明图1是可以被配置为执行本专利技术性方法的实施例的系统的实施例的框图。图2是作为本专利技术性音频处理单元的实施例的编码器的框图。图3是包括作为本专利技术性音频处理单元的实施例的解码器以及可选地还有耦合到其的后处理器的系统的框图。图4是作为本专利技术性音频处理单元的实施例的解码器的框图。图5是作为本专利技术性音频处理单元的另一实施例的解码器的框图。图6是本专利技术性音频处理单元的另一实施例的框图。图7是MPEG-4AAC位流的块的图,包括它被划分成的段。符号和命名贯穿本公开,包括在权利要求中,“对”信号或数据执行操作(例如,对信号或数据进行滤波、缩放、变换或应用增益)的表达在广义上用来表示直接对信号或数据、或者对信号或数据的处理版本(例如,对于在执行操作之前已经经历了初步滤波或预处理的信号的版本)执行操作。贯穿本公开,包括在权利要求中,表达“音频处理单元”在广义上用来表示被配置为处理音频数据的系统、设备或装置。音频处理单元的示例包括但不限于编码器(例如,转码器)、解码器、编解码器、预处理系统、后处理系统和位流处理系统(有时称为位流处理工具)。几乎所有的消费者电子器件(诸如手机、电视机、笔记本电脑和平板电脑)包含音频处理单元。贯穿本公开,包括在权利要求中,术语“耦合”或“耦合的”在广义上用来意指或者直接或者间接连接。因此,如果第一设备耦合到第二设备,则那个连接可以通过直接连接,或者通过经由其它设备和连接的间接连接。而且,集成到其它部件中或与其它部件集成的部件也彼此耦合。具体实施方式MPEG-4AAC标准设想编码的MPEG-4AAC位流包括指示要由解码器应用以解码位流的音频内容的每种类型的SBR处理(如果任何一个要被应用的话)、和/或控制这种SBR处理、和/或指示要被采用以对位流的音频内容进行解码的至少一个SBR工具的至少一个特性或参数的元数据。在本文,我们使用表达“SBR元数据”来表示在MPEG-4AAC标准中描述或提及的这种类型的元数据。MPEG-4AAC位流的顶层是数据块(“raw_data_block”元素)的序列,数据块中的每个是包含音频数据(通常是针对1024或960个采样的时间段)和相关信息和/或其它数据的数据段(本文称为“块”)。在本文中,我们使用术语“块”来表示包括音频数据(以及对应的元数据以及可选地还有其它相关数据)的MPEG-4AAC位流的段,该块确定或指示一个(但不多于一个)“raw_data_block“元素。MPEG-4AAC位流的每个块可以包括数个句法元素(句法元素中的每个也在位流中作为数据段实现)。在MPEG-4AAC标准中定义了七个类型的这种句法元素。每个句法元素由数据元素“id_syn_ele”的不同值识别。句法元素的示例包括“single_channel_element()”、“channel_pair_element()”和“fill_element()”。单个声道元素是包括单个音频声道的音频数据(单声道音频信号)的容器。声道对元素包括两个音频声道的音频数据(即,立体声音频信号)。填充元素是包括标识符(例如,上述元素“id_syn_ele”的值)后面跟着数据(其被称为“填充数据”)的信息的容器。填充元素历来被用于调整要通过恒定速率信道发送的位流的瞬时位速率。通过向每个块添加适量的填充数据,可以实现恒定的数据速率。根据本文档来自技高网
...

【技术保护点】
1.一种音频处理单元(210),包括:位流有效载荷去格式化器(215),被配置为对编码音频位流的块进行解复用;解码子系统(202),耦合到位流有效载荷去格式化器(215)并且被配置为对编码音频位流的块的至少一部分进行解码,其中编码音频位流的块包括:填充元素,具有指示填充元素的开始的标识符以及在该标识符之后的填充数据,其中填充数据包括:至少一个标志,识别是否要对编码音频位流的块的音频内容执行增强的频谱带复制处理,以及增强的频谱带复制元数据,该增强的频谱带复制元数据不包括用于频谱修补和谐波转置两者的一个或多个参数,其中增强的频谱带复制元数据是被配置为启用在MPEG USAC标准中描述或提及而未在MPEG‑4 AAC标准中描述或提及的至少一个eSBR工具的元数据,其中,解码子系统(202)进一步被配置为在所述至少一个标志的值识别要执行增强的频谱带复制处理的情况下执行谐波转置。

【技术特征摘要】
2015.03.13 EP 15159067.6;2015.03.16 US 62/133,8001.一种音频处理单元(210),包括:位流有效载荷去格式化器(215),被配置为对编码音频位流的块进行解复用;解码子系统(202),耦合到位流有效载荷去格式化器(215)并且被配置为对编码音频位流的块的至少一部分进行解码,其中编码音频位流的块包括:填充元素,具有指示填充元素的开始的标识符以及在该标识符之后的填充数据,其中填充数据包括:至少一个标志,识别是否要对编码音频位流的块的音频内容执行增强的频谱带复制处理,以及增强的频谱带复制元数据,该增强的频谱带复制元数据不包括用于频谱修补和谐波转置两者的一个或多个参数,其中增强的频谱带复制元数据是被配置为启用在MPEGUSAC标准中描述或提及而未在MPEG-4AAC标准中描述或提及的至少一个eSBR工具的元数据,其中,解码子系统(202)进一步被配置为在所述至少一个标志的值识别要执行增强的频谱带复制处理的情况下执行谐波转置。2.如权利要求1所述的音频处理单元,其中编码音频位流是MPEG-4AAC位流。3.如权利要求1或权利要求2所述的音频处理单元,其中标识符是具有值0x6的首先发送最高有效位的三位无符号整数。4.如权利要求1或权利要求2所述的音频处理单元,其中填充数据包括扩展有效载荷,扩展有效载荷包括频谱带复制扩展数据,并且扩展有效载荷用具有值‘1101’或‘1110’的首先发送最高有效位的四位无符号整数识别,并且,其中频谱带复制扩展数据包括:频谱带复制报头,报头之后的频谱带复制数据,以及频谱带复制数据之后的频谱带复制扩展元素,并且其中标志被包括在频谱...

【专利技术属性】
技术研发人员:L·维尔莫斯H·普恩哈根P·埃斯特兰德
申请(专利权)人:杜比国际公司
类型:发明
国别省市:荷兰,NL

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1