An audio bit stream with enhanced band replication metadata is disclosed. The embodiment relates to an audio processing unit, including a buffer, a bit stream payload deformationer and a decoding subsystem. Buffer stores at least one block of coded audio bitstream. Blocks include padding elements that begin with identifiers followed by padding data. The padding data includes at least one flag that identifies whether enhanced spectral band replication (eSBR) processing is performed on the audio content of the block. A corresponding method for decoding coded audio bitstream is also provided.
【技术实现步骤摘要】
解码具有增强的频谱带复制元数据的音频位流本申请是申请号为201680015399.8,申请日为2016年3月10日,题为“解码在至少一个填充元素中具有增强的频谱带复制元数据的音频位流”的中国专利技术专利申请的分案申请。
本专利技术涉及音频信号处理。一些实施例涉及包括用于控制增强的频谱带复制(eSBR)的元数据的音频位流(例如,具有MPEG-4AAC格式的位流)的编码和解码。其它实施例涉及通过不被配置为执行eSBR处理并且忽略这种元数据的传统解码器对这种位流进行解码,或者通过响应于位流生成eSBR控制数据来对不包括这种元数据的音频位流进行解码。
技术介绍
典型的音频位流包括指示音频内容的一个或多个声道(channel)的音频数据(例如,编码的音频数据)以及指示音频数据或音频内容的至少一个特性的元数据两者。用于生成编码音频位流的一种众所周知的格式是在MPEG标准ISO/IEC14496-3:2009中描述的MPEG-4高级音频编码(AAC)格式。在MPEG-4标准中,AAC表示“高级音频编码”,而HE-AAC表示“高效高级音频编码”。MPEG-4AAC标准定义了几个音频规范(profile),这几个音频规范确定在适用的(complaint)编码器或解码器中存在哪些对象和编码工具。这些音频规范中的三个是(1)AAC规范,(2)HE-AAC规范,和(3)HE-AACv2规范。AAC规范包括AAC低复杂度(或“AAC-LC”)对象类型。AAC-LC对象是MPEG-2AAC低复杂度规范的对应物,有一些调整,并且既不包括频谱带复制(“SBR”)对象类型也不包括参数化立体 ...
【技术保护点】
1.一种音频处理单元(210),包括:位流有效载荷去格式化器(215),被配置为对编码音频位流的块进行解复用;解码子系统(202),耦合到位流有效载荷去格式化器(215)并且被配置为对编码音频位流的块的至少一部分进行解码,其中编码音频位流的块包括:填充元素,具有指示填充元素的开始的标识符以及在该标识符之后的填充数据,其中填充数据包括:至少一个标志,识别是否要对编码音频位流的块的音频内容执行增强的频谱带复制处理,以及增强的频谱带复制元数据,该增强的频谱带复制元数据不包括用于频谱修补和谐波转置两者的一个或多个参数,其中增强的频谱带复制元数据是被配置为启用在MPEG USAC标准中描述或提及而未在MPEG‑4 AAC标准中描述或提及的至少一个eSBR工具的元数据,其中,解码子系统(202)进一步被配置为在所述至少一个标志的值识别要执行增强的频谱带复制处理的情况下执行谐波转置。
【技术特征摘要】
2015.03.13 EP 15159067.6;2015.03.16 US 62/133,8001.一种音频处理单元(210),包括:位流有效载荷去格式化器(215),被配置为对编码音频位流的块进行解复用;解码子系统(202),耦合到位流有效载荷去格式化器(215)并且被配置为对编码音频位流的块的至少一部分进行解码,其中编码音频位流的块包括:填充元素,具有指示填充元素的开始的标识符以及在该标识符之后的填充数据,其中填充数据包括:至少一个标志,识别是否要对编码音频位流的块的音频内容执行增强的频谱带复制处理,以及增强的频谱带复制元数据,该增强的频谱带复制元数据不包括用于频谱修补和谐波转置两者的一个或多个参数,其中增强的频谱带复制元数据是被配置为启用在MPEGUSAC标准中描述或提及而未在MPEG-4AAC标准中描述或提及的至少一个eSBR工具的元数据,其中,解码子系统(202)进一步被配置为在所述至少一个标志的值识别要执行增强的频谱带复制处理的情况下执行谐波转置。2.如权利要求1所述的音频处理单元,其中编码音频位流是MPEG-4AAC位流。3.如权利要求1或权利要求2所述的音频处理单元,其中标识符是具有值0x6的首先发送最高有效位的三位无符号整数。4.如权利要求1或权利要求2所述的音频处理单元,其中填充数据包括扩展有效载荷,扩展有效载荷包括频谱带复制扩展数据,并且扩展有效载荷用具有值‘1101’或‘1110’的首先发送最高有效位的四位无符号整数识别,并且,其中频谱带复制扩展数据包括:频谱带复制报头,报头之后的频谱带复制数据,以及频谱带复制数据之后的频谱带复制扩展元素,并且其中标志被包括在频谱...
【专利技术属性】
技术研发人员:L·维尔莫斯,H·普恩哈根,P·埃斯特兰德,
申请(专利权)人:杜比国际公司,
类型:发明
国别省市:荷兰,NL
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。