用于音频信号的高频重建的谐波转置器的后向兼容集成制造技术

技术编号:21976613 阅读:11 留言:0更新日期:2019-08-28 02:36
本发明专利技术揭示一种用于解码经编码音频位流的方法。所述方法包含接收所述经编码音频位流,及解码音频数据以产生经解码低带音频信号。所述方法进一步包含提取高频重建元数据,及使用分析滤波器组对所述经解码低带音频信号进行滤波以产生经滤波低带音频信号。所述方法还包含提取指示将对所述音频数据执行频谱变换还是谐波转置的旗标,及根据所述旗标使用所述经滤波低带音频信号及所述高频重建元数据再生所述音频信号的高带部分。

Backward Compatible Integration of Harmonic Inverter for High Frequency Reconstruction of Audio Signals

【技术实现步骤摘要】
【国外来华专利技术】用于音频信号的高频重建的谐波转置器的后向兼容集成
实施例涉及音频信号处理,且更具体来说,实施例涉及音频位流的编码、解码或转码,其中控制数据指定将对音频数据执行高频重建(“HFR”)的基础形式或HFR的增强形式。
技术介绍
典型音频位流包含指示音频内容的一或多个通道的音频数据(例如,经编码音频数据)及指示音频数据或音频内容的至少一个特性的元数据两者。用于产生经编码音频位流的一个熟知格式是MPEG标准ISO/IEC14496-3:2009中所描述的MPEG-4高级音频译码(AAC)格式。在MPEG-4标准中,AAC表示“高级音频译码”且HE-AAC表示“高效高级音频译码”。MPEG-4AAC标准定义若干音频配置文件,其确定哪些对象及译码工具存在于合规编码器或解码器中。这些音频配置文件中的三者是(1)AAC配置文件、(2)HE-AAC配置文件,及(3)HE-AACv2配置文件。AAC配置文件包含AAC低复杂性(或“AAC-LC”)对象类型。AAC-LC对象是MPEG-2AAC低复杂性配置文件的对应物,具有一些调整,且既不包含频谱带复制(“SBR”)对象类型,又不包含参数立体声(“PS”)对象类型。HE-AAC配置文件是AAC配置文件的超集且另外包含SBR对象类型。HE-AACv2配置文件是HE-AAC配置文件的超集且另外包含PS对象类型。SBR对象类型含有频谱带复制工具,其是显著改进感知音频编解码器的压缩效率的重要高频重建(“HFR”)译码工具。SBR在接收器侧上(例如,在解码器中)重建音频信号的高频分量。因此,编码器需要仅编码及传输低频分量,从而允许在低数据速率下高得多的音频质量。SBR是基于从获自编码器的可用带宽限制信号及控制数据复制谐波序列,所述谐波序列先前经截断以减小数据速率。音调分量与类噪声分量之间的比率是通过自适应逆滤波以及噪声及正弦波的任选相加来维持。在MPEG-4AAC标准中,SBR工具执行频谱修补(也被称为线性变换或频谱变换),其中将数个连续正交镜像滤波器(QMF)子带从音频信号的传输低带部分复制(或“修补”)到解码器中所产生的所述音频信号的高带部分。对于例如具有相对低交越频率的音乐内容的某些音频类型来说,频谱修补或线性变换可能并不理想。因此,需要用于改进频谱带复制的技术。
技术实现思路
第一类实施例涉及一种用于解码经编码音频位流的方法。所述方法包含接收所述经编码音频位流,及解码音频数据以产生经解码低带音频信号。所述方法进一步包含提取高频重建元数据,及使用分析滤波器组对所述经解码低带音频信号进行滤波以产生经滤波低带音频信号。所述方法进一步包含提取指示将对所述音频数据执行频谱变换还是谐波转置的旗标,及根据所述旗标使用所述经滤波低带音频信号及所述高频重建元数据再生所述音频信号的高带部分。最后,所述方法包含组合所述经滤波低带音频信号及所述经再生高带部分以形成宽带音频信号。第二类实施例涉及一种用于解码经编码音频位流的音频解码器。所述解码器包含:输入接口,其用于接收所述经编码音频位流,其中所述经编码音频位流包含表示音频信号的低带部分的音频数据;及核心解码器,其用于解码所述音频数据以产生经解码低带音频信号。所述解码器还包含:多路分用器,其用于从所述经编码音频位流提取高频重建元数据,其中所述高频重建元数据包含用于将连续数目个子带从所述音频信号的低带部分线性变换到所述音频信号的高带部分的高频重建过程的操作参数;及分析滤波器组,其用于对所述经解码低带音频信号进行滤波以产生经滤波低带音频信号。所述解码器进一步包含:多路分用器,其用于从所述经编码音频位流提取指示将对所述音频数据执行线性变换还是谐波转置的旗标;及高频再生器,其用于根据所述旗标使用所述经滤波低带音频信号及所述高频重建元数据再生所述音频信号的高带部分。最后,所述解码器包含合成滤波器组,其用于组合所述经滤波低带音频信号及所述经再生高带部分以形成宽带音频信号。其它类实施例涉及编码及转码含有识别是否将执行增强频谱带复制(eSBR)处理的元数据的音频位流。附图说明图1是可经配置以执行本专利技术方法的实施例的系统的实施例的框图。图2是作为本专利技术音频处理单元的实施例的编码器的框图。图3是包含是本专利技术音频处理单元的实施例的解码器且任选地还包含耦合到解码器的后处理器的系统的框图。图4是作为本专利技术音频处理单元的实施例的解码器的框图。图5是作为本专利技术音频处理单元的另一实施例的解码器的框图。图6是本专利技术音频处理单元的另一实施例的框图。图7是MPEG-4AAC位流的块的图解,所述位流包含其被划分成的片段。注释及命名在本专利技术通篇中,包含在权利要求书中,“对”信号或数据执行操作的表达(例如,对信号或数据进行滤波、缩放、变换或应用增益)在广义上用于表示直接对信号或数据或对信号或数据的处理版本(例如,对在对信号执行操作之前已经历初步滤波或预处理的信号版本)执行操作。在本专利技术通篇中,包含在权利要求书中,表达“音频处理单元”或“音频处理器”在广义上用于表示经配置以处理音频数据的系统、装置或设备。音频处理单元的实例包含但不限于编码器、转码器、解码器、编解码器、预处理系统、后处理系统及位流处理系统(有时被称为位流处理工具)。实际上所有消费型电子产品,例如移动电话、电视、膝上型计算机及平板计算机,都含有音频处理单元或音频处理器。在本专利技术通篇中,包含在权利要求书中,术语“耦合”在广义上用于意指直接或间接连接。因此,如果第一装置耦合到第二装置,那么所述连接可通过直接连接或通过经由其它装置及连接件的间接连接。此外,集成到其它组件中或与其它组件集成的组件也彼此耦合。具体实施方式MPEG-4AAC标准预期到,经编码MPEG-4AAC位流包含元数据,所述元数据指示将由解码器应用(如果将应用任何处理)以解码所述位流的音频内容的每一类型的高频重建(“HFR”)处理,及/或控制此类HFR处理,及/或指示将用以解码所述位流的音频内容的至少一个HFR工具的至少一个特性或参数。在本文中,我们使用表达“SBR元数据”来表示MPEG-4AAC标准中所描述或提及的此类型的元数据以与频谱带复制(“SBR)”一起使用。如所属领域的技术人员所了解,SBR是一种形式的HFR。SBR优选地用作双速率系统,其中基础编解码器以原始取样速率的一半操作,而SBR以原始取样速率操作。SBR编码器与基础核心编解码器并行地工作,即使是以较高取样速率。尽管SBR主要是解码器中的后过程,但在编码器中提取重要参数以确保解码器中的最准确高频重建。编码器估计适合于当前输入信号片段特性的时间及频率范围/分辨率的SBR范围的频谱包络。频谱包络是通过复杂QMF分析及后续能量计算来估计。频谱包络的时间及频率分辨率可以高自由度来选择,以确保给定输入片段的最合适时间频率分辨率。包络估计需要考虑到,在包络调整之前,主要位于高频区域(例如,高峰)中的原始来源中的瞬时将在微小程度上存在于SBR产生高带中,这是因为解码器中的高带是基于所述瞬时相较于高带不太显著的低带。相较于如用于其它音频译码算法中的普通频谱包络估计,此方面针对频谱包络数据的时间频率分辨率提出不同要求。除频谱包络之外,还针对不同时间及频率区域提取表示输入信号的频谱特性的若干额外参数。因为鉴于控制参数的特本文档来自技高网
...

【技术保护点】
1.一种用于解码经编码音频位流的方法,所述方法包括:接收所述经编码音频位流,所述经编码音频位流包含表示音频信号的低带部分的音频数据;解码所述音频数据以产生经解码低带音频信号;从所述经编码音频位流提取高频重建元数据,所述高频重建元数据包含用于将连续数目个子带从所述音频信号的低带部分线性变换到所述音频信号的高带部分的高频重建过程的操作参数;使用分析滤波器组对所述经解码低带音频信号进行滤波以产生经滤波低带音频信号;从所述经编码音频位流提取指示将对所述音频数据执行线性变换还是谐波转置的旗标;根据所述旗标使用所述经滤波低带音频信号及所述高频重建元数据再生所述音频信号的高带部分;及组合所述经滤波低带音频信号及所述经再生高带部分以形成宽带音频信号。

【技术特征摘要】
【国外来华专利技术】2017.03.23 US 62/475,6191.一种用于解码经编码音频位流的方法,所述方法包括:接收所述经编码音频位流,所述经编码音频位流包含表示音频信号的低带部分的音频数据;解码所述音频数据以产生经解码低带音频信号;从所述经编码音频位流提取高频重建元数据,所述高频重建元数据包含用于将连续数目个子带从所述音频信号的低带部分线性变换到所述音频信号的高带部分的高频重建过程的操作参数;使用分析滤波器组对所述经解码低带音频信号进行滤波以产生经滤波低带音频信号;从所述经编码音频位流提取指示将对所述音频数据执行线性变换还是谐波转置的旗标;根据所述旗标使用所述经滤波低带音频信号及所述高频重建元数据再生所述音频信号的高带部分;及组合所述经滤波低带音频信号及所述经再生高带部分以形成宽带音频信号。2.根据权利要求1所述的方法,其中所述经编码音频位流进一步包含填充元素,所述填充元素具有指示所述填充元素的开始的标识符及在所述标识符之后的填充数据,其中所述填充数据包含所述旗标。3.根据权利要求2所述的方法,其中所述标识符是传输最高有效位优先且具有0×6值的三位无正负号整数。4.根据权利要求2所述的方法,其中所述填充数据包含扩展有效负载,所述扩展有效负载包含频谱带复制扩展数据,且使用传输最高有效位优先且具有‘1101’或‘1110’值的四位无正负号整数来识别所述扩展有效负载,且任选地,其中所述频谱带复制扩展数据包含:任选频谱带复制标头,在所述标头之后的频谱带复制数据,在所述频谱带复制数据之后的频谱带复制扩展元素,且其中所述旗标包含于所述频谱带复制扩展元素中。5.根据权利要求1到4中任一权利要求所述的方法,其中所述高频重建元数据包含选自由包络比例因子、噪声基底比例因子、正弦波加成信息、时间/频率格网信息、交越频率及逆滤波模式组成的群组的操作参数。6.根据权利要求1到4中任一权利要求所述的方法,其中所述分析滤波器组包含是根据下式的原型滤波器p0(n)的调制版本的分析滤波器hk(n):其中p0(n)是实数值对称或非对称原型滤波器,M是所述分析滤波器组中的通道的数目,且N是原型滤波器阶数。7.根据权利要求6所述的方法,其中所述原型滤波器p0(n)是从表4的系数导出。8.根据权利要求6所述的方法,其中所述原型滤波器p0(n)是通过选自由舍入、子取样、内插或抽取组成的群组的一或多个数学运算从表4的系数导出。9.根据权利要求1到8中任一权利要求所述的方法,其中相移在所述滤波之后与所述经滤波低带音频信号相加且在所述组合之前被补偿。10.一种非暂时性计算机可读媒体,其含有在由处理器执行时执行根据权利要求1所述的方法...

【专利技术属性】
技术研发人员:L·维尔蒙斯H·普尔纳根P·埃克斯特兰德
申请(专利权)人:杜比国际公司
类型:发明
国别省市:荷兰,NL

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1