基于QMF的处理数据的时间对齐制造技术

技术编号:14852025 阅读:45 留言:0更新日期:2017-03-18 14:42
本文档涉及音频编码器的编码数据与诸如频带复制(SBR)元数据之类的关联元数据的时间对齐。一种被配置为根据接收到的数据流的存取单元(110)来确定音频信号(237)的重构帧的音频解码器(100,300)被描述。存取单元(110)包括波形数据(111)和元数据(112),其中波形数据(111)和元数据(112)与音频信号(127)的同一重构帧相关联。音频解码器(100,300)包括被配置为根据波形数据(111)生成多个波形子带信号(123)的波形处理路径(101,102,103,104,105),以及被配置为根据元数据(111)生成解码后的元数据(128)的元数据处理路径(108,109)。

【技术实现步骤摘要】
【国外来华专利技术】相关申请的交叉引用本申请要求在2013年9月12日提交的美国临时专利申请第61/877,194号和在2013年11月27日提交的美国临时专利申请第61/909,593号的优先权,这些申请中的每一个通过引用而被整体结合于此。
本文档涉及音频编码器的编码数据与诸如频带复制(SBR)—尤其是高效率(HE)高级音频编码(AAC)—元数据之类的关联元数据的时间对齐。
技术介绍
音频编码背景下的技术问题是提供表现低延迟的音频编码和解码系统,例如以允许诸如实况广播之类的实时应用。另外,希望提供交换可以被与其他比特流拼接的编码比特流的音频编码和解码系统。此外,计算高效的音频编码和解码系统应当被提供以允许系统的成本高效的实现。本文档解决了在为实况广播保持适当水平的等待时间的同时提供可以被以高效方式拼接的编码比特流的技术问题。本文档描述了一种音频编码和解码系统,其允许以合理的编码延迟拼接比特流,从而使能诸如实况广播之类的应用,在这些应用中可以根据多个源比特流生成广播比特流。
技术实现思路
根据一个方面,配置为根据接收到的数据流的存取单元来确定音频信号的重构帧的音频解码器被描述。通常,数据流包括用于确定音频信号的相应一系列重构帧的一系列存取单元。音频信号的帧通常包括音频信号的预定数目N个时域样本(其中N大于一)。因此,一系列存取单元可以分别描述音频信号的一系列帧。存取单元包括波形数据和元数据,其中波形数据和元数据与音频信号的同一重构帧相关联。换言之,用于确定音频信号的重构帧的波形数据和元数据被包括在同一存取单元内。一系列存取单元中的存取单元可以各自包括用于生成音频信号的一系列重构帧中的相应重构帧的波形数据和元数据。具体而言,特定帧的存取单元可以包括确定特定帧的重构帧所必需的(例如所有)数据。在一个示例中,特定帧的存取单元可以包括执行用于基于(存取单元的波形数据内包括的)特定帧的低波段信号并且基于解码后的元数据来生成特定帧的高波段信号的高频重构(HFR)方案所必需的(例如所有)数据。可替代地或者除此之外,特定帧的存取单元可以包括执行特定帧的动态范围的扩展所必需的(例如所有)数据。具体而言,特定帧的低波段信号的扩充或扩展可以基于解码后的元数据来执行。为此,解码后的元数据可以包括一个或多个扩展参数。一个或多个扩展参数可以指示以下各项中的一个或多个:压缩/扩展是否将被施加于特定帧;压缩/扩展是否将被以同样方式施加于多声道音频信号的所有声道(即相同的一个或多个扩展增益是否将被施加于多声道音频信号的所有声道或者不同的一个或多个扩展增益是否将被施加于多声道音频信号的不同声道);和/或扩展增益的时间分辨率。提供一系列存取单元,其中存取单元各自包括生成音频信号的对应重构帧所必需的数据,独立于前一存取单元或者后一存取单元,对于拼接应用而言是有益的,这是因为其允许数据流在两个相邻的存取单元之间被拼接,而不影响拼接点处(例如,直接在拼接点之后)的音频信号的重构帧的感知质量。在一个示例中,音频信号的重构帧包括低波段信号和高波段信号,其中波形数据指示低波段信号并且其中元数据指示高波段信号的频谱包络。低波段信号可以对应于音频信号中覆盖相对低的频率范围(例如包括比预定交叉频率更小的频率)的分量。高波段信号可以对应于音频信号中覆盖相对高的频率范围(例如包括比预定交叉频率更高的频率)的分量。低波段信号和高波段信号对于低波段信号和高波段信号所覆盖的频率范围可以是互补的。音频解码器可被配置为使用元数据和波形数据执行诸如高波段信号的频带复制(SBR)之类的高频重构(HFR)。因此,元数据可以包括指示高波段信号的频谱包络的HFR元数据或SBR元数据。音频解码器可以包括被配置为根据波形数据生成多个波形子带信号的波形处理路径。多个波形子带信号可以对应于子带域中(例如QMF域中)的时域波形信号的表示。时域波形信号可以对应于上面提到的低波段信号,并且多个波形子带信号可以对应于多个低波段子带信号。另外,音频解码器可以包括被配置为根据元数据生成解码后的元数据的元数据处理路径。此外,音频解码器可以包括被配置为根据多个波形子带信号并且根据解码后的元数据生成音频信号的重构帧的元数据施加和合成单元。具体而言,元数据施加和合成单元可被配置为执行用于根据多个波形子带信号(即,在这种情况下,根据多个低波段子带信号)并且根据解码后的元数据生成多个(例如,缩放后的)高波段子带信号的HFR和/或SBR方案。然后可以基于多个(例如缩放后的)高波段子带信号并且基于多个低波段信号来确定音频信号的重构帧。可替代地或者除此之外,音频解码器可以包括被配置为使用解码后的元数据中的至少一些尤其是使用解码后的元数据内包括的一个或多个扩展参数来执行对多个波形子带信号的扩展或者被配置为使用解码后的元数据中的至少一些尤其是使用解码后的元数据内包括的一个或多个扩展参数来扩展多个波形子带信号的扩展单元。为此,扩展单元可被配置为将一个或多个扩展增益施加于多个波形子带信号。扩展单元可被配置为基于多个波形子带信号、基于一个或多个预定压缩/扩展规则或函数并且/或者基于一个或多个扩展参数来确定一个或多个扩展增益。波形处理路径和/或元数据处理路径可以包括被配置为使多个波形子带信号和解码后的元数据时间对齐的至少一个延迟单元。具体而言,至少一个延迟单元可被配置为使多个波形子带信号和解码后的元数据对齐,并且/或者将至少一个延迟插入到波形处理路径和/或插入到元数据处理路径,以使得波形处理路径的总体延迟对应于元数据处理路径的总体延迟。可替代地或者除此之外,至少一个延迟单元可被配置为使多个波形子带信号和解码后的元数据时间对齐以使得多个波形子带信号和解码后的元数据被及时提供给元数据施加和合成单元以供元数据施加和合成单元执行处理。具体而言,多个波形子带信号和解码后的元数据可被提供给元数据施加和合成单元以使得元数据施加和合成单元在对多个波形子带信号和/或对解码后的元数据执行处理(例如,HFR或SBR处理)之前不需要缓冲多个波形子带信号和/或解码后的元数据。换言之,音频解码器可被配置为延迟向可被配置为执行HFR方案的元数据施加和合成单元提供解码后的元数据和/或多个波形子带信号,以使得解码后的元数据和/或多个波形子带信号按照处理的需要本文档来自技高网...

【技术保护点】
一种音频解码器(100,300),其被配置为根据接收到的数据流的存取单元(110)来确定音频信号(127)的重构帧;其中存取单元(110)包括波形数据(111)和元数据(112);其中波形数据(111)和元数据(112)与音频信号(127)的同一重构帧相关联;其中音频解码器(100,300)包括—波形处理路径(101,102,103,104,105),其被配置为根据波形数据(111)生成多个波形子带信号(123);—元数据处理路径(108,109),其被配置为根据元数据(111)生成解码后的元数据(128);以及—元数据施加和合成单元(106,107),其被配置为根据所述多个波形子带信号(123)并根据解码后的元数据(128)来生成音频信号(127)的重构帧;其中波形处理路径(101,102,103,104,105)和/或元数据处理路径(108,109)包括被配置为使所述多个波形子带信号(123)和解码后的元数据(128)时间对齐的至少一个延迟单元(105,109)。

【技术特征摘要】
【国外来华专利技术】2013.09.12 US 61/877,194;2013.11.27 US 61/909,5931.一种音频解码器(100,300),其被配置为根据接收到的数
据流的存取单元(110)来确定音频信号(127)的重构帧;其中存取
单元(110)包括波形数据(111)和元数据(112);其中波形数据
(111)和元数据(112)与音频信号(127)的同一重构帧相关联;
其中音频解码器(100,300)包括
—波形处理路径(101,102,103,104,105),其被配置为根
据波形数据(111)生成多个波形子带信号(123);
—元数据处理路径(108,109),其被配置为根据元数据(111)
生成解码后的元数据(128);以及
—元数据施加和合成单元(106,107),其被配置为根据所述多
个波形子带信号(123)并根据解码后的元数据(128)来生成音频信
号(127)的重构帧;其中波形处理路径(101,102,103,104,105)
和/或元数据处理路径(108,109)包括被配置为使所述多个波形子带
信号(123)和解码后的元数据(128)时间对齐的至少一个延迟单元
(105,109)。
2.如权利要求1所述的音频解码器(100,300),其中,所述
至少一个延迟单元(105,109)被配置为使所述多个波形子带信号
(123)和解码后的元数据(128)时间对齐以使得波形处理路径(101,
102,103,104,105)的总体延迟对应于元数据处理路径(108,109)
的总体延迟。
3.如任何先前权利要求所述的音频解码器(100,300),其中,
所述至少一个延迟单元(105,109)被配置为使所述多个波形子带信
号(123)和解码后的元数据(128)时间对齐以使得所述多个波形子
带信号(123)和解码后的元数据(128)被及时地提供给元数据施加
和合成单元(106,107)以供元数据施加和合成单元(106,107)执

\t行处理。
4.如任何先前权利要求所述的音频解码器(100,300),其中,
元数据处理路径(108,109)包括元数据延迟单元(109),该元数
据延迟单元(109)被配置为使解码后的元数据(128)延迟音频信号
(127)的重构帧的帧长度N的大于零的整数倍。
5.如权利要求4所述的音频解码器(100,300),其中,所述
整数倍使得元数据延迟单元(109)所引入的延迟大于波形处理路径
(101,102,103,104,105)的处理所引入的延迟。
6.如权利要求4至5中任一个所述的音频解码器(100,300),
其中,所述整数倍对于大于960的帧长度N而言是一,并且其中所述
整数倍对于小于或等于960的帧长度N而言是二。
7.如任何先前权利要求所述的音频解码器(100,300),其中,
波形处理路径(101,102,103,104,105)包括波形延迟单元(105),
该波形延迟单元(105)被配置为使所述多个波形子带信号(123)延
迟以使得波形处理路径的总体延迟对应于音频信号(127)的重构帧
的帧长度N的大于零的整数倍。
8.如任何先前权利要求所述的音频解码器(100,300),其中,
波形处理路径(101,102,103,104,105)包括
—解码和解量化单元(101),其被配置为对波形数据(111)进
行解码和解量化以提供指示波形信号的多个频率系数(121);
—波形合成单元(102),其被配置为根据所述多个频率系数(121)
生成波形信号(122);以及
—分析单元(103),其被配置为根据波形信号(122)生成所述
多个波形子带信号(123)。
9.如权利要求8所述的音频解码器(100,300),其中
—波形合成单元(102)被配置为执行频域到时域的变换;
—分析单元(103)被配置为执行时域到子带域的变换;并且
—由波形合成单元(102)执行的变换的频率分辨率比由分析单
元(103)执行的变换的频率分辨率更高。
10.如权利要求9所述的音频解码器(100,300),其中
—波形合成单元(102)被配置为执行逆修正离散余弦变换;并

—分析单元(103)被配置为施加正交镜像滤波器组。
11.如权利要求8至10中任一个所述的音频解码器(100,300),
其中
—波形合成单元(102)引入取决于音频信号(127)的重构帧的
帧长度N的延迟;并且/或者
—分析单元(103)引入独立于音频信号(127)的重构帧的帧长
度N的固定延迟。
12.如权利要求11所述的音频解码器(100,300),其中
—波形合成单元(102)所引入的延迟对应于帧长度N的一半;
并且/或者
—分析单元(103)所引入的固定延迟对应于音频信号的320个
样本。
13.如权利要求8至12中任一个所述的音频解码器(100,300),
其中,波形处理路径(101,102,103,104,105)的总体延迟取决
于元数据(112)与波形数据(111)之间的预定超前。
14.如权利要求13所述的音频解码器(100,300),其中,所
述预定超前对应于音频样本的192或者384个样本。
15.如任何先前权利要求所述的音频解码器(100,300),其中
—解码后的元数据(128)包括一个或多个扩展参数(310);
—音频解码器(100,300)包括扩展单元(301),该扩展单元
(301)被配置为利用所述一个或多个扩展参数(310)基于所述多个
波形子带信号生成多个扩展后的波形子带信号;并且
—音频信号(127)的重构帧是根据所述多个扩展后的波形子带
信号来确定的。
16.如权利要求15所述的音频解码器(100,300),其中
—音频解码器(100,300)包括超前延迟单元(104),该超前
延迟单元(104)被配置为根据预定超前来延迟所述多个波形子带信
号(123),以产生多个延迟后的波形子带信号(123);并且
—扩展单元(301)被配置为通过扩展所述多个延迟后的波形子
带信号来生成所述多个扩展后的波形子带信号。
17.如权利要求15至16中任一个所述的音频解码器(100,300),
其中
—扩展单元(301)被配置为使用预定压缩函数的逆来生成所述
多个扩展后的波形子带信号;并且
—所述一个或多个扩展参数(310)指示所述预定压缩函数的逆。
18.如权利要求15至17中任一个所述的音频解码器(100,300),
其中
—元数据施加和合成单元(106,107)被配置为通过将解码后的
元数据(128)用于所述多个波形子带信号(123)的时间部分来生成
音频信号(127)的重构帧;并且
—扩展单元(301)被配置为通过将所述一个或多个扩展参数
(310)用于所述多个波形子带信号的相同时间部分来生成所述多个
扩展后的波形子带信号。
19.如权利要求18所述的音频解码器(100,300),其中,所
述多个波形子带信号(123)的时间部分的时间长度是可变的。
20.如权利要求8至19中任一个所述的音频解码器(100,300),
其中,波形延迟单元(105)被配置为使波形信号(122)延迟;其中
波形信号(122)...

【专利技术属性】
技术研发人员:K·克约尔林H·普恩哈根J·波普
申请(专利权)人:杜比国际公司
类型:发明
国别省市:荷兰;NL

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1