使用噪声填充的音频编码器、解码器、编码及解码方法技术

技术编号:26602235 阅读:45 留言:0更新日期:2020-12-04 21:25
在多声道音频编码中,通过以下措施实现改进的编码效率:使用噪声填充源而不是人为产生的噪声或频谱复制来执行零量化的比例因子频带的噪声填充。尤其是,基于使用来自多声道音频信号的先前帧或当前帧的不同声道的频谱线产生的噪声,通过执行噪声填充,多声道音频编码的效率可以呈现更高的效率。

【技术实现步骤摘要】
使用噪声填充的音频编码器、解码器、编码及解码方法本申请是申请人为弗朗霍夫应用科学研究促进协会、申请日为2014年7月18日、申请号为201480041813.3、专利技术名称为“使用噪声填充的音频编码器、解码器、编码及解码方法”的分案申请。
本专利技术关于一种用于多声道音频编码的噪声填充。
技术介绍
现代频域语音/音频编码系统,例如IETF[1]的Opus/Celt编解码器及MPEG-4HE-AAC[2],或者,特别是MPEG-DxHE-AAC(USAC)[3],用于编码音频帧,这些音频帧要么使用长变换-长区块,要么使用八个相继短变换-短区块,其取决于信号的瞬时稳定性。除此之外,对于低比特率编码,这些方案使用相同声道的伪随机噪声或低频系数并且提供工具以重建声道的频率系数。在xHE-AAC,这些工具分别作为噪声填充及频谱带复制。然而,对于非常音调的或瞬时立体声效的输入,单独的噪声填充及/或频谱带复制在非常低的比特率情况下限制可实现的编码质量,主要因为两个声道的过多的频谱系数需要被明确地传递。
技术实现思路
因此,本专利技术的目的是提供用于执行多声道音频编码中的噪声填充的概念,该多声道音频编码提供更高效率的编码,特别是在非常低的比特率情况下。本专利技术的目的由所附独立权利要求的主题实现。本专利技术是基于如下发现:在多声道音频编码中,如果使用噪声填充源而不是人工产生的噪声或相同声道的频谱复制来执行声道的零量化比例因子频带的噪声填充,可实现编码效率的提升。尤其是,基于使用来自多声道音频信号的先前帧或当前帧的不同声道的频谱线产生的噪声,通过执行噪声填充,多声道音频编码的效率可以呈现更高的效率。通过使用多声道音频信号的先前帧的频谱共置的频谱线,或使用多声道音频信号的其它声道的频谱时序共置的频谱线,这能够实现重建的多声道音频信号的更舒适的质量,特别在非常低的比特率时,编码器需要接近零量化的频谱线的情况,以作为整体的零量化比例因子带。由于噪声填充的提升,编码器的质量损失更少,则可以选择零量化更多的比例因子带,从而提高编码效率。根据本专利技术实施例,用于执行噪声填充的源与用于执行复值立体声预测的源部分地重迭。尤其是,先前帧的降混可以被使用作为噪声填充的源以及共享为执行或至少增强虚拟部分估计以应用于执行复声道间预测的源。根据实施例,现有的多声道音频编解码器以反向兼容的方式被延伸,以便以逐帧方式发出信号,应用于声道间噪声填充。依照下面所述的具体实施例,例如信号作用于反向兼容的方式延伸xHE-AAC,并且利用有条件地编码的噪声填充参数的未使用状态,使信号开启及关闭声道间噪声填充。附图说明本专利技术的有利的实施是从属权利要求的主题。以下参考附图描述本专利技术的优选实施例,其中:图1示出根据本专利技术实施例的参数化频域解码器的框图;图2示出描述频谱序列的示意图,该频谱序列形成多声道音频信号的声道的频谱图,以容易理解图1的解码器的描述;图3示出描述图2所示的频谱图之外的当前频谱的示意图,以容易理解图1的解码器的描述;图4示出另一实施例的参数化频域音频解码器的框图,该参数化频域音频解码器的先前帧的降混被用作声道间噪声填充的基底,其中图4A涉及频谱所属于的第一声道的解码,图4B涉及其他声道的解码;以及图5示出实施例的参数化频域音频编码器的框图。具体实施方式图1示出根据本专利技术实施例的频域音频解码器。该解码器通常使用标号10标示,并且该解码器包含比例因子频带识别器12、去量化器14、噪声填充器16及逆变换器18及频谱线提取器20,以及比例因子提取器22。解码器10可能包括的可选的进一步的元件包含复立体声预测器24、MS(mid-side,中间-两侧)解码器26及逆TNS(TemporalNoiseShaping,瞬时噪声整形)滤波工具,图1示出逆TNS滤波工具的两个实例28a及28b。除此之外,使用标号31表示的降混供应器示出及详细介绍如下。图1的频域音频解码器10是支持噪声填充的参数化解码器,根据该参数化解码器,使用比例因子带的比例因子对某个零量化比例因子带填充噪声,该参数化解码器作为工具以控制填充于该比例因子带的噪声的水平。除此之外,图1的解码器10代表多声道音频解码器,用于重建来自入站(inbound)数据流30的多声道音频信号。然而,图1聚焦于解码器10中涉及重建多声道音频信号之一的元件,多声道音频信号被编码于数据流30并输出位于输出端32的(输出)声道。标号34表示解码器10可包含进一步的元件或可以包含一些管线的操作控制,用于负责重建多声道音频信号的其它声道,其中以下描述指示位于输出端32的感兴趣声道的解码器10的重建如何与其它声道的解码交互作用。数据流30表示的多声道音频信号可包含两个或多个声道。如下所述,本专利技术的实施例的描述专注于立体声案例,立体声案例是仅包含两个声道的多声道音频信号,但是原则上,下述提出的实施例可以容易的被变换成可选的实施例,即关于多声道音频信号及其包含两个以上声道的编码。如下图1的描述中将更清楚的示出,图1的解码器10是变换解码器,亦即根据解码器10的编码方法,声道被编码于变换域,例如使用声道的重迭变换。此外,依据音频信号的创建器,存在时间相位,在这些时间相位期间,音频信号的声道大部分代表相同的音频内容,彼此之间仅存在它们之间的微量或确定性改变的不同之处,例如不同的振福及/或相位以代表音频场,其中声道之间的不同使音频场的音频源的虚拟位置能够相关于虚拟扬声器的位置,该虚拟扬声器位置与多声道音频信号的输出声道相关联。然而,在一些其它瞬时相位,音频信号的不同声道可以几乎彼此非相关,且甚至可代表完全不同的音频源。为了说明音频信号的声道之间会随时间改变的可能的关系,图1的解码器10下方的编解码器允许随时间改变的不同测量的用法,以利用声道间冗余。例如,MS编码允许代表立体声音频信号的左声道及右声道之间的切换,或作为一对M(中间)声道及S(侧边)声道代表左声道及右声道的降混,并且分别减半它们之间的差异。即,在频谱时序的程度上,两个声道的频谱连续地被数据流30变换,但这些(传输的)声道的含义可以分别随时间及相对于输出声道而改变。复立体声预测(另一个声道间冗余开发工具)在频谱域里通过使用另一声道的频谱共置线能够预测一个声道的频谱域系数或频谱线。关于这点的更多细节描述如下。为了方便理解下面关于图1及其中示出的元件的描述,图2示出数据流30表示的立体声音频信号的示例性例子,对于两声道的频谱线如何取样数值,有一可能的方法是将两声道的频谱线编码于数据流30,以通过图1的编码器10来处理。尤其是,图2的上半部分显示立体声音频信号的第一信道的频谱图40,图2的下半部分显示立体声音频信号的其它声道的频谱图42。再者,值得注意的是,频谱图40及42的“含义”可能会随着时间而改变,例如由于在MS编码域及非MS编码域之间的随时间改变的切换。在第一实施例中,频谱图40及42分别地涉及M声道及S声道,其中在后面的例子中,本文档来自技高网...

【技术保护点】
1.一种参数化频域音频解码器,用于:/n识别(12)多声道音频信号的当前帧的第一声道的频谱的第一比例因子频带,所述第一比例因子频带内的所有频谱线被量化为零,以及识别(12)所述频谱的第二比例因子频带,所述第二比例因子频带内的至少一个频谱线被量化为非零;/n通过使用预设比例因子频带的比例因子调整噪声的水平,使用所述多声道音频信号的先前帧或所述当前帧的不同声道的频谱线产生的所述噪声填充(16)所述第一比例因子频带的预设比例因子频带内的所述频谱线;/n使用所述第二比例因子频带的比例因子,在所述第二比例因子频带内去量化(14)所述频谱线;以及/n对从填充有所述噪声的所述第一比例因子频带以及从使用所述第二比例因子频带的所述比例因子去量化的所述第二比例因子频带获得的所述频谱进行逆变换(18),所述噪声的所述水平通过使用所述第一比例因子频带的比例因子而被调整,以获得所述多声道音频信号的所述第一声道的时域部分。/n

【技术特征摘要】
20130722 EP 13177356.6;20131018 EP 13189450.31.一种参数化频域音频解码器,用于:
识别(12)多声道音频信号的当前帧的第一声道的频谱的第一比例因子频带,所述第一比例因子频带内的所有频谱线被量化为零,以及识别(12)所述频谱的第二比例因子频带,所述第二比例因子频带内的至少一个频谱线被量化为非零;
通过使用预设比例因子频带的比例因子调整噪声的水平,使用所述多声道音频信号的先前帧或所述当前帧的不同声道的频谱线产生的所述噪声填充(16)所述第一比例因子频带的预设比例因子频带内的所述频谱线;
使用所述第二比例因子频带的比例因子,在所述第二比例因子频带内去量化(14)所述频谱线;以及
对从填充有所述噪声的所述第一比例因子频带以及从使用所述第二比例因子频带的所述比例因子去量化的所述第二比例因子频带获得的所述频谱进行逆变换(18),所述噪声的所述水平通过使用所述第一比例因子频带的比例因子而被调整,以获得所述多声道音频信号的所述第一声道的时域部分。


2.如权利要求1所述的参数化频域音频解码器,进一步用于,在所述填充中,
使用所述预设比例因子频带的所述比例因子,调整所述先前帧的降混的频谱的共置至所述预设比例因子频带的共置部分的水平,以及将具有调整后的水平的所述共置部分添加至所述预设比例因子频带。


3.如权利要求2所述的参数化频域音频解码器,进一步用于从所述当前帧的不同声道或降混预测所述比例因子频带的子集合,以获得声道间预测,以及使用已填充有所述噪声的所述预设比例因子频带以及使用所述第二比例因子频带的所述比例因子去量化的第二比例因子频带,作为所述声道间预测的预测残差以获得所述频谱。


4.如权利要求3所述的参数化频域音频解码器,进一步用于,在预测所述比例因子频带的所述子集合时,使用所述先前帧的降混的所述频谱执行所述当前帧的所述不同声道或降混的虚部估计。


5.如权利要求1所述的参数化频域音频解码器,其中所述当前声道以及所述其它声道在所述数据流中使用MS编码,以及所述参数化频域音频解码器用于将所述频谱使用MS解码。


6.如权利要求1所述的参数化频域音频解码器,进一步用于,使用具有上下文判断的上下文适应性熵解码及/或使用具有频谱预测的预测解码,从数据流顺次地提取出所述第一比例因子频带以及所述第二比例因子频带的所述比例因子,其中所述上下文判断或所述频谱预测取决于当前提取出的比例因子的频谱邻区中已经提取出的比例因子,所述比例因子根据所述第一比例因子频带以及所述第二比例因子频带中的频谱次序而频谱地布置。


7.如权利要求1所述的参数化频域音频解码器,进一步用于使得所述噪声使用伪随机或随机噪声额外产生。


8.如权利要求7所述的参数化频域音频解码器,进一步用于,根据用于所述当前帧的数据流中的信号化的噪声参数,调整所述伪随机或随机噪声的水平等同地用于所述第一...

【专利技术属性】
技术研发人员:玛利亚·路易斯·瓦莱罗克里斯蒂安·赫尔姆里希约翰内斯·希勒佩特
申请(专利权)人:弗朗霍夫应用科学研究促进协会
类型:发明
国别省市:德国;DE

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1