使用噪声填充的音频编码器、解码器、编码及解码方法技术

技术编号：26602235 阅读：45 留言：0更新日期：2020-12-04 21:25

在多声道音频编码中，通过以下措施实现改进的编码效率：使用噪声填充源而不是人为产生的噪声或频谱复制来执行零量化的比例因子频带的噪声填充。尤其是，基于使用来自多声道音频信号的先前帧或当前帧的不同声道的频谱线产生的噪声，通过执行噪声填充，多声道音频编码的效率可以呈现更高的效率。

全部详细技术资料下载

【技术实现步骤摘要】
使用噪声填充的音频编码器、解码器、编码及解码方法本申请是申请人为弗朗霍夫应用科学研究促进协会、申请日为2014年7月18日、申请号为201480041813.3、专利技术名称为“使用噪声填充的音频编码器、解码器、编码及解码方法”的分案申请。
本专利技术关于一种用于多声道音频编码的噪声填充。
技术介绍
现代频域语音/音频编码系统，例如IETF[1]的Opus/Celt编解码器及MPEG-4HE-AAC[2]，或者，特别是MPEG-DxHE-AAC(USAC)[3]，用于编码音频帧，这些音频帧要么使用长变换-长区块，要么使用八个相继短变换-短区块，其取决于信号的瞬时稳定性。除此之外，对于低比特率编码，这些方案使用相同声道的伪随机噪声或低频系数并且提供工具以重建声道的频率系数。在xHE-AAC，这些工具分别作为噪声填充及频谱带复制。然而，对于非常音调的或瞬时立体声效的输入，单独的噪声填充及/或频谱带复制在非常低的比特率情况下限制可实现的编码质量，主要因为两个声道的过多的频谱系数需要被明确地传递。
技术实现思路
因此，本专利技术的目的是提供用于执行多声道音频编码中的噪声填充的概念，该多声道音频编码提供更高效率的编码，特别是在非常低的比特率情况下。本专利技术的目的由所附独立权利要求的主题实现。本专利技术是基于如下发现：在多声道音频编码中，如果使用噪声填充源而不是人工产生的噪声或相同声道的频谱复制来执行声道的零量化比例因子频带的噪声填充，可实现编码效率的提升。尤其是，基于使用来...

【技术保护点】
1.一种参数化频域音频解码器，用于：/n识别(12)多声道音频信号的当前帧的第一声道的频谱的第一比例因子频带，所述第一比例因子频带内的所有频谱线被量化为零，以及识别(12)所述频谱的第二比例因子频带，所述第二比例因子频带内的至少一个频谱线被量化为非零；/n通过使用预设比例因子频带的比例因子调整噪声的水平，使用所述多声道音频信号的先前帧或所述当前帧的不同声道的频谱线产生的所述噪声填充(16)所述第一比例因子频带的预设比例因子频带内的所述频谱线；/n使用所述第二比例因子频带的比例因子，在所述第二比例因子频带内去量化(14)所述频谱线；以及/n对从填充有所述噪声的所述第一比例因子频带以及从使用所述第二比例因子频带的所述比例因子去量化的所述第二比例因子频带获得的所述频谱进行逆变换(18)，所述噪声的所述水平通过使用所述第一比例因子频带的比例因子而被调整，以获得所述多声道音频信号的所述第一声道的时域部分。/n

【技术特征摘要】
20130722 EP 13177356.6;20131018 EP 13189450.31.一种参数化频域音频解码器，用于：
识别(12)多声道音频信号的当前帧的第一声道的频谱的第一比例因子频带，所述第一比例因子频带内的所有频谱线被量化为零，以及识别(12)所述频谱的第二比例因子频带，所述第二比例因子频带内的至少一个频谱线被量化为非零；
通过使用预设比例因子频带的比例因子调整噪声的水平，使用所述多声道音频信号的先前帧或所述当前帧的不同声道的频谱线产生的所述噪声填充(16)所述第一比例因子频带的预设比例因子频带内的所述频谱线；
使用所述第二比例因子频带的比例因子，在所述第二比例因子频带内去量化(14)所述频谱线；以及
对从填充有所述噪声的所述第一比例因子频带以及从使用所述第二比例因子频带的所述比例因子去量化的所述第二比例因子频带获得的所述频谱进行逆变换(18)，所述噪声的所述水平通过使用所述第一比例因子频带的比例因子而被调整，以获得所述多声道音频信号的所述第一声道的时域部分。

2.如权利要求1所述的参数化频域音频解码器，进一步用于，在所述填充中，
使用所述预设比例因子频带的所述比例因子，调整所述先前帧的降混的频谱的共置至所述预设比例因子频带的共置部分的水平，以及将具有调整后的水平的所述共置部分添加至所述预设比例因子频带。

3.如权利要求2所述的参数化频域音频解码器，进一步用于从所述当前帧的不同声道或降混预测所述比例因子频带的子集合，以获得声道间预测，以及使用已填充有所述噪声的所述预设比例因子频带以及使用所述第二比例因子频带的所述比例因子去量化的第二比例因子频带，作为所述声道间预测的预测残差以获得所述频谱。

4.如权利要求3所述的参数化频域音频解码器，进一步用于，在预测所述比例因子频带的所述子集合时，使用所述先前帧的降混的所述频谱执行所述当前帧的所述不同声道或降混的虚部估计。

5.如权利要求1所述的参数化频域音频解码器，其中所述当前声道以及所述其它声道在所述数据流中使用MS编码，以及所述参数化频域音频解码器用于将所述频谱使用MS解码。

6.如权利要求1所述的参数化频域音频解码器，进一步用于，使用具有上下文判断的上下文适应性熵解码及/或使用具有频谱预测的预测解码，从数据流顺次地提取出所述第一比例因子频带以及所述第二比例因子频带的所述比例因子，其中所述上下文判断或所述频谱预测取决于当前提取出的比例因子的频谱邻区中已经提取出的比例因子，所述比例因子根据所述第一比例因子频带以及所述第二比例因子频带中的频谱次序而频谱地布置。

7.如权利要求1所述的参数化频域音频解码器，进一步用于使得所述噪声使用伪随机或随机噪声额外产生。

8.如权利要求7所述的参数化频域音频解码器，进一步用于，根据用于所述当前帧的数据流中的信号化的噪声参数，调整所述伪随机或随机噪声的水平等同地用于所述第一...

【专利技术属性】
技术研发人员：玛利亚·路易斯·瓦莱罗，克里斯蒂安·赫尔姆里希，约翰内斯·希勒佩特，
申请(专利权)人：弗朗霍夫应用科学研究促进协会，
类型：发明
国别省市：德国;DE

全部详细技术资料下载我是这个专利的主人