MDCT域错误掩盖制造技术

技术编号：15919753 阅读：23 留言：0更新日期：2017-08-02 04:54

一种错误掩盖音频解码方法包括：接收包括对音频信号的时域样本的帧进行编码的MDCT系数集合的分组；将接收分组识别为错误的；基于与紧挨在错误分组前面的接收分组相关联的对应MDCT系数来产生替代错误分组的MDCT系数集合的估计MDCT系数；将估计MDCT系数中的MDCT系数的第一子集的符号指定为与所述前一个分组的对应MDCT系数的符号一致，其中，第一子集包括与音调状谱区间相关联的那些MDCT系数；随机地指定估计MDCT系数中的MDCT系数的第二子集的符号，其中，第二子集包括与噪声状谱区间相关联的MDCT系数；用包含估计MDCT系数和指定的符号的掩盖分组替代错误分组。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】MDCT域错误掩盖
本文公开的专利技术总体上涉及音频信号的编码和解码，并且特别地，涉及用于掩盖错误的方法和装置。
技术介绍
修正离散余弦变换(MDCT)和对应的逆修正离散变换(IMDCT)被用于例如音频译码和解码技术，诸如MPEG-2和MPEG-4音频层、高级音频编码、MPEG-4HE-AAC、MPEG-DUSAC、杜比数字(Plus)以及其他专有格式。在这种技术的应用中，在分组在解码系统中被接收之前或之后，由于与音频信号的变换相关的分组丢失或分组错误，有时会出现错误。这样的错误例如包括分组丢失或分组失真，并且可能导致解码音频信号的听得见的失真。因此已经提供了用于在分组中出现错误的情况下掩盖错误的方法。错误掩盖法一般分为估计掩盖法和非估计掩盖法，在估计掩盖法中，错误帧被估计替代，非估计掩盖法例如使用错误帧的静默、帧重复或噪声代替。估计掩盖法包括在频域中使用估计的方法(诸如美国专利No.8620644中公开的方法)以及在时域中使用估计的方法(诸如国际专利公开No.WO/2014/052746中公开的方法)。用于错误掩盖的所有技术都面临与掩盖的质量和所需估计的复杂度之间的权衡相关的问题。因此，存在对于错误掩盖的其他方法的需求。附图说明现在将参照附图来描述示例性实施例，其中：图1A和图1B分别以举例的方式描绘MDCT和IMDCT的概括框图，图2是第一解码系统的概括框图，图3是第二解码系统的概括框图，以及图4是第三解码系统的概括框图。所有图都是示意性的，并且一般仅描绘阐明本公开所必需的部分，而其他部分则可以被省略或仅被建议。除非另有指示，否则相似的附图标记指代不同...
MDCT域错误掩盖

【技术保护点】
一种用于掩盖在基于修正离散余弦变换MDCT的音频解码器中将被解码的数据分组中的错误的方法，所述基于MDCT的音频解码器被布置为将分组序列解码为解码帧序列，所述方法包括：从被布置为对音频信号进行编码的基于MDCT的音频编码器接收包括MDCT系数集合的分组，所述MDCT系数集合与包括所述音频信号的时域样本的帧相关联；在接收分组包括一个或多个错误时，将该接收分组识别为错误分组；产生用于替代所述错误分组的MDCT系数集合的估计MDCT系数，所述估计MDCT系数基于与在所述分组序列中紧挨在所述错误分组前面的接收分组相关联的对应MDCT系数；将所述估计MDCT系数中的MDCT系数的第一子集的符号指定为等于在所述分组序列中紧挨在所述错误分组前面的接收分组的对应MDCT系数的对应符号，其中，所述第一子集包括与所述分组的音调状谱区间相关联的MDCT系数；随机地指定所述估计MDCT系数中的MDCT系数的第二子集的符号，其中，所述第二子集包括与所述分组的噪声状谱区间相关联的MDCT系数；基于所述分组的所述估计MDCT系数和选定符号来产生掩盖分组；以及用所述掩盖分组来替代所述错误分组。

【技术特征摘要】
【国外来华专利技术】2014.12.09 US 62/089,5631.一种用于掩盖在基于修正离散余弦变换MDCT的音频解码器中将被解码的数据分组中的错误的方法，所述基于MDCT的音频解码器被布置为将分组序列解码为解码帧序列，所述方法包括：从被布置为对音频信号进行编码的基于MDCT的音频编码器接收包括MDCT系数集合的分组，所述MDCT系数集合与包括所述音频信号的时域样本的帧相关联；在接收分组包括一个或多个错误时，将该接收分组识别为错误分组；产生用于替代所述错误分组的MDCT系数集合的估计MDCT系数，所述估计MDCT系数基于与在所述分组序列中紧挨在所述错误分组前面的接收分组相关联的对应MDCT系数；将所述估计MDCT系数中的MDCT系数的第一子集的符号指定为等于在所述分组序列中紧挨在所述错误分组前面的接收分组的对应MDCT系数的对应符号，其中，所述第一子集包括与所述分组的音调状谱区间相关联的MDCT系数；随机地指定所述估计MDCT系数中的MDCT系数的第二子集的符号，其中，所述第二子集包括与所述分组的噪声状谱区间相关联的MDCT系数；基于所述分组的所述估计MDCT系数和选定符号来产生掩盖分组；以及用所述掩盖分组来替代所述错误分组。2.根据权利要求1所述的方法，进一步包括：对于所述估计MDCT系数中的每个，基于与所述错误分组相关联的功率谱的近似的谱峰检测来确定所述MDCT系数是与音调状谱区间相关联还是与噪声状谱区间相关联，其中，近似的功率谱基于与在所述分组序列中紧挨在所述错误分组前面的接收分组相关联的功率谱。3.根据权利要求1所述的方法，进一步包括：对于所述估计MDCT系数中的每个，基于与所述分组相关联的元数据来确定所述MDCT系数是与音调状谱区间相关联还是与噪声状谱区间相关联，其中，所述元数据是在包括分组序列和元数据的比特流中接收的。4.根据权利要求1-3中任一项所述的方法，其中，所述估计MDCT系数被选为等于在所述分组序列中紧挨在所述错误分组前面的接收分组的对应MDCT系数。5.根据权利要求1-3中任一项所述的方法，其中，所述估计MDCT系数被选为等于在所述分组序列中紧挨在所述错误分组前面的接收分组的由能量缩放因子按缩放因子带分辨率进行能量调整的对应MDCT系数。6.根据权利要求1-5中任一项所述的方法，其中，所述接收分组包括与所述音频信号的N个加窗时域样本相关联的N/2个MDCT系数，所述方法还包括：通过逆MDCT(IMDCT)从所述掩盖帧产生包括N个加窗时域混叠样本的中间帧；基于所述中间帧的加窗时域混叠样本之间的对称关系来修改所述中间帧的加窗时域混叠样本。7.根据权利要求6所述的方法，其中，所述修改使用包括N个加窗时域混叠样本的中间帧的第一半的第一半和包括N个加窗时域混叠样本的中间帧的所述第一半的第二半之间的对称关系、以及包括N个加窗时域混叠样本的中间帧的第二半的第一半和包括N个加窗时域混叠样本的中间帧的所述第二半的第二半之间的对称关系。8.根据权利要求1-7中任一项所述的方法，其中，所述接收分组包括与所述音频信号的N个加窗时域样本相关联的N/2个MDCT系数，所述方法还包括：通过IMDCT从所述掩盖帧产生包括N个加窗时域混叠样本的中间帧；基于所述中间帧的加窗时域混叠样本和所述音频信号的所述N个时域样本中的加窗时域样本之间的关系来修改所述中间帧的加窗时域混叠样本。9.根据权利要求6-8中任一项所述的方法，其中，所述接收分组包括与所述音频信号的N个加窗时域样本相关联的N/2个MDCT系数，所述方法还包括：通过将所产生的中间帧的第一半与所产生的前一个中间帧的第二半相加来产生估计解码帧，所述前一个中间帧包括与在所述分组序列中紧挨在所述错误分组前面的接收分组相关联的N个加窗时域混叠样本。10.根据权利要求1-5中任一项所述的方法，其中，所述接收分组包括与所述音频信号的N个加窗时域样本相关联的N/2个MDCT系数，所述方法还包括：通过IMDCT来从所述掩盖帧产生包括N个加窗时域混叠样本的中间帧；通过将所产生的中间帧的第一半与所产生的前一个中间帧的第二半相加来产生估计解码帧，所述前一个中间帧包括与在所述分组序列中紧挨在所述错误分组前面的接收分组相关联的N个加窗时域混叠样本。11.一种用于掩盖在基于修正离散余弦变换MDCT的音频解码器中将被解码的数据分组中的错误的解码系统，所述基于MDCT的音频解码器被布置为将分组序列解码为解码帧序列，所述系统包括：接收器部分，被配置为从被布置为对音频信号进行编码的基于MDCT的音频编码器接收包括MDCT系数集合的分组，所述MDCT系数集合与包括所述音频信号的时域样本的帧相关联；错误检测部分，被配置为在所述接收分组包括一个或多个错误时，将所述接收分组识别为错误分组；以及错误掩盖部分，被配置为：产生用于替代所述错误分组的MDCT系数集合的估计MDCT系数，所述估计MDCT系数基于与在所述分组序列中紧挨在所述错误分组前面的接收分组相关联的对应MDCT系数；将所述估计MDCT系数中的MDCT系数的第一子集的符号指定为等于在所述分组序列中紧挨在所述错误分组前面的接收分组的对应MDCT系数的对应符号，其中，所述第一子集包括与所述分组的音调状谱区间相关联的MDCT系数；随机地指定所述估计MDCT系数中的MDCT系数的第二子集的符号，其中，所述第二子集包括与所述分组的噪声状谱区间相关联的MDCT系数；基于所述分组的估计MDCT系数和选定符号来产生掩盖分组；以及用所述掩盖分组来替代所述错误分组。12.一种用于掩盖在基于修正离散余弦变换MDCT的音频解码器中将被解码的数据分组中的错误的方法，所述基于MDCT的音频解码器被布置为将分组序列解码为解码帧序列，所述方法包括：从被布置为对音频信号进行编码的基于MDCT的音频编码器接收包括与所述音频信号的N个加窗时域样本相关联的N/2个MDCT系数的分组；在所述分组包括一个或多个错误时，将所述分组识别为错误分组；估计第一子集，所述第一子集包括中间帧的第一半的N/4个加窗时域混叠样本，所述中间帧包括与所述错误分组相关联的N个加窗时域混叠样本，所述估计基于所述第一子集的加窗时域混叠样本和所述音频信号的N个加窗时域样本中的加窗时域样本之间的关系；以及估计第二子集，所述第二子集包括所述中间帧的第一半的剩余N/4个加窗时域混叠样本，所述估计基于所述第二子集的加窗时域混叠样本和所述第一子集的加窗时域混叠样本之间的对称关系。13.根据权利要求12所述的方法，进一步包括：通过将所述中间帧的第一半与前一个中间帧的第二半相加来产生与所述错误分组相关联的估计解码帧，所述前一个中间帧与在所述分组序列中紧挨在所述错误分组前面的接收分组相关联。14.根据权利要求12所述的方法，其中所述第一子集的估计基于与在所述分组序列中紧挨在所述错误分组前面的接收分组相关联的前一个解码帧...

【专利技术属性】
技术研发人员：A·比斯沃斯，T·弗瑞尔德里驰，K·佩秋，
申请(专利权)人：杜比国际公司，
类型：发明
国别省市：荷兰,NL

全部详细技术资料下载我是这个专利的主人