MDCT域错误掩盖制造技术

技术编号:15919753 阅读:23 留言:0更新日期:2017-08-02 04:54
一种错误掩盖音频解码方法包括:接收包括对音频信号的时域样本的帧进行编码的MDCT系数集合的分组;将接收分组识别为错误的;基于与紧挨在错误分组前面的接收分组相关联的对应MDCT系数来产生替代错误分组的MDCT系数集合的估计MDCT系数;将估计MDCT系数中的MDCT系数的第一子集的符号指定为与所述前一个分组的对应MDCT系数的符号一致,其中,第一子集包括与音调状谱区间相关联的那些MDCT系数;随机地指定估计MDCT系数中的MDCT系数的第二子集的符号,其中,第二子集包括与噪声状谱区间相关联的MDCT系数;用包含估计MDCT系数和指定的符号的掩盖分组替代错误分组。

【技术实现步骤摘要】
【国外来华专利技术】MDCT域错误掩盖
本文公开的专利技术总体上涉及音频信号的编码和解码,并且特别地,涉及用于掩盖错误的方法和装置。
技术介绍
修正离散余弦变换(MDCT)和对应的逆修正离散变换(IMDCT)被用于例如音频译码和解码技术,诸如MPEG-2和MPEG-4音频层、高级音频编码、MPEG-4HE-AAC、MPEG-DUSAC、杜比数字(Plus)以及其他专有格式。在这种技术的应用中,在分组在解码系统中被接收之前或之后,由于与音频信号的变换相关的分组丢失或分组错误,有时会出现错误。这样的错误例如包括分组丢失或分组失真,并且可能导致解码音频信号的听得见的失真。因此已经提供了用于在分组中出现错误的情况下掩盖错误的方法。错误掩盖法一般分为估计掩盖法和非估计掩盖法,在估计掩盖法中,错误帧被估计替代,非估计掩盖法例如使用错误帧的静默、帧重复或噪声代替。估计掩盖法包括在频域中使用估计的方法(诸如美国专利No.8620644中公开的方法)以及在时域中使用估计的方法(诸如国际专利公开No.WO/2014/052746中公开的方法)。用于错误掩盖的所有技术都面临与掩盖的质量和所需估计的复杂度之间的权衡相关的问题。因此,存在对于错误掩盖的其他方法的需求。附图说明现在将参照附图来描述示例性实施例,其中:图1A和图1B分别以举例的方式描绘MDCT和IMDCT的概括框图,图2是第一解码系统的概括框图,图3是第二解码系统的概括框图,以及图4是第三解码系统的概括框图。所有图都是示意性的,并且一般仅描绘阐明本公开所必需的部分,而其他部分则可以被省略或仅被建议。除非另有指示,否则相似的附图标记指代不同图中的相同部分。具体实施方式鉴于以上,一个目的是提供旨在以不显著的复杂度提供期望的错误掩盖的解码器系统和相关方法。I.概述——第一方面根据第一方面,示例性实施例提出了用于解码的解码方法、解码系统以及计算机程序产品。所提出的方法、解码系统以及计算机程序产品一般可以具有相同的特征和优点。根据示例性实施例,提供了一种用于掩盖在基于MDCT的音频解码器中将被解码的数据分组中的错误的方法,该音频解码器被布置为将分组序列解码为解码帧序列。该方法包括:从被布置为对音频信号进行编码的基于MDCT的音频编码器接收包括MDCT系数集合的分组,该MDCT系数集合与包括音频信号的时域样本的帧相关联;并且在接收分组(receivedpacket)包括一个或多个错误时,将接收分组识别为错误分组。该方法还包括产生替代错误分组的MDCT系数集合的估计MDCT系数,估计MDCT系数基于与在分组序列中紧挨在错误分组前面的接收分组相关联的对应MDCT系数。该方法还包括:将估计MDCT系数中的MDCT系数的第一子集的符号指定为等于在分组序列中紧挨在错误分组前面的接收分组的对应MDCT系数的对应符号,其中,第一子集包括与分组的音调状谱区间(tonal-likespectralbin)相关联的这些MDCT系数;并且随机地指定估计MDCT系数中的MDCT系数的第二子集的符号,其中第二子集包括与分组的噪声状谱区间(noise-likespectralbin)相关联的这些MDCT系数;基于所述分组的选定符号和估计MDCT系数来产生掩盖分组;并且用掩盖分组来替代错误分组。如本文所使用的,“错误分组”表示包括以某种方式相对于音频信号的正确样本的正确MDCT的MDCT系数不同的MDCT系数。这可能意味着,整个分组的一部分在分组序列中丢失,或者整个分组的一部分包括失真。分组的音调状谱区间和噪声状谱区间的识别可以使用任何合适的方法来执行。音调状谱区间和噪声状谱区间的识别的次序是任意的,并且可以例如取决于所用方法。要注意,术语“第一子集”和“第二子集”仅用于在文本中将这两个子集相互区分开,而不是用于指示与这两个不同子集相关的处理次序。指定的执行次序是任意的。可以首先对用于第一子集的MDCT系数执行指定,最后对用于第二子集的MDCT系数执行指定,或者倒过来。此外,在一些示例性实施例中,可以不对MDCT系数执行指定,以使得与第一子集相关联的所有MDCT系数都被连续地指定,并且与第二子集相关联的所有MDCT系数都被连续地指定。在一些示例性实施例中,可以首先对其中一个子集的一个或多个MDCT系数进行指定,然后对其他子集的一个或多个MDCT系数进行指定。此外,分组不一定具有与噪声状谱区间和音调状谱区间这两者相关联的MDCT系数。在一些示例性实施例中,分组可以具有与噪声状谱区间相关联的所有MDCT系数或者全都与音调状谱区间相关联,以使得其中一个子集是空的。最后,MDCT系数通常被识别为要么属于第一子集、要么属于第二子集。要注意,使估计基于与在分组序列中紧挨在错误分组前面的接收分组相关联的MDCT系数和MDCT系数符号不排除估计可以附加地基于与在分组序列中比紧挨在错误分组前面的分组更早的接收分组相关联的MDCT系数和MDCT系数符号。如本文所使用的,“产生估计MDCT系数”涉及将如下值指定给MDCT系数:这些值不一定是在错误分组中尚未存在任何错误时MDCT系数将会具有的值的最佳近似(approximation),而是实现期望的错误掩盖性能以使得解码音频信号的不想要的失真被避免或减少。如本文所使用的,“估计MDCT系数”涉及所估计的MDCT系数的绝对值。根据示例性实施例,该方法还包括:对于每个估计MDCT系数,基于与错误分组相关联的功率谱的近似的谱峰检测来确定MDCT系数是与音调状谱区间相关联、还是与噪声状谱区间相关联,其中,近似的功率谱基于与在分组序列中紧挨在错误分组前面的接收分组相关联的功率谱。根据一些实施例,该方法还包括:对于每个估计MDCT系数,基于与分组相关联的元数据来确定MDCT系数是与音调状谱区间相关联、还是与噪声状谱区间相关联,其中,元数据是在包括分组序列和元数据的比特流中接收的。如本文所使用的,“元数据”涉及用于控制音频解码器处理的比特流参数。元数据可以在分组序列的分组中以及在包括分组序列和元数据的比特流中的分组的外部被发送。可以用于确定MDCT系数是与音调状谱区间相关联还是与噪声状谱区间相关联的元数据是用于基于音频内容类型来控制某个音频解码器处理的元数据。这种元数据的一个例子是与AC-4中使用的压扩工具相关的元数据。在一些实施例中,对于音调信号可以关掉压扩(compand)工具,因此,如果压扩关闭,则信号被假定为是音调。作为另一个例子,如果最长的MDCT被使用,则音频内容最可能是音调信号。根据一些实施例,估计MDCT系数被选为等于在分组序列中紧挨在错误分组前面的接收分组的对应MDCT系数。根据一些实施例,估计MDCT系数被选为等于在分组序列中紧挨在错误分组前面的接收分组的以缩放因子带分辨率被用能量缩放因子进行能量调整的对应MDCT系数。关于缩放因子带分辨率的详细描述,参照ETSITS103190V1.1.1“DigitalAudioCompression(AC-4)Standard”,2014-04,其内容通过引用并入本文。根据一些实施例,接收分组包括与音频信号的N个加窗时域样本相关联的N/2个MDCT系数,进一步包括:通过IMDCT从掩盖帧产生包括N个加窗时域混叠样本的中间帧;基于中间帧的加本文档来自技高网...
MDCT域错误掩盖

【技术保护点】
一种用于掩盖在基于修正离散余弦变换MDCT的音频解码器中将被解码的数据分组中的错误的方法,所述基于MDCT的音频解码器被布置为将分组序列解码为解码帧序列,所述方法包括:从被布置为对音频信号进行编码的基于MDCT的音频编码器接收包括MDCT系数集合的分组,所述MDCT系数集合与包括所述音频信号的时域样本的帧相关联;在接收分组包括一个或多个错误时,将该接收分组识别为错误分组;产生用于替代所述错误分组的MDCT系数集合的估计MDCT系数,所述估计MDCT系数基于与在所述分组序列中紧挨在所述错误分组前面的接收分组相关联的对应MDCT系数;将所述估计MDCT系数中的MDCT系数的第一子集的符号指定为等于在所述分组序列中紧挨在所述错误分组前面的接收分组的对应MDCT系数的对应符号,其中,所述第一子集包括与所述分组的音调状谱区间相关联的MDCT系数;随机地指定所述估计MDCT系数中的MDCT系数的第二子集的符号,其中,所述第二子集包括与所述分组的噪声状谱区间相关联的MDCT系数;基于所述分组的所述估计MDCT系数和选定符号来产生掩盖分组;以及用所述掩盖分组来替代所述错误分组。

【技术特征摘要】
【国外来华专利技术】2014.12.09 US 62/089,5631.一种用于掩盖在基于修正离散余弦变换MDCT的音频解码器中将被解码的数据分组中的错误的方法,所述基于MDCT的音频解码器被布置为将分组序列解码为解码帧序列,所述方法包括:从被布置为对音频信号进行编码的基于MDCT的音频编码器接收包括MDCT系数集合的分组,所述MDCT系数集合与包括所述音频信号的时域样本的帧相关联;在接收分组包括一个或多个错误时,将该接收分组识别为错误分组;产生用于替代所述错误分组的MDCT系数集合的估计MDCT系数,所述估计MDCT系数基于与在所述分组序列中紧挨在所述错误分组前面的接收分组相关联的对应MDCT系数;将所述估计MDCT系数中的MDCT系数的第一子集的符号指定为等于在所述分组序列中紧挨在所述错误分组前面的接收分组的对应MDCT系数的对应符号,其中,所述第一子集包括与所述分组的音调状谱区间相关联的MDCT系数;随机地指定所述估计MDCT系数中的MDCT系数的第二子集的符号,其中,所述第二子集包括与所述分组的噪声状谱区间相关联的MDCT系数;基于所述分组的所述估计MDCT系数和选定符号来产生掩盖分组;以及用所述掩盖分组来替代所述错误分组。2.根据权利要求1所述的方法,进一步包括:对于所述估计MDCT系数中的每个,基于与所述错误分组相关联的功率谱的近似的谱峰检测来确定所述MDCT系数是与音调状谱区间相关联还是与噪声状谱区间相关联,其中,近似的功率谱基于与在所述分组序列中紧挨在所述错误分组前面的接收分组相关联的功率谱。3.根据权利要求1所述的方法,进一步包括:对于所述估计MDCT系数中的每个,基于与所述分组相关联的元数据来确定所述MDCT系数是与音调状谱区间相关联还是与噪声状谱区间相关联,其中,所述元数据是在包括分组序列和元数据的比特流中接收的。4.根据权利要求1-3中任一项所述的方法,其中,所述估计MDCT系数被选为等于在所述分组序列中紧挨在所述错误分组前面的接收分组的对应MDCT系数。5.根据权利要求1-3中任一项所述的方法,其中,所述估计MDCT系数被选为等于在所述分组序列中紧挨在所述错误分组前面的接收分组的由能量缩放因子按缩放因子带分辨率进行能量调整的对应MDCT系数。6.根据权利要求1-5中任一项所述的方法,其中,所述接收分组包括与所述音频信号的N个加窗时域样本相关联的N/2个MDCT系数,所述方法还包括:通过逆MDCT(IMDCT)从所述掩盖帧产生包括N个加窗时域混叠样本的中间帧;基于所述中间帧的加窗时域混叠样本之间的对称关系来修改所述中间帧的加窗时域混叠样本。7.根据权利要求6所述的方法,其中,所述修改使用包括N个加窗时域混叠样本的中间帧的第一半的第一半和包括N个加窗时域混叠样本的中间帧的所述第一半的第二半之间的对称关系、以及包括N个加窗时域混叠样本的中间帧的第二半的第一半和包括N个加窗时域混叠样本的中间帧的所述第二半的第二半之间的对称关系。8.根据权利要求1-7中任一项所述的方法,其中,所述接收分组包括与所述音频信号的N个加窗时域样本相关联的N/2个MDCT系数,所述方法还包括:通过IMDCT从所述掩盖帧产生包括N个加窗时域混叠样本的中间帧;基于所述中间帧的加窗时域混叠样本和所述音频信号的所述N个时域样本中的加窗时域样本之间的关系来修改所述中间帧的加窗时域混叠样本。9.根据权利要求6-8中任一项所述的方法,其中,所述接收分组包括与所述音频信号的N个加窗时域样本相关联的N/2个MDCT系数,所述方法还包括:通过将所产生的中间帧的第一半与所产生的前一个中间帧的第二半相加来产生估计解码帧,所述前一个中间帧包括与在所述分组序列中紧挨在所述错误分组前面的接收分组相关联的N个加窗时域混叠样本。10.根据权利要求1-5中任一项所述的方法,其中,所述接收分组包括与所述音频信号的N个加窗时域样本相关联的N/2个MDCT系数,所述方法还包括:通过IMDCT来从所述掩盖帧产生包括N个加窗时域混叠样本的中间帧;通过将所产生的中间帧的第一半与所产生的前一个中间帧的第二半相加来产生估计解码帧,所述前一个中间帧包括与在所述分组序列中紧挨在所述错误分组前面的接收分组相关联的N个加窗时域混叠样本。11.一种用于掩盖在基于修正离散余弦变换MDCT的音频解码器中将被解码的数据分组中的错误的解码系统,所述基于MDCT的音频解码器被布置为将分组序列解码为解码帧序列,所述系统包括:接收器部分,被配置为从被布置为对音频信号进行编码的基于MDCT的音频编码器接收包括MDCT系数集合的分组,所述MDCT系数集合与包括所述音频信号的时域样本的帧相关联;错误检测部分,被配置为在所述接收分组包括一个或多个错误时,将所述接收分组识别为错误分组;以及错误掩盖部分,被配置为:产生用于替代所述错误分组的MDCT系数集合的估计MDCT系数,所述估计MDCT系数基于与在所述分组序列中紧挨在所述错误分组前面的接收分组相关联的对应MDCT系数;将所述估计MDCT系数中的MDCT系数的第一子集的符号指定为等于在所述分组序列中紧挨在所述错误分组前面的接收分组的对应MDCT系数的对应符号,其中,所述第一子集包括与所述分组的音调状谱区间相关联的MDCT系数;随机地指定所述估计MDCT系数中的MDCT系数的第二子集的符号,其中,所述第二子集包括与所述分组的噪声状谱区间相关联的MDCT系数;基于所述分组的估计MDCT系数和选定符号来产生掩盖分组;以及用所述掩盖分组来替代所述错误分组。12.一种用于掩盖在基于修正离散余弦变换MDCT的音频解码器中将被解码的数据分组中的错误的方法,所述基于MDCT的音频解码器被布置为将分组序列解码为解码帧序列,所述方法包括:从被布置为对音频信号进行编码的基于MDCT的音频编码器接收包括与所述音频信号的N个加窗时域样本相关联的N/2个MDCT系数的分组;在所述分组包括一个或多个错误时,将所述分组识别为错误分组;估计第一子集,所述第一子集包括中间帧的第一半的N/4个加窗时域混叠样本,所述中间帧包括与所述错误分组相关联的N个加窗时域混叠样本,所述估计基于所述第一子集的加窗时域混叠样本和所述音频信号的N个加窗时域样本中的加窗时域样本之间的关系;以及估计第二子集,所述第二子集包括所述中间帧的第一半的剩余N/4个加窗时域混叠样本,所述估计基于所述第二子集的加窗时域混叠样本和所述第一子集的加窗时域混叠样本之间的对称关系。13.根据权利要求12所述的方法,进一步包括:通过将所述中间帧的第一半与前一个中间帧的第二半相加来产生与所述错误分组相关联的估计解码帧,所述前一个中间帧与在所述分组序列中紧挨在所述错误分组前面的接收分组相关联。14.根据权利要求12所述的方法,其中所述第一子集的估计基于与在所述分组序列中紧挨在所述错误分组前面的接收分组相关联的前一个解码帧...

【专利技术属性】
技术研发人员:A·比斯沃斯T·弗瑞尔德里驰K·佩秋
申请(专利权)人:杜比国际公司
类型:发明
国别省市:荷兰,NL

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1