用于帧间帧内联合预测模式的二次变换制造技术

技术编号:38428999 阅读:17 留言:0更新日期:2023-08-07 11:26
本申请关于用于帧间帧内联合预测模式的变换配置和信令。在一个示例中公开了一种对视频码流中的视频块进行解码的方法。所述方法包括:确定所述当前块是在CIIP模式下预测的;针对所述视频码流中的所述当前块,生成二次变换系数集合;通过以下方式,应用组合的帧间帧内二次变换:对所述二次变换系数集合执行反向可分离二次变换或反向不可分离二次变换,以获得所述当前块的主变换系数集合;对所述主变换系数集合执行反向主变换,以获得所述当前块的残差块;及,在所述CIIP模式下,基于所述残差块对所述当前块进行解码。所述当前块进行解码。所述当前块进行解码。

【技术实现步骤摘要】
【国外来华专利技术】用于帧间帧内联合预测模式的二次变换
[0001]引用并入
[0002]本申请要求于2022年9月21日提交的、申请号为17/949,429、专利技术名称为"用于帧间帧内联合预测模式的二次变换"的美国非临时申请的优先权,以及于2021年10月1日提交的、申请号为63/251,473、专利技术名称为“用于帧间帧内联合预测模式的二次变换”的美国临时申请的优先权,其全部内容通过引用并入本申请中。


[0003]本申请实施例涉及先进的视频编/解码技术集合,尤其涉及用于帧间帧内联合预测模式的变换技术和配置。

技术介绍

[0004]本文所提供的背景描述旨在整体呈现本申请的背景。在
技术介绍
部分以及本说明书的各个方面中所描述的目前已署名的专利技术人的工作所进行的程度,并不表明其在本申请提交时作为现有技术,且从未明示或暗示其被承认为本申请的现有技术。
[0005]通过具有运动补偿的帧间图片预测技术,可以进行视频编码和解码。未压缩的数字视频可包括一系列图片,每个图片具有例如1920
×
1080亮度样本及相关色度样本的空间维度。所述系列图片具有固定的或可变的图片速率(也非正式地称为帧率),例如每秒60个图片或60Hz。未压缩的视频具有非常大的比特率要求。例如,每个样本8比特的1080p60 4:2:0的视频(1920x1080亮度样本分辨率,60Hz帧率)要求接近1.5Gbit/s带宽。一小时这样的视频就需要超过600GB的存储空间。
[0006]视频编码和解码的一个目的,是通过压缩减少输入视频信号的冗余信息。视频压缩可以帮助降低对上述带宽或存储空间的要求,在某些情况下可降低两个或更多数量级。无损和有损压缩,以及两者的组合均可采用。无损压缩是指从压缩的原始信号中重建原始信号精确副本的技术。当使用有损压缩时,重建信号可能与原始信号不完全相同,但是原始信号和重建信号之间的失真足够小,使得重建信号可用于预期应用。有损压缩广泛应用于视频。容许的失真量取决于应用。例如,相比于电视应用的用户,某些消费流媒体应用的用户可以容忍更高的失真。可实现的压缩比反映出:较高的允许/容许失真可产生较高的压缩比。
[0007]视频编码器和解码器可利用几大类技术,例如包括:运动补偿、变换、量化和熵编码。
[0008]视频编解码器技术可包括已知的帧内编码技术。在帧内编码中,在不参考先前重建的参考图片的样本或其它数据的情况下表示样本值。在一些视频编解码器中,图片在空间上被细分为样本块。当所有的样本块都以帧内模式编码时,该图片可以为帧内图片。帧内图片及其衍生(例如独立解码器刷新图片)可用于复位解码器状态,因此可用作编码视频码流和视频会话中的第一图片,或用作静止图像。帧内块的样本可用于变换,且可在熵编码之前量化变换系数。帧内预测可以是使预变换域中的样本值最小化的技术。在某些情形下,变
换后的DC值越小,且AC系数越小,则在给定的量化步长尺寸下需要越少的比特来表示熵编码之后的块。
[0009]如同从诸如MPEG

2代编码技术中所获知的,传统帧内编码不使用帧内预测。然而,一些较新的视频压缩技术包括:试图从例如周围样本数据和/或元数据中得到数据块的技术,其中周围样本数据和/或元数据是在空间相邻的编码/解码期间、且在解码顺序之前获得的。这种技术后来被称为"帧内预测"技术。需要注意的是,至少在某些情形下,帧内预测仅使用正在重建的当前图片的参考数据,而不使用参考图片的参考数据。
[0010]可以存在许多不同形式的帧内预测。当在给定的视频编码技术中可以使用超过一种这样的技术时,所使用的技术可以按帧内预测模式进行编码。在某些情形下,模式可具有子模式和/或参数,且这些模式可单独编码或包含在模式码字中。将哪个码字用于给定模式/子模式/参数组合会通过帧内预测影响编解码效率增益,因此用于将码字转换成码流的熵编码技术也会出现这种情况。
[0011]H.264引入了一种帧内预测模式,其在H.265中进行了改进,且在更新的编码技术中进一步被改进,诸如联合开发模式(Joint Exploration Model,JEM),通用视频编码(Versatile Video Coding,VVC),以及基准集合(BenchMark Set,BMS)。可以使用属于已有样本的相邻样本的值,来形成预测块。根据方向,相邻样本的样本值被复制到预测块。所使用方向的参考,可以在码流中被编码,或者可以自身被预测。
[0012]参照图1A,右下方描绘了来自H.265的33个可能的预测方向(对应35个帧内预测模式中的33个角度模式)中已知的九个预测方向的子集。箭头会聚的点(101)表示正在被预测的样本。箭头表示样本正在被预测的方向。例如,箭头(102)表示根据右上方与水平方向成45度角的至少一个样本,预测样本(101)。类似地,箭头(103)表示根据左下方与水平方向成22.5度角的至少一个样本,预测样本(101)。
[0013]仍然参考图1A,在左上方示出了一个包括4
×
4个样本的正方形块(104)(由粗虚线表示)。正方形块(104)由16个样本组成,每个样本用“S”、以及其在Y维度上的位置(例如,行索引)和在X纬度上的位置(例如,列索引)来标记。例如,样本S21是Y维度上的第二个(从最上方)样本和X维度上的第一个样本(从左侧开始)。类似地,样本S44在X维度和Y维度上都是块(104)中的第四个样本。由于该块为4
×
4大小的样本,因此S44位于右下角。还示出了遵循类似编号方案的参考样本。参考样本用"R"、以及其相对于块(104)的Y位置(例如,行索引)和X位置(列索引)来标记。在H.264和H.265中,在重建时预测样本和块相邻,因此,不需要使用负值。
[0014]通过从信号通知的预测方向所占用的相邻样本来复制参考样本值,可以进行块104的帧内图片预测。例如,假设编码视频码流包括信令,对于该块,该信令指示与箭头(102)一致的预测方向,即,根据右上方与水平方向成45度角的至少一个预测样本来预测样本。在这种情况下,根据同一参考样本R05,预测样本S41、S32、S23和S14。然后,根据参考样本R08预测样本S44。
[0015]在某些情况下,例如通过内插,可以合并多个参考样本的值,以便计算参考样本,尤其是当方向不能被45度整除时。
[0016]随着视频编码技术的发展,方向的数量逐渐增加。在H.264(2003年)中,可以表示九种不同的方向。在H.265(2013年)和JEM/VVC/BMS中增加到了33个,而在此申请时,可以支
持多达65个方向。已经进行试验来识别出最可能的方向,熵编码中的某些技术可以用于以少量的比特来标识这些最可能的方向,接收损失某些不太可能的方向。进一步,这些方向本身有时可以从相邻、已解码的块所使用的相邻方向中预测得到。
[0017]图1B示出了根据JEM描绘65个帧内预测方向的示意图(180),以示出随时间增加的预测方向的数量。
[0018]本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种对视频码流中的当前块进行解码的方法,其特征在于,所述方法包括:确定所述当前块是在帧间帧内联合预测CIIP模式下预测的;针对所述视频码流中的所述当前块,生成二次变换系数集合;通过以下方式,应用组合的帧间帧内二次变换:对所述二次变换系数集合执行反向可分离二次变换或反向不可分离二次变换,以获得所述当前块的主变换系数集合;对所述主变换系数集合执行反向主变换,以获得所述当前块的残差块;及,在所述CIIP模式下,基于所述残差块对所述当前块进行解码。2.根据权利要求1所述的方法,其特征在于,进一步包括:在CIIP子模式候选集合中,确定用于所述视频码流中的所述当前块的所述CIIP模式的CIIP子模式,所述CIIP子模式指示在帧内预测模式集合中在所述当前块的所述CIIP模式下使用的帧内预测模式;基于所述帧内预测模式,确定用于所述反向可分离二次变换或所述反向不可分离二次变换的变换核。3.根据权利要求2所述的方法,其特征在于,所述确定变换核包括:基于所述帧内预测模式,从多个变换核集合中确定变换核集合;从所述视频码流中抽取出与所述当前块相关联的核选择指标;基于所述核选择指标,从所述变换核集合中选择出所述变换核。4.根据权利要求2所述的方法,其特征在于,所述帧内预测模式集合包括如下中的至少一个:DC_PRED模式;V_PRED模式;H_PRED模式;或SMOOTH_PRED模式。5.根据权利要求2

4中任一项所述的方法,其特征在于,所述CIIP子模式候选集合包括如下中的至少一个:II_DC_PRED模式;II_V_PRED模式;II_H_PRED模式;或II_SMOOTH_PRED模式。6.根据权利要求5所述的方法,其特征在于,响应于所述CIIP子模式为所述II_DC_PRED模式,确定所述变换核与DC_PRED帧内预测模式预关联;响应于所述CIIP子模式为所述II_V_PRED模式,确定所述变换核与V_PRED帧内预测模式预关联;响应于所述CIIP子模式为所述II_H_PRED模式,确定所述变换核与H_PRED帧内预测模式预关联;响应于所述CIIP子模式为所述II_SMOOTH_PRED模式,确定所述变换核与SMOOTH_PRED帧内预测模式预关联。
7.根据权利要求2

4中任一项所述的方法,其特征在于,基于所述帧内预测模式,从多个变换核集合中确定变换核集合,仅响应于确定出在所述当前块的样本的CIIP模式下的帧内预测权重是基于所述样本的位置进行公式化推导得到的。8.根据权利要求7所述的方法,其特征在于,所述当前块的所述样本的所述帧内预测权重,取决于所述帧内预测模式,并且沿所述帧内预测的预测方向而减小。9.根据权利要求1所述的方法,其特征在于,所述CIIP模式下与所述当前块相关联的帧内预测权重,包括预定空间权重模式集合中的空间权重模式。10.根据权利要求9所述的方法,进一步包括:基于所述空间权重模式,确定在所述反向不可分离二次变换中使用的变换核。11.根据权利要求9所述的方法,进一步包括:从所述视频码流中抽取出空间权重模式指标,所述空间权重模式指标指示所述预定空间权重模式集合中的所述空间权重模式;根据所述空间权重模式指标,确定所述空间权重模式。12.一种对视频码流中的当前块进行解码的设备,其特征在于,所述设备包括用于存储计算机指令的存储器以及与所述存储器通信的处理器,其中,当所述处理器执行所述计算机指令时,所述处理器被配置为使得所述设备执行:确定所述当前块是在帧间帧内联合预测CIIP模式下预测的;针对所述视频码流中的所述当前块,生成二次变换...

【专利技术属性】
技术研发人员:马杜
申请(专利权)人:腾讯美国有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1