用于视频编码的方法和装置制造方法及图纸

技术编号:30508773 阅读:15 留言:0更新日期:2021-10-27 22:48
本申请的各方面提供了用于视频编码/解码的方法和装置。该装置包括处理电路,该处理电路从已编码的视频比特流中解码编码单元(CU)的编码信息。所述编码信息指示所述CU中的第一编码块(CB)的多个非零变换系数的最后位置。该处理电路基于所述最后位置,确定在所述编码信息中是否通过信号通知了二次变换索引,并且基于确定在所述编码信息中是否通过信号通知了所述二次变换索引,确定是否对第二CB执行二次变换。响应于确定执行所述二次变换,该处理电路对所述第二CB执行所述二次变换并重建所述第二CB。响应于确定不执行所述二次变换,该处理电路重建所述第二CB而不对所述第二CB执行所述二次变换。所述二次变换。所述二次变换。

【技术实现步骤摘要】
【国外来华专利技术】用于视频编码的方法和装置
[0001]援引并入
[0002]本申请要求于2020年4月2日提交的题为“Method and Apparatus for Video Coding”的美国专利申请第16/838,755号的优先权权益,该美国专利申请要求了于2019年4月4日提交的题为“Modifications on the Secondary Transform”的美国临时申请第62/829,435号的优先权权益,这些专利申请的全部内容通过引用并入本文中。


[0003]本申请描述了总体上涉及视频编码的实施例。

技术介绍

[0004]本文所提供的背景描述是出于总体上呈现本公开内容的目的。在
技术介绍
部分以及本说明书的各个方面中所描述的目前已署名的专利技术人的工作所进行的程度,并不表明其在本申请提交时作为现有技术,且从未明示或暗示其被承认为本申请的现有技术。
[0005]可以使用具有运动补偿的帧间图片预测来执行视频编码和解码。未压缩的数字视频可以包括一系列图片,每个图片具有例如1920
×
1080亮度样本和相关联的色度样本的空间大小。该一系列图片可以具有例如每秒60幅图片或60Hz的固定的或可变的图片速率(也非正式地称为帧率)。未压缩的视频具有很高的位速率要求。例如,每样本8位的1080p60 4:2:0的视频(60Hz帧率的1920x1080亮度样本分辨率)需要接近1.5Gbit/s的带宽。一小时的此类视频需要600GB以上的存储空间。
[0006]视频编码和解码的一个目的可以是通过压缩来减少输入视频信号中的冗余。压缩可以有助于减小上述带宽或存储空间需求,在某些情况下可以减小两个数量级或大于两个数量级。可以采用无损压缩和有损压缩,以及它们的组合。无损压缩是指可以从已压缩的原始信号中重建原始信号的精确副本的技术。当使用有损压缩时,已重建的信号可能与原始信号不同,但是原始信号和重建的信号之间的失真足够小,以使已重建的信号可用于预期的应用。在视频的情况下,广泛使用有损压缩。可容忍的失真量取决于应用,例如某些消费流媒体应用的用户相比电视贡献应用的用户来说可以容忍更高的失真。可达到的压缩率可以反映:更高的可容许/接受的失真可以产生更高的压缩率。
[0007]视频编码器和解码器可以利用多种广泛类别的技术,例如,包括:运动补偿、变换、量化和熵编码。
[0008]视频编解码器技术可以包括称为帧内编码的技术。在帧内编码中,在不参考来自先前重建的参考图片的样本或其他数据的情况下表示样本值。在某些视频编解码器中,图片在空间上细分为样本块。当所有的样本块都以帧内模式编码时,该图片可以是帧内图片。帧内图片及其派生方式(例如独立的解码器刷新图片)可以用于重置解码器状态,并且因此可以用作编码视频比特流和视频会话中的第一张图片,或者用作静止图像。可以使帧内块的样本进行变换,并且可以在熵编码之前对变换系数进行量化。帧内预测可以是一种使预变换域中的样本值最小化的技术。在某些情况下,变换后的DC值越小,且AC系数越小,则在
给定的量化步长尺寸下就需要越少的比特来表示熵编码后的块。
[0009]诸如从例如MPEG

2代编码技术已知的,传统帧内编码不使用帧内预测。然而,一些较新的视频压缩技术包括从例如周围样本数据和/或元数据中尝试的技术,周围样本数据和/或元数据是在空间上相邻的且在解码顺序上在先的数据块的编码/解码期间获得的。此类技术此后称为“帧内预测”技术。注意,至少在某些情况下,帧内预测仅使用来自正在重建的当前图片的参考数据,而不使用来自参考图片的参考数据。
[0010]帧内预测可以有许多不同的形式。当在给定的视频编码技术中可以使用不止一种这样的技术时,可以以帧内预测模式对使用中的技术进行编码。在某些情况下,模式可以具有子模式和/或参数,并且这些子模式和/或参数可以单独编码或包含在模式码字中。对给定的模式/子模式/参数组合使用哪个代码字可能会通过帧内预测对编码效率增益产生影响,因此用于将代码字转换为比特流的熵编码技术同样对其也可以产生影响。
[0011]使用H.264引入了某种帧内预测模式,并在H.265中对其进行了改进,并在诸如联合探索模型(Joint Exploration Model,JEM)、下一代视频编码(Versatile Video Coding,VVC)、基准集(Benchmark Set,BMS)等新的编码技术中进一步进行了改进。可以使用属于已经可用样本的相邻样本值来形成预测器块。根据方向将相邻样本的样本值复制到预测器块中。对使用方向的参考可以编码在比特流中,或者可以对其本身进行预测。
[0012]参照图1A,右下方描绘的是从H.265的33种可能的预测器方向(对应于35个帧内模式中的33个角模式(angular modes))中得知的9个预测器方向的子集。箭头收敛的点(101)表示正在被预测的样本。箭头表示正在被预测的样本的方向。例如,箭头(102)指示从与水平线成45度角的右上方向的一个或多个样本中预测样本(101)。同样,箭头(103)表示从与水平线成22.5度角的左下方向的一个或多个样本中预测样本(101)。
[0013]仍然参考图1A,在左上角描绘了一个4x4个样本的正方形块(104)(由粗体虚线表示)。正方形块(104)包含16个样本,每个样本使用“S”及其在Y维度上的位置(例如,行索引)和其在X维度上的位置(例如列索引)来标记。例如,样本S21是Y维度上(从顶部开始)的第二个样本,以及X维度上(从左侧开始)的第一个样本。类似地,样本S44在Y和X维度上都是块(104)中的第四个样本。由于块的大小为4x4个样本,因此S44在右下角。图1中还示出了参考样本,它们遵循类似的编号方案。参考样本用R及其相对于块(104)的Y位置(例如行索引)和X位置(列索引)来标记。在H.264和H.265二者中,预测样本都与正在重建的块相邻,因此,无需使用负值。
[0014]帧内图片预测可以通过从信号通知的预测方向所占用的相邻样本复制参考样本值来工作。例如,假设编码视频比特流包括信令(signaling),该信令针对该块指示与箭头(102)一致的预测方向,也就是说,样本是从与水平方向成45度角的右上角的一个或多个预测样本进行预测的。在这种情况下,从同一个参考样本R05预测样本S41、S32、S23和S14。然后,根据参考样本R08预测样本S44。
[0015]在某些情况下,可以例如通过插值来组合多个参考样本的值,以便计算参考样本,尤其是当方向不能被45度整除时。
[0016]随着视频编码技术的发展,可能的方向的数量已经增加。在H.264(2003年)中,可以表示九个不同的方向。这一数字在H.265(2013年)增加到了33个,而在本公开时,JEM/VVC/BMS中可支持多达65个方向。已经进行了实验以识别最可能的方向,并且熵编码中的某
些技术被用来以少量的比特来表示那些可能的方向,对不太可能的方向接受一定的代价。此外,有本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种用于解码器中的视频解码的方法,包括:从已编码的视频比特流中解码编码单元(CU)的编码信息,所述编码信息指示所述CU中的第一编码块(CB)的多个非零变换系数的最后位置;基于所述最后位置,确定在所述编码信息中是否通过信号通知了二次变换索引;基于确定在所述编码信息中是否通过信号通知了所述二次变换索引,确定是否对第二CB执行二次变换;响应于确定执行所述二次变换,对所述第二CB执行所述二次变换并重建所述第二CB;以及响应于确定不执行所述二次变换,重建所述第二CB而不对所述第二CB执行所述二次变换。2.如权利要求1所述的方法,其特征在于,所述确定是否通过信号通知了所述二次变换索引包括:确定所述最后位置的水平分量是否小于第一阈值以及所述最后位置的垂直分量是否小于第二阈值;以及响应于确定所述水平分量小于所述第一阈值并且确定所述垂直分量小于所述第二阈值,确定在所述编码信息中未通过信号通知所述二次变换索引。3.如权利要求1所述的方法,其特征在于,所述确定是否通过信号通知了所述二次变换索引包括:确定所述最后位置的水平分量与垂直分量之和是否小于阈值;以及响应于确定所述和小于所述阈值,确定在所述编码信息中未通过信号通知所述二次变换索引。4.如权利要求1所述的方法,其特征在于,所述确定是否通过信号通知了所述二次变换索引包括:确定所述最后位置的(i)水平分量和(ii)垂直分量中的最小值是否小于阈值;以及响应于确定所述最小值小于所述阈值,确定在所述编码信息中未通过信号通知所述二次变换索引。5.如权利要求1所述的方法,其特征在于,所述确定是否通过信号通知了所述二次变换索引包括:确定所述最后位置的(i)水平分量和(ii)垂直分量中的最大值是否小于阈值;以及响应于确定所述最大值小于所述阈值,确定在所述编码信息中未通过信号通知所述二次变换索引。6.如权利要求1所述的方法,其特征在于,所述第一CB是亮度块;所述最后位置为所述亮度块的最后亮度位置;以及所述确定是否通过信号通知了所述二次变换索引包括:基于所述最后亮度位置确定是否通过信号通知了所述二次变换索引。7.如权利要求1所述的方法,其特征在于,所述第一CB是亮度块;所述最后位置为所述亮度块的最后亮度位置;
所述CU还包括色度块;所述编码信息还指示所述色度块的多个非零变换系数的最后色度位置;以及所述确定是否通过信号通知了所述二次变换索引包括:基于所述最后亮度位置和所述最后色度位置来确定是否通过信号通知了所述二次变换索引。8.一种用于解码器中的视频解码的方法,包括:从已编码的视频比特流中解码编码单元(CU)的编码信息,所述编码信息指示所述CU的尺寸;以及基于所述CU的所述尺寸和CU尺寸阈值来确定是否允许二次变换,其中,当所述CU的所述尺寸小于或等于所述CU尺寸阈值时,确定允许所述二次变换;当所述CU的所述尺寸大于所述CU尺寸阈值时,确定不允许所述二次变换。9.如权利要求8所述的方法,其特征在于,所述CU尺寸阈值是所述CU中变换单元的最大尺寸。10.如权利要求8所述的方法,其特征在于,所述方法还包括:当所述CU的所述尺寸小于或等于所述CU尺寸阈值时,确定所述CU中的至少一个CB的非零变换系数的数目,所述至少一个CB中的每一个CB的尺寸大于或等于第一阈值;以及响应于所述非零变换系数的数目小于第二阈值,确定在所述编码信息中未通过信号通知二次变换索引。11.如权利要求10所述的方法,其特征在于,所述编码信息指示所述CU的颜色格式为YUV 4:2:0;所述CU包括一个亮度块和两个色度块;...

【专利技术属性】
技术研发人员:赵欣李翔刘杉
申请(专利权)人:腾讯美国有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1