用于视频编码的方法和装置制造方法及图纸

技术编号:26075378 阅读:50 留言:0更新日期:2020-10-28 16:49
提供了用于视频编码的方法和装置。所述装置包括处理电路。通过所述处理电路对已编码的视频比特流中的第一块的预测信息进行解码。该第一块是非正方形块,并且该第一块的预测信息指示与该非正方形块相关联的第一组帧内预测模式中的第一帧内预测模式。该第一组帧内预测模式包括第一数量的帧内预测模式,所述第一数量的帧内预测模式不同于与正方形块相关联的第二组帧内预测模式。该第一数量是基于该第一块的宽高比而确定的正整数。随后,通过所述处理电路根据该第一帧内预测模式来重构该第一块的至少一个样本。

【技术实现步骤摘要】
【国外来华专利技术】用于视频编码的方法和装置援引并入本申请要求于2018年9月28日提交的题为“METHODANDAPPARATUSFORVIDEOCODING”的美国专利申请第16/147,246号(现在是美国专利第10,284,860号)的优先权权益,该美国专利申请要求了于2018年7月2日提交的题为“METHODSANDAPPARATUSFORWIDEANGULARINTRAPREDICTIONINVIDEOCOMPRESSION”的美国临时申请第62/693,050号的优先权权益,这些专利申请的全部内容通过引用并入本文中。
本申请描述了总体上涉及视频编码的实施例。
技术介绍
本文所提供的背景描述是出于总体上呈现本申请内容的目的。在
技术介绍
部分以及本说明书的各个方面中所描述的目前已署名的专利技术人的工作所进行的程度,并不表明其在本申请提交时作为现有技术,且从未明示或暗示其被承认为本申请的现有技术。可以使用具有运动补偿的帧间图片预测来执行视频编码和解码。未压缩的数字视频可以包括一系列图片,每个图片具有例如为1920x1080的亮度样本及相关的色度样本的空间大小。该一系列图片可以具有例如每秒60幅图片或60Hz的固定的或可变的图片速率(也非正式地称为帧率)。未压缩的视频具有很高的位速率要求。例如,每样本8位的1080p604:2:0的视频(60Hz帧率的1920x1080亮度样本分辨率)需要接近1.5Gbit/s的带宽。一小时的此类视频需要600GB以上的存储空间。视频编码和解码的一个目的可以是通过压缩来减少输入视频信号中的冗余。压缩可以有助于减小上述带宽或存储空间需求,在某些情况下可以减小两个数量级或大于两个数量级。可以采用无损压缩和有损压缩,以及它们的组合。无损压缩是指可以从已压缩的原始信号中重建原始信号的精确副本的技术。当使用有损压缩时,已重建的信号可能与原始信号不同,但是原始信号和重建的信号之间的失真足够小,以使已重建的信号可用于预期的应用。在视频的情况下,广泛使用有损压缩。可容忍的失真量取决于应用,例如某些消费流媒体应用的用户相比电视贡献应用的用户来说可以容忍更高的失真。可达到的压缩率可以反映:更高的可容许/接受的失真可以产生更高的压缩率。视频编码器和解码器可以利用多种广泛类别的技术,例如,包括:运动补偿、变换、量化和熵编码。视频编解码器技术可以包括称为帧内编码的技术。在帧内编码中,在不参考来自先前重建的参考图片的样本或其他数据的情况下表示样本值。在某些视频编解码器中,图片在空间上细分为样本块。当所有的样本块都以帧内模式编码时,该图片可以是帧内图片。帧内图片及其派生方式(例如独立的解码器刷新图片)可以用于重置解码器状态,并且因此可以用作编码视频比特流和视频会话中的第一张图片,或者用作静止图像。可以使帧内块的样本进行变换,并且可以在熵编码之前对变换系数进行量化。帧内预测可以是一种使预变换域中的样本值最小化的技术。在某些情况下,变换后的DC值越小,且AC系数越小,则在给定的量化步长尺寸下就需要越少的比特来表示熵编码后的块。诸如从例如MPEG-2代编码技术已知的,传统帧内编码不使用帧内预测。然而,一些较新的视频压缩技术包括从例如周围样本数据和/或元数据中尝试的技术,周围样本数据和/或元数据是在空间上相邻的且在解码顺序上在先的数据块的编码/解码期间获得的。此类技术此后称为“帧内预测”技术。注意,至少在某些情况下,帧内预测仅使用来自正在重建的当前图片的参考数据,而不使用来自参考图片的参考数据。帧内预测可以有许多不同的形式。当在给定的视频编码技术中可以使用不止一种这样的技术时,可以以帧内预测模式对中的技术进行编码。在某些情况下,模式可以具有子模式和/或参数,并且这些子模式和/或参数可以单独编码或包含在模式码字中。对给定的模式/子模式/参数组合使用哪个代码字可能会通过帧内预测对编码效率增益产生影响,因此用于将代码字转换为比特流的熵编码技术同样对其也可以产生影响。使用H.264引入了某种帧内预测模式,并在H.265中对其进行了改进,并在诸如联合探索模型(JointExplorationModel,JEM)、下一代视频编码(VersatileVideoCoding,VVC)、基准集(BenchmarkSet,BMS)等新的编码技术中进一步进行了改进。可以使用属于已经可用样本的相邻样本值来形成预测器块。根据方向将相邻样本的样本值复制到预测器块中。对使用方向的参考可以编码在比特流中,或者可以对其本身进行预测。参考图1,右下方描绘的是从H.265的35种可能的预测器方向中得知的9个预测器方向的子集。箭头收敛的点(101)表示正在被预测的样本。箭头表示正在被预测的样本的方向。例如,箭头(102)指示从与水平线成45度角的右上方向的一个或多个样本中预测样本(101)。同样,箭头(103)表示从与水平线成22.5度角的右下方向的一个或多个样本中预测样本(101)。仍参考图1,在右上角描绘了一个4x4个样本的正方形块(104)(由粗体虚线表示)。正方形块(104)包含16个样本,每个样本使用“S”及其在Y维度上的位置(例如,行索引)和其在X维度上的位置(例如列索引)来标记。例如,样本S21是Y维度上(从顶部开始)的第二个样本,以及X维度上(从左侧开始)的第一个样本。类似地,样本S44在Y和X维度上都是块(104)中的第四个样本。由于块的大小为4x4个样本,因此S44在右下角。图1中还示出了参考样本,它们遵循类似的编号方案。参考样本用R及其相对于块(104)的Y位置(例如行索引)和X位置(列索引)来标记。在H.264和H.265二者中,预测样本都与正在重建的块相邻,因此,无需使用负值。帧内图片预测可以通过从信号通知的预测方向所占用的相邻样本复制参考样本值来工作。例如,假设编码视频比特流包括信令(signaling),该信令针对该块指示与箭头(102)一致的预测方向,也就是说,样本是从与水平方向成45度角的右上角的一个或多个预测样本进行预测的。在这种情况下,从同一个R05预测样本S41、S32、S23和S14。然后,根据R08预测样本S44。在某些情况下,可以例如通过插值来组合多个参考样本的值,以便计算参考样本,尤其是当方向不能被45度整除时。随着视频编码技术的发展,可能的方向的数量已经增加。在H.264(2003年)中,可以表示九个不同的方向。这一数字在H.265(2013年)增加到了33个,而在本公开时,JEM/VVC/BMS中可支持多达65个方向。已经进行了实验以识别最可能的方向,并且熵编码中的某些技术被用来以少量的比特来表示那些可能的方向,对不太可能的方向接受一定的代价。此外,有时可以根据在已经解码的相邻块中使用的相邻方向来预测方向本身。图2是示出根据JEM的65个帧内预测方向的示意图201,从而示出了随着时间的推移增加的预测方向的数量。表示方向的帧内预测方向比特在编码视频比特流中的映射可以随视频编码技术的不同而不同,并且,例如,映射的范围可以从预测方向到帧本文档来自技高网...

【技术保护点】
1.一种用于解码器中的视频解码的方法,包括:/n从已编码的视频比特流中解码第一块的预测信息,所述第一块是非正方形块,且所述第一块的预测信息指示与所述非正方形块相关联的第一组帧内预测模式中的第一帧内预测模式,所述第一组帧内预测模式包括第一数量的帧内预测模式,所述第一数量的帧内预测模式不同于与正方形块相关联的第二组帧内预测模式,所述第一数量是基于所述第一块的宽高比而确定的正整数;以及/n根据所述第一帧内预测模式来重建所述第一块的至少一个样本。/n

【技术特征摘要】
【国外来华专利技术】20180702 US 62/693,050;20180928 US 16/147,2461.一种用于解码器中的视频解码的方法,包括:
从已编码的视频比特流中解码第一块的预测信息,所述第一块是非正方形块,且所述第一块的预测信息指示与所述非正方形块相关联的第一组帧内预测模式中的第一帧内预测模式,所述第一组帧内预测模式包括第一数量的帧内预测模式,所述第一数量的帧内预测模式不同于与正方形块相关联的第二组帧内预测模式,所述第一数量是基于所述第一块的宽高比而确定的正整数;以及
根据所述第一帧内预测模式来重建所述第一块的至少一个样本。


2.根据权利要求1所述的方法,其特征在于,还包括:
从所述已编码的视频比特流中解码一语法元素,所述语法元素指示所述第一数量。


3.根据权利要求2所述的方法,其特征在于,所述语法元素在以下各项中的至少一个中:序列参数集、图片参数集、切片头部、图片区域的通用语法元素和图片区域的通用参数。


4.根据权利要求1所述的方法,其特征在于,所述第二组帧内预测模式中的第二数量的帧内预测模式不包括在所述第一组帧内预测模式中,并且所述第二数量是基于所述第一块的宽高比而确定的正整数。


5.根据权利要求4所述的方法,其特征在于,所述第一数量等于所述第二数量。


6.根据权利要求1所述的方法,其特征在于,所述第一帧内预测模式不包括在与所述正方形块相关联的第二组帧内预测模式中。


7.根据权利要求1所述的方法,其特征在于,所述第一数量是与所述第一块的形状无关的固定值。


8.根据权利要求4所述的方法,其特征在于,还包括:
计算所述第一块的宽高比;以及
基于所述第一块的宽高比确定所述第一数量,
其中,在所述第二组帧内预测模式中删除所述第二数量的帧内预测模式,并在所述第二组帧内预测模式中添加所述第一数量的不同的帧内预测模式,以形成所述第一组帧内预测模式。


9.根据权利要求8所述的方法,其特征在于,当所述第一块的宽高比小于或等于2时,所述第二数量等于第三数量M,并且所述第三数量M是正整数。


10.根据权利要求9所述的方法,其特征在于,当所述第二组帧内预测模式具有33个帧内预测模式时,所述第三数量M等于3;
当所述第二组帧内预测模式具有65个帧内预测模式时,所述第三数量M等于6。


11.根据权利要求8所述的方法,其特征在于,当所述第一块的宽高比大于或等于4时,所述第二数量等于第四数量N,并且所述第四数量N是正整数。


12.根据权利要求11所述的方法,其特征在于,当所述第二组帧...

【专利技术属性】
技术研发人员:赵亮刘杉赵欣李翔
申请(专利权)人:腾讯美国有限责任公司
类型:发明
国别省市:美国;US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1