视频解编码的方法和装置制造方法及图纸

技术编号:26611279 阅读:120 留言:0更新日期:2020-12-04 21:38
本公开各方面提供了视频解码的方法和装置。一些例子中,该装置包括处理电路。处理电路从已编码视频比特流中解码得到当前块的预测信息。该预测信息指示帧内块复制模式。然后,处理电路根据帧内块复制模式,确定分辨率语法元素的第一部分。对于帧内块复制模式中的块矢量和帧间合并模式中的运动矢量,分辨率语法元素具有相同的语义。进一步地,处理电路对已编码视频码流中的分辨率语法元素的第二部分进行解码,并根据第一部分及第二部分的组合所指示的分辨率确定块矢量。然后,处理电路根据块矢量重建当前块的至少一个样本。

【技术实现步骤摘要】
【国外来华专利技术】视频解编码的方法和装置相关文件本公开要求2018年4月26日提交的、名称为“帧内块复制的改进方法”的美国临时申请62/663,171和2018年11月29日提交的、名称为“视频编解码方法及装置”的美国专利申请16/205,180的优先权,其全部内容通过引用并入本文。其全部内容通过引用并入本文。
本公开主要涉及视频编解码。
技术介绍
本公开提供的背景描述是为了整体上呈现本申请的背景。当前记名的专利技术人的工作,在该背景部分描述的工作以及本说明书各实施例的范围内的内容,在递交时并不算作现有技术,而且均未被明示或暗示地承认作为不利于本申请的现有技术。视频编码和解码可以使用具有运动补偿的图像间预测来进行。未压缩的数字视频可包括一系列图像,每个图像具有一定的空间维度,例如1920x1080的亮度样本和相关的色度样本。图像序列可具有固定或可变的图像速率(俗称帧率),例如,每秒60张图像或60Hz。未压缩的视频需要较高的比特率。例如,每个样本为8比特的1080p604:2:0(60Hz帧率下的1920x1080亮度样本分辨率)的视频需要接近1.5G比特/秒的带宽。长度为一小时的这种视频需要600G字节以上的存储空间。视频编码和解码的一个目的是,通过压缩来降低输入视频信号的冗余。在一些情况下,压缩可有助于减小带宽或存储空间的需求,一些情况下可以减少两个数量级甚至更多。可使用无损压缩、有损压缩,或其组合。无损压缩指可从经过压缩的原始信号中重建出原始信号的准确副本的技术。当利用有损压缩时,重建信号可与原始信号不一致,但原始信号和重建信号之间的失真足够小,以使重建信号能够实现所期望的用途。视频领域中广泛采用有损压缩。容许的失真量取决于应用,例如,一些消费型流应用的用户比电视节目应用的用户能容忍更大的失真。目前可实现的压缩比可以反映出:可允许或可容忍的失真越大,压缩比越高。视频编码器和解码器可利用几个大类的技术,包括,例如,运动补偿、变换、量化和熵编码。视频编解码技术可包括被称为帧内编码的技术。在帧内编码中,样本值的表示不需要参照先前已重建的参考图像中的样本或其他数据。在一些视频编解码器中,图像在空间上被细分为样本块。当样本的所有块在帧内模式下进行编码时,该图像可以为帧内图像。帧内图像及其派生图像(例如独立解码器刷新图像)可用于重置解码器状态,并从而可以用作已编码视频码流和视频会话中的第一幅图像,或作为静止图像。帧内块的样本可接受转换,转换系数可以在熵编码前被量化。帧内预测可以是使预变换域中的样本值最小化的技术。一些情况下,转换后的DC值越小,AC系数就越小,熵编码后用于以给定的量化步长来表示块所需的比特数就越少。例如,从诸如MPEG-2编解码技术所知的传统的帧内编码不使用帧内预测。然而,一些较新的视频压缩技术尝试使用,例如,周围的样本数据和/或元数据的技术,可在对空间相邻的、以及解码顺序在前的块数据进行编码/解码的过程中获得上述周围的样本数据和/或元数据。这种技术从此被称为“帧内预测”技术。注意,在至少一些情况下,帧内预测仅使用来自正在重建的当前图像(而不是参考图像)的参考数据。有许多不同形式的帧内预测。当在给定视频编码技术中可以使用多于一种这样的技术时,所使用的技术可以编码在帧内预测模式中。在某些情况下,模式可以具有子模式和/或参数,其可以单独编码或包括在模式码字中。如果给定模式/子模式/参数组合使用哪个码字可以通过帧内预测对编码效率增益产生影响,则用于将码字转换为比特流的熵编码技术也会对编码效率增益产生影响。某种帧内预测模式是随H.264引入的,在H.265中得到完善,并且在诸如联合探索模型(JEM),通用视频编码(VVC),及基准集(BMS)的新编码技术中被进一步完善。可以使用相邻样本值来形成预测块,相邻样本值属于已经可用的样本。根据方向将相邻样本的样本值复制到预测块中。所用的方向的信息可以编码在比特流中,或者可以自己预测。参考图1,右下描绘了包括H.265的35个可能的预测因子方向中的9个预测因子方向的子集。箭头会聚的点(101)表示正在预测的样本。箭头表示正在预测的样本的预测方向。例如,箭头(102)表示样本(101)的预测方向是从一个样本或多个样本到右上角,与水平方向成45度角。类似地,箭头(103)表示样本(101)的预测方向是从一个样本或多个样本到样本(101)的右下方,与水平方向成22.5度角。仍然参考图1,在右上方示出了4x4个样本的正方形块(104)(由粗体虚线表示)。方形块(104)包括16个样本,每个样本用“S”和其在Y维度中的位置(例如,行索引)及其在X维度中的位置(例如,列索引)进行标记。例如,样本S21是Y维度中(从顶部开始)的第二个样本和X维度中(从左侧开始)的第一个样本。类似地,块(104)中的样本S44在Y维度和X维度中均为第四个样本。由于块的大小为4×4个样本,因此S44位于右下角。还示出了遵循类似编号方案的参考样本。参考样本用R、及其相对于块(104)的Y位置(例如,行索引)和X位置(列索引)进行标记。在H.264和H.265中,预测样本与正在重建的块相邻;因此不需要使用负值。帧内图像预测通过从信号指示的预测方向所覆盖的相邻样本中复制参考样本值来发挥作用。例如,假设编码视频比特流包括的信令指示该块的预测方向与箭头(102)一致,即,从一个或多个预测样本到右上角,与水平面成45度角,来对样本进行预测。在该情况下,样本S41,S32,S23和S14使用相同的参考样本R05进行预测。然后使用参考样本R08预测样本S44。在某些情况下,为了计算参考样本,可以组合多个参考样本的值,例如通过插值;特别是当方向不能被45度整除时。随着视频编码技术的发展,可能的方向的数量越来越多。在H.264(2003年)中,可以表示九个不同的方向。该数目在H.265(2013年)中增加到33个,并且JEM/VVC/BMS在发表时可以支持多达65个方向。已经进行了一些实验以识别最可能的方向,并且使用熵编码中的某些技术来以少量比特表示那些可能的方向,同时考虑了可能性较小的方向带来的不利结果。此外,这些方向本身有时可以从相邻的已解码的块所使用的相邻方向进行预测。图2示出了JEM的65个帧内预测方向的示意图(201),以示出随时间增加的预测方向的数量。编码视频比特流中表示方向的帧内预测方向比特的映射方法,在不同的视频编码技术中可以不同;可以涵盖,例如,从预测方向到帧内预测模式或到码字的简单直接映射,到涉及大多数可能模式的复杂自适应方案,以及类似的技术。然而,在所有情况下,可能存在某些方向,在统计上相较其它方向,在视频内容中出现的可能性较小。由于视频压缩的目标是减少冗余,因此在运转良好的视频编码技术中,相比可能性更大的方向,那些可能性较小的方向将需要更多的比特来表示。
技术实现思路
本公开各方面提供了视频编码/解码的方法和装置。一些例子中,装置包括用于视频解码的处理电路。处理电路从已编码视频比特流中解码得到当前块的预测本文档来自技高网
...

【技术保护点】
1.一种视频解码方法,其特征在于,包括:/n从已编码视频比特流中解码当前块的预测信息,所述预测信息指示帧内块复制模式;/n根据所述帧内块复制模式,确定分辨率语法元素的第一部分,其中,对于当前块,在所述帧内块复制模式中的块矢量和在帧间合并模式中的运动矢量,所述分辨率语法元素具有一致的语义;/n从所述已编码视频码流中解码出所述分辨率语法元素的第二部分;/n根据所述第一部分和第二部分的组合所指示的分辨率确定所述块矢量;及/n根据所述块矢量重建所述当前块的至少一个样本。/n

【技术特征摘要】
【国外来华专利技术】20180426 US 62/663,171;20181129 US 16/205,1801.一种视频解码方法,其特征在于,包括:
从已编码视频比特流中解码当前块的预测信息,所述预测信息指示帧内块复制模式;
根据所述帧内块复制模式,确定分辨率语法元素的第一部分,其中,对于当前块,在所述帧内块复制模式中的块矢量和在帧间合并模式中的运动矢量,所述分辨率语法元素具有一致的语义;
从所述已编码视频码流中解码出所述分辨率语法元素的第二部分;
根据所述第一部分和第二部分的组合所指示的分辨率确定所述块矢量;及
根据所述块矢量重建所述当前块的至少一个样本。


2.根据权利要求1所述的方法,其特征在于,进一步包括:
根据所述帧内块复制模式,确定所述分辨率语法元素的第一部分指示所述分辨率为整数像素。


3.根据权利要求2所述的方法,其特征在于,进一步包括:
根据所述帧内块复制模式,确定所述第一部分为二进制的1。


4.根据权利要求2所述的方法,其特征在于,进一步包括:
基于所述分辨率语法元素的第二部分,从所述可选分辨率中选择所述分辨率。


5.根据权利要求1所述的方法,其特征在于,进一步包括:
根据所述帧内块复制模式,在不解码所述已编码视频码流中的附加信息的情况下,确定所述分辨率语法元素的所述第一部分。


6.根据权利要求1所述的方法,其特征在于,进一步包括:
将包含所述当前块的当前图像识别为用于所述当前块的参考图像;以及
从所述当前块所在的条带的条带头中解码出表示候选列表中候选的最大数目的值。


7.根据权利要求6所述的方法,其特征在于,进一步包括:
构建所述当前块在所述帧内块复制模式下的合并候选列表,所述合并候选列表中的帧内合并候选的数目不超过所述候选的最大数目的值。


8.根据权利要求6所述的方法,其特征在于,进一步包括:
构建所述当前块在帧间预测模式下的合并候选列表,所述合并候选列表中的帧间合并候选的数目不超过所述候选的最大数目的值。


9.根据权利要求6所述的方法,其特征在于,所述条带不使用时间参考图像。


10.根据权利要求6所述的方法,其特征在于,所述候选的最大数目的值使用截短的一元码进行编码。


11.一种视频解码装置,其特征在于,包括:
处理电路,用于:
从已编码视频比特流中解码当前块的预测信息,所述预测信息指示帧内块复制模式;
根据所述帧内块复制模式,确定分辨率语法元素的第一部分,其中,对于当前块,...

【专利技术属性】
技术研发人员:许晓中李贵春李翔刘杉
申请(专利权)人:腾讯美国有限责任公司
类型:发明
国别省市:美国;US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1