重叠解码器侧运动细化制造技术

技术编号：40431557 阅读：13 留言：0更新日期：2024-02-20 22:54

提供了用于对视频序列中的图片内的第一结构进行编码或解码的方法和装置。该方法包括对于第一结构内的第二结构确定初始运动矢量(MV)和MV候选。该方法包括，对于MV候选中的每个MV候选，使用该MV候选来导出第一参考块和第二参考块，并且第一参考块和第二参考块的大小可以不等于第二结构的大小。该方法包括基于来自第一参考块和第二参考块的样本导出成本值。该方法包括使用来自MV候选的成本值来导出最佳MV候选以及使用最佳MV候选来导出第二结构的预测样本。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】

本公开涉及图片或视频序列的视频编码和/或解码。

技术介绍

1、视频和图片

2、视频序列包括一系列图片(本文中也称为“图像”)。在通用视频编码(vvc)标准中，每个图片都用图片顺序计数(poc)值来标识。

3、分量(component)

4、每个分量可以被描述为样本值的二维矩形阵列。通常，每个图片包括三个分量：一个亮度(luma)分量y(其中样本值是亮度值)和两个色度(chroma)分量cb和cr(其中样本值是色度值)。

5、同样常见的是，色度分量的维度在每个维度上都比亮度分量小两倍。例如，hd图像的亮度分量的尺寸为1920x1080，色度分量每个的尺寸为960x540。分量有时称为颜色分量。

6、编码单元(coding unit)和编码块(coding block)

7、块是样本的一个二维阵列。在视频编码中，每个分量被分割(split)成块，编码视频比特流包括一系列编码块。在视频编码中，将图片分割成覆盖图片的特定区域的单元是很常见的。

8、每个单元包括来自构成该特定区域的所有分量的所有块，并且每个块完全属于一个单元。vvc中的编码单元(cu)是单元的示例。在vvc中，cu可以被递归地分割为更小的cu。顶层的cu称为编码树单元(ctu)。

9、cu通常包含三个编码块，例如，一个用于亮度的编码块和两个用于色度的编码块。亮度编码块的大小与cu相同。

10、在当前的vvc(即，版本1)中，cu可以具有4x4直到128x128的大小。

11、帧内预测(intra prediction)

12、在帧内预测(也称为空间预测)中，使用同一图片内的先前解码的块来预测块。来自同一图片内先前解码的块的样本用于预测当前块内的样本。

13、仅包括帧内预测块的图片被称为帧内图片。

14、帧间预测(inter prediction)

15、在帧间预测(也称为时间预测)中，使用来自先前解码的图片的块来预测当前图片的块。来自先前解码的图片中的块的样本用于预测当前块的样本。

16、允许帧间预测块的图片被称为帧间图片。用于帧间预测的先前解码的图片被称为参考图片。

17、使用运动矢量(mv)来指示参考图片内的参考块的位置。每个mv包括x和y分量，表示当前块与参考块之间在x或y维度上的位移。分量的值可以具有比整数位置更精细的分辨率。在这种情况下，将进行滤波(通常是插值(interpolation))来计算用于预测的值。图1示出了当前块c的mv的示例。在该示例中，mv＝(2,1)指示与当前块的位置相比，向右两步和向下一步可以找到参考块。

18、帧间图片可以使用多个参考图片。参考图片通常被放入两个参考图片列表l0和l1中。在当前图片之前输出的参考图片通常是l0中的第一图片。在当前图片之后输出的参考图片通常是l1中的第一图片。

19、帧间预测块可以使用两种预测类型之一，即单预测(uni-prediction)和双预测(bi-prediction)。单预测块使用l0或l1从一张参考图片进行预测。双预测根据两张参考图片进行预测，一张来自l0，另一张来自l1。图2示出了预测类型的示例。

20、分数mv、插值滤波器和mv取整(rounding)

21、mv的x或y分量的值可以对应于具有比整数(样本)位置更精细的粒度的样本位置。这些位置也称为分数(样本)位置。

22、在vvc中，mv可以处于1/16样本位置。图3描绘了水平(x-)维度上的几个分数位置。实心方块表示整数位置。圆圈表示1/16位置。例如，mv＝(4,10)意味着x分量位于4/16位置，y分量位于10/16位置。

23、在视频编码中，有时使用mv取整过程来将一个位置处的mv转换为另一目标位置。取整的一个示例是将分数mv位置取整到最接近的整数位置。

24、当mv处于分数位置时，进行滤波(通常是插值)以计算那些位置处的样本值。在vvc中，亮度分量的插值滤波器的长度(滤波器抽头(tap)数)为8，如下表1所示。

25、

26、表1

27、残差(residual)、变换(transform)和量化(quantization)

28、源块(其包含原始样本)的样本与预测块的样本之间的差异(difference)通常被称为‘残差块’。然后，该残差块通常通过空间变换来压缩以去除进一步的冗余。然后，通过量化参数(qp)对变换系数进行量化，以控制残差块的保真度(fidelity)，从而控制压缩块所需的比特率。编码块标志(cbf)用于指示是否存在任何非零量化变换系数。然后，所有编码参数在编码器处进行熵编码并在解码器处进行解码。如果编码块标志为1，则可以通过对量化的变换系数进行逆量化和逆变换来导出重构块，然后将其添加到预测块。

29、分层图像编码结构

30、在通常被称为‘随机访问配置’的情况下，帧内编码图片以固定间隔(例如，每秒)定位。帧内图片之间的图片通常利用如图4所示的双向图片组(b-gop)结构进行编码。在图4所示的示例中，首先对图片0进行编码，然后对图片8使用图片0作为其参考图片进行编码。然后，使用图片8和图片0作为参考图片对图片4进行编码。然后，类似地对图片2和图片6进行编码。最后对图1、3、5、7进行编码。

31、图片1、3、5和7被称为在最高层级上，图片2、4和6被称为在次最高(next highest)层级上，图片4被称为在次最低(next lowest)级别上，图8被称为处于最低级别。通常，图片1、3、5和7不用作任何其他图片的参考图片。它们被称为非参考图片。

32、为每个图片指派的qp通常是不同的并且根据层级来设置。较高的qp被指派给处于较高层级的图片。

33、帧间预测/运动信息

34、对于vvc中的帧间图片中的帧间块，帧间块的帧间预测信息包括以下三个元素：(1)参考图片列表标志(refpiclistflag)，(2)每使用的参考图片列表的参考图片索引(refpicidx)，以及(3)每使用的参考图片的运动矢量(mv)。参考图片列表标志(refpiclistflag)用信号通知使用哪个参考图片列表。当refpiclistflag的值等于0时，使用l0。当refpiclistflag的值等于1时，使用l1。当refpiclistflag的值等于2时，使用l0和l1。参考图片索引(refpicidx)用信号通知要使用参考列表内的哪个参考图片。运动矢量(mv)用信号通知用于预测当前块的参考图片内的位置。

35、帧间预测信息也称为运动信息。解码器存储每个帧间块的运动信息。换句话说，帧间块维护其自己的运动信息。

36、编码器决定和率失真(rd)ccost

37、实际中，为了让编码器决定当前块的最佳预测模式，编码器将评估当前块的许多或所有可能的本文档来自技高网...

【技术保护点】

1.一种用于对视频序列中的图片内的第一结构进行编码或解码的方法(1600)，所述方法包括：

2.根据权利要求1所述的方法，其中，所述第一结构是块，并且所述第二结构是所述块的子块。

3.根据权利要求2所述的方法，还包括：将所述块分割成n个子块，其中n大于或等于1。

4.根据权利要求3所述的方法，其中，所述n个子块的累积样本数量等于所述块的样本数量。

5.根据权利要求3或4所述的方法，其中，n大于或等于2。

6.根据权利要求1所述的方法，其中，所述第一结构是包含两个或多个块的超级块，并且所述第二结构是所述超级块中的块。

7.根据权利要求6所述的方法，其中，所述超级块是编码树单元CTU或CTU的一部分。

8.根据权利要求1-7中任一项所述的方法，其中，所述第一参考块和所述第二参考块的高度不等于所述第二结构的高度，和/或所述第一参考块和所述第二参考块的宽度不等于所述第二结构的宽度。

9.根据权利要求1-8中任一项所述的方法，其中，所述第一参考块和所述第二参考块的高度大于所述第二结构的高度，和/

10.根据权利要求1-9中任一项所述的方法，其中，使用所述MV候选来导出所述第一参考块和第二参考块包括：对于所述第一参考块和所述第二参考块中的每一个参考块，基于所述MV候选来导出第一组参考样本和第二组参考样本。

11.根据权利要求10所述的方法，其中，所述第一组参考样本是宽度和高度分别等于所述第二结构的宽度和高度的参考样本块。

12.根据权利要求10或11所述的方法，其中，所述第二组参考样本包括不在所述第一组参考样本中的所述参考块的参考样本。

13.根据权利要求10-12中任一项所述的方法，其中，所述参考块包括所述第一组参考样本的顶部边界与所述参考块的顶部边界之间的P个样本、所述第一组参考样本的底部边界和所述参考块的底部边界之间的Q个样本、所述第一组参考样本的左边界和所述参考块的左边界之间的X个样本、以及所述第一组参考样本的右边界和所述参考块的右边界之间的Y个样本；P、Q、X和Y是数字；并且P、Q、X、Y中的至少一个是非零数字。

14.根据权利要求13所述的方法，其中，P、Q、X和Y大于或等于阈值T，所述阈值T取决于所述初始MV和所述MV候选之间的x或y分量的最大MV差异。

15.根据权利要求14所述的方法，其中，所述阈值T大于所述最大MV差异。

16.根据权利要求14或15所述的方法，其中，所述阈值T等于所述最大MV差异的两倍。

17.根据权利要求14所述的方法，其中，所述阈值T等于所述最大MV差异。

18.根据权利要求14-17中任一项所述的方法，其中，所述最大MV差异值在整数样本中是2，所述阈值T是4，并且P、Q、X和Y等于4。

19.根据权利要求13-18中任一项所述的方法，其中，P、Q、X和Y相等。

20.根据权利要求13-17中任一项所述的方法，其中，P、Q、X和Y中的一个或多个不同于P、Q、X和Y中的另一个。

21.根据权利要求13-17和20中任一项所述的方法，其中，P、Q、X和Y中的一个或多个对应于所述第二结构的位于所述第一结构的边界处的边并且大于P、Q、X和Y中的不对应于位于所述第一结构的边界处的所述第二结构的边的另一个。

22.根据权利要求10-21中任一项所述的方法，其中，基于所述MV候选来导出所述第一组参考样本和第二组参考样本包括：使用第一插值滤波器来导出所述第一组参考样本，以及使用第二插值滤波器来所述第二组参考样本，并且所述第一插值滤波器和第二插值滤波器是不同的。

23.根据权利要求22所述的方法，其中，所述第一插值滤波器比所述第二插值滤波器长。

24.根据权利要求10-23中任一项所述的方法，其中，基于所述MV候选来导出所述第二组参考样本包括：使用所述MV候选的取整版本。

25.根据权利要求24所述的方法，其中，所述MV候选的所述取整版本是取整到整数样本位置的所述MV候选。

26.根据权利要求1-25中任一项所述的方法，其中，所述第二结构的所述第一参考块与所述第一结构的另一第二结构的第一参考块重叠。

27.根据权利要求26所述的方法，其中，所述第二结构的所述第二参考块与其它第二结构的第二参考块重叠。

28.根据权利要求1-25中任一项所述的方法，其中，所述第二结构的所述第一参考块接触所述第一结构中的另一第二结构的第一参考块，但不重...

【技术特征摘要】
【国外来华专利技术】

1.一种用于对视频序列中的图片内的第一结构进行编码或解码的方法(1600)，所述方法包括：

2.根据权利要求1所述的方法，其中，所述第一结构是块，并且所述第二结构是所述块的子块。

3.根据权利要求2所述的方法，还包括：将所述块分割成n个子块，其中n大于或等于1。

4.根据权利要求3所述的方法，其中，所述n个子块的累积样本数量等于所述块的样本数量。

5.根据权利要求3或4所述的方法，其中，n大于或等于2。

6.根据权利要求1所述的方法，其中，所述第一结构是包含两个或多个块的超级块，并且所述第二结构是所述超级块中的块。

7.根据权利要求6所述的方法，其中，所述超级块是编码树单元ctu或ctu的一部分。

9.根据权利要求1-8中任一项所述的方法，其中，所述第一参考块和所述第二参考块的高度大于所述第二结构的高度，和/或所述第一参考块和所述第二参考块的宽度大于所述第二结构的宽度。

10.根据权利要求1-9中任一项所述的方法，其中，使用所述mv候选来导出所述第一参考块和第二参考块包括：对于所述第一参考块和所述第二参考块中的每一个参考块，基于所述mv候选来导出第一组参考样本和第二组参考样本。

11.根据权利要求10所述的方法，其中，所述第一组参考样本是宽度和高度分别等于所述第二结构的宽度和高度的参考样本块。

12.根据权利要求10或11所述的方法，其中，所述第二组参考样本包括不在所述第一组参考样本中的所述参考块的参考样本。

13.根据权利要求10-12中任一项所述的方法，其中，所述参考块包括所述第一组参考样本的顶部边界与所述参考块的顶部边界之间的p个样本、所述第一组参考样本的底部边界和所述参考块的底部边界之间的q个样本、所述第一组参考样本的左边界和所述参考块的左边界之间的x个样本、以及所述第一组参考样本的右边界和所述参考块的右边界之间的y个样本；p、q、x和y是数字；并且p、q、x、y中的至少一个是非零数字。

14.根据权利要求13所述的方法，其中，p、q、x和y大于或等于阈值t，所述阈值t取决于所述初始mv和所述mv候选之间的x或y分量的最大mv差异。

15.根据权利要求14所述的方法，其中，所述阈值t大于所述最大mv差异。

16.根据权利要求14或15所述的方法，其中，所述阈值t等于所述最大mv差异的两倍。

17.根据权利要求14所述的方法，其中，所述阈值t等于所述最大mv差异。

18.根据权利要求14-17中任一项所述的方法，其中，所述最大mv差异值在整数样本中是2，所述阈值t是4，并且p、q、x和y等于4。

19.根据权利要求13-18中任一项所述的方法，其中，p、q、x和y相等。

20.根据权利要求13-17中任一项所述的方法，其中，p、q、x和y中的一个或多个不同于p、q、x和y中的另一个。

21.根据权利要求13-17和20中任一项所述的方法，其中，p、q、x和y...

【专利技术属性】
技术研发人员：余若洋，J·施特姆，K·安德森，
申请(专利权)人：瑞典爱立信有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人