用于视频编解码的利用运动向量差的合并方法和装置制造方法及图纸

技术编号：40649052 阅读：3 留言：0更新日期：2024-03-13 21:27

公开了利用UMVE(最终运动向量表达)进行视频编码的帧间预测的方法和装置。根据该方法，从原始帧间候选列表中选择基础候选，其中，基础候选具有基础预测方向。通过向基础候选添加一个或更多个偏移来得出一个或更多个扩展候选，其中，所述一个或更多个扩展候选具有与基础预测方向相同的预测方向。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及用于利用umve(最终运动向量表达(ultimate motion vectorexpression))的视频编码的帧间(inter)预测。具体地，本专利技术公开了多种对umve展开(expansion)进行扩展的方法，以便改进编码性能和/或降低复杂度。

技术介绍

1、高效视频编码(hevc)是由视频编码联合协作小组(jct-vc)开发的新的国际视频编码标准。hevc依据基于混合块的运动补偿的类dct变换编码架构。用于压缩的基本单元(称为编码单元(cu))是2n×2n方块，并且各个cu可以被递归地分成四个较小的cu，直到达到预定义的最小尺寸为止。各个cu包含一个或多个预测单元(pu)。

2、为了实现hevc中的混合编码架构的最佳编码效率，针对各个pu存在两种预测模式(即，帧内预测和帧间预测)。对于帧内预测模式，可以利用空域相邻重建像素来生成方向预测。在hevc中有多达35个方向。对于帧间预测模式，可以利用时域重建参考帧来生成运动补偿预测。有三种不同的模式，包括跳过(skip)、合并(merge)和帧间高级运动向量预测(amvp)模式。

3、当以帧间amvp模式对pu进行编码时，利用传输的运动向量差(mvd)来执行运动补偿预测，该运动向量差可以与运动向量预测子(motion vector predictor，mvp)一起使用来推导运动向量(mv)。在帧间amvp模式中为了决定mvp，使用高级运动向量预测(amvp)方案来在包括两个空域mvp和一个时域mvp的amvp候选集中选择运动向量预测子。

4、当以跳过或合并模式对pu进行编码时，因为跳过和合并模式利用运动推断方法，所以除了所选择的候选的合并索引之外，不传输运动信息。由于跳过和合并模式的运动向量差(mvd)为零，所以针对跳过或合并编码块的mv与运动向量预测子(mvp)相同(即，mv＝mvp+mvd＝mvp)。因此，跳过或合并编码块从位于同位置(co-located)图像中的空域相邻块(空域候选)或时域块(时域候选)获得运动信息。同位置图像是列表0或列表1中的第一参考图像，其在片头(slice header)中用信号发送(signalled)。在跳过pu的情况下，也省略残余信号。为了确定跳过和合并模式的合并索引，使用合并方案以在包含四个空域mvp和一个时域mvp的合并候选集中选择运动向量预测子。

5、图1示出了针对amvp和合并方案的用于推导空域mvp和时域mvp的相邻pu的示例。在amvp中，左侧mvp是来自a0、a1的第一个可用的mvp，顶部mvp是来自b0、b1、b2的第一个可用的mvp，时域mvp是来自tbr或tctr的第一个可用的mvp(首先使用tbr，如果tbr不可用，则使用tctr代替)。如果左侧mvp不可用且顶部mvp是非缩放的mvp，则如果在b0、b1和b2中存在缩放的mvp，就可以推导出第二顶部mvp。在hevc中，amvp的mvp的列表大小是2。因此，在两个空域mvp和一个时域mvp的推导过程之后，只有前两个mvp可以包括在mvp列表中。如果在去除冗余之后，可用mvp的数量小于2，则将零向量候选添加到候选列表。

6、如图1所示，对于跳过模式和合并模式，从a0、a1、b0和b1推导出多达四个空域合并索引，并且从tbr或tctr推导出一个时域合并索引(首先使用tbr，如果tbr不可用，则使用tctr代替)。注意，如果四个空域合并索引中的任何一个不可用，则使用位置b2作为替换以推导出合并索引。在四个空域合并索引和一个时域合并索引的推导过程之后，应用去除冗余来去除冗余合并索引。如果在去除冗余之后，可用的合并索引的数量小于5，则推导出三种类型的附加候选并将其添加到候选列表。

7、通过使用原始合并候选来创建附加双向预测合并候选。附加候选被分成三种候选类型：

8、1.组合的双向预测合并候选(候选类型1)

9、2.缩放的双向预测合并候选(候选类型2)

10、3.零向量合并/amvp候选(候选类型3)

11、在候选类型1中，通过对原始合并候选进行组合来创建组合的双向预测合并候选。具体地，使用原始候选中具有mvl0(列表0中的运动向量)和refidxl0(列表0中的参考图像索引)或mvl1(列表1中的运动向量)和refidxl1(列表1中的参考图像索引)的两个候选来创建双向预测合并候选。

12、图2例示了组合的双向预测合并候选的推导过程的示例。候选集210对应于原始候选列表，其包括l0中的mvl0_a,ref0(231)和l1中的mvl1_b,ref(232)。可以通过组合l0和l1中的候选来形成双向预测mvp 233。

13、在候选类型2中，通过对原始合并候选进行缩放来创建缩放的双向预测合并候选。具体地，使用原始候选中具有mvlx(列表x中的运动向量)和refidxlx(列表x中的参考图像索引)(x可以是0或1)的一个候选来创建双向预测合并候选。例如，一个候选a是具有mvl0_a和ref0的单向预测的列表0，首先将ref0复制到列表1中的参考索引ref0'。之后，通过利用ref0和ref0'对mvl0_a进行缩放来计算mvl0'_a。然后，创建在列表0中具有mvl0_a和ref0并且在列表1中具有mvl0'_a和ref0'的双向预测合并候选，并将其添加到合并候选列表中。在图3中示出了缩放的双向预测合并候选的推导过程330的示例，其中，候选列表310对应于原始候选列表，候选列表320对应于包括两个生成的双向预测mvp的展开候选列表。

14、在候选类型3中，通过对零向量和参考索引(其可以被参考)进行组合来创建零向量合并/amvp候选。图4a例示了添加零向量合并候选的示例，其中，候选列表410对应于原始合并候选列表，候选列表420对应于通过添加零候选而扩展的合并候选列表。图4b例示了添加零向量amvp候选的示例，其中，候选列表430(l0)和432(l1)对应于原始amvp候选列表，候选列表440(l0)和442(l1)对应于通过添加零候选而扩展的amvp候选列表。如果零向量候选不重复，则将其添加到合并/amvp候选列表中。

15、在jvet-k0115(s.jeong,et al.,「ce4 ultimate motion vector expression inj0024(test 4.2.9)」,in joint video exploration team(jvet)of itu-t sg 16wp 3andiso/iec jtc 1/sc 29/wg 11,11th meeting:ljubljana,si,10–18july 2018,document:jvet-k0115)中呈现了在jve本文档来自技高网...

【技术保护点】

1.一种用于视频编解码的帧间预测的方法，所述方法包括以下步骤：

2.根据权利要求1所述的用于视频编解码的帧间预测的方法，其特征在于，所述一个或更多个偏移是在多个方向上添加到所述基础候选的，并且所述多个方向包括一个非水平也非垂直的目标方向。

3.根据权利要求2所述的用于视频编解码的帧间预测的方法，其特征在于，所述多个方向由八个方向组成，所述八个方向包括四个水平和垂直方向以及四个对角线方向。

4.根据权利要求2所述的用于视频编解码的帧间预测的方法，其特征在于，所述一个或更多个偏移对应于固定偏移。

5.根据权利要求2所述的用于视频编解码的帧间预测的方法，其特征在于，所述一个或更多个偏移对应于一组偏移。

6.根据权利要求1所述的用于视频编解码的帧间预测的方法，其特征在于，所述一个或更多个偏移是从一组偏移中选择的。

7.根据权利要求6所述的用于视频编解码的帧间预测的方法，其特征在于，所述一个或更多个偏移的值是根据所述一个或更多个偏移被添加到所述基础候选的目标方向来选择的。

8.根据权利要求6所述的用于视频编

9.根据权利要求6所述的用于视频编解码的帧间预测的方法，其特征在于，所述一个或更多个偏移的数量取决于所述基础候选的目标运动向量。

10.根据权利要求6所述的用于视频编解码的帧间预测的方法，其特征在于，所述一个或更多个偏移的数量取决于所述一个或更多个偏移被添加到所述基础候选的目标方向。

11.根据权利要求6所述的用于视频编解码的帧间预测的方法，其特征在于，当AMVR(自适应运动向量分辨率)被应用于所述当前块时，所述一个或更多个偏移被选择成具有与按照所述AMVR选择的精度不同的幅度。

12.根据权利要求11所述的用于视频编解码的帧间预测的方法，其特征在于，当所述AMVR被应用于所述当前块时，所述一个或更多个偏移是根据表示按照所述AMVR选择的精度的标志来选择的。

13.根据权利要求1所述的用于视频编解码的帧间预测的方法，其特征在于，仅选择所述原始帧间候选列表中的目标单向预测候选作为所述基础候选，并且使用镜像技术将所述目标单向预测候选转换成双向预测基础候选，以得出所述一个或更多个扩展候选。

14.根据权利要求1所述的用于视频编解码的帧间预测的方法，其特征在于，有条件地在x方向或y方向上将所述一个或更多个偏移添加到所述基础候选。

15.根据权利要求1所述的用于视频编解码的帧间预测的方法，其特征在于，针对跳过、合并、AMVP、仿射合并模式、仿射AMVP模式或子块合并模式得出所述原始帧间候选列表。

16.一种用于视频编解码的帧间预测的装置，所述装置包括一个或更多个电子电路或处理器，所述一个或更多个电子电路或处理器被配置成：

...

【技术特征摘要】

1.一种用于视频编解码的帧间预测的方法，所述方法包括以下步骤：

4.根据权利要求2所述的用于视频编解码的帧间预测的方法，其特征在于，所述一个或更多个偏移对应于固定偏移。

5.根据权利要求2所述的用于视频编解码的帧间预测的方法，其特征在于，所述一个或更多个偏移对应于一组偏移。

6.根据权利要求1所述的用于视频编解码的帧间预测的方法，其特征在于，所述一个或更多个偏移是从一组偏移中选择的。

8.根据权利要求6所述的用于视频编解码的帧间预测的方法，其特征在于，所述一个或更多个偏移被添加到所述基础候选的目标方向取决于所述基础候选的目标运动向量。

9.根据权利要求6所述的用于视频编解码的帧间预测的方法，其特征在于，所述一个或更多个偏移的数量取决于所述基础候选的目标运动向量。

10...

【专利技术属性】
技术研发人员：赖贞延，陈庆晔，庄子德，
申请(专利权)人：寰发股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人