视频编解码的帧间预测方法及装置制造方法及图纸

技术编号：41203527 阅读：3 留言：0更新日期：2024-05-07 22:29

公开了一种用于视频编解码的帧间预测的方法和装置。根据一种方法，对于小尺寸编解码单元，关闭子块运动向量预测模式。在另一种方法中，如果当前编解码单元的相邻参考块在根编解码单元区域中，则相邻参考块不用于导出合并候选者，或者根编解码单元的共享边界上的修改的相邻参考块用于导出当前块的合并候选。在又一方法中，为根编解码单元区域或合并估计区域内的子编解码单元导出共享子块合并候选列表。如果相邻参考块在与当前子编解码单元相同的合并估计区域内，则相邻参考块不用于导出共享子编解码单元合并列表的候选。

全部详细技术资料下载

【技术实现步骤摘要】

【】本专利技术涉及用于视频编解码的合并模式。特别地，本专利技术公开了通过对处理合并候选施加限制来提高硬件处理效率的技术。此外，公开了处理在根cu下或在共享区域内的子cu的共享候选列表中的子cu合并候选的技术。

技术介绍

0、
技术介绍

1、高效视频编解码(hevc)标准是在itu-t视频编解码专家组(vceg)和iso/iec运动图像专家组(mpeg)标准化组织，并且尤其是在被称为视频编解码联合协作团队(jct-vc)的联合视频项目下开发的。在hevc中，一个切片被划分为多个编解码树单元(ctu)。在主配置文档(profile)中，ctu的最小和最大大小由序列参数集(sps)中的语法元素指定。允许的ctu大小可以是8x8、16x16、32x32或64x64。对于每个切片，根据光栅扫描顺序处理切片内的ctu。

2、ctu进一步划分为多个编解码单元(cu)以适应各种局部特性。表示为编解码树的四叉树用于将ctu划分为多个cu。令ctu大小为mxm，其中m是64、32或16的值之一。ctu可以是单个cu(即，没有分裂)或者可以分成四个相同大小的较小单元(即，每个m/2xm/2)，对应于编解码树的节点。如果单元是编解码树的叶节点，则单元成为cu。否则，可以迭代四叉树(split)分裂过程，直到节点的大小达到sps(序列参数集)中指定的最小允许cu大小。该表示产生如图1中的编解码树(也称为划分树结构)120所指定的递归结构。图1中示出了ctu划分110，其中实线指示cu边界。是否使用图像间(时间)或图像内(空间)预

3、此外，根据hevc，可以将每个cu划分为一个或多个预测单元(pu)。pu与cu一起用作共享预测信息的基本代表块。在每个pu内部，应用相同的预测过程，并且基于pu将相关信息发送到解码器。可以根据pu分裂类型将cu分成一个、两个或四个pu。hevc定义了用于将cu分成pu的八种形状，如图2所示，包括2nx2n、2nxn、nx2n、nxn、2nxnu、2nxnd、nlx2n和nrx2n划分类型。与cu不同，pu可以仅根据hevc分裂一次。第二行中所示的划分对应于不对称划分，其中两个划分部分具有不同的大小。

4、在通过基于pu分裂类型的预测过程获得残差块之后，可以根据另一种四叉树结构将cu的预测残差划分为变换单元(tu)，该四叉树结构类似于如图1所示的cu的编解码树。实线表示cu边界，虚线表示tu边界。tu是具有用于应用整数变换和量化的残差或变换系数的基本代表性块。对于每个tu，应用具有与tu相同大小的一个整数变换以获得残差系数。在以tu为基础量化之后，将这些系数发送到解码器。

5、术语编解码树块(ctb)、编解码块(cb)、预测块(pb)和变换块(tb)被定义为指定分别与ctu、cu、pu和tu相关联的一个颜色分量的2-d样本阵列。因此，ctu由一个亮度ctb、两个色度ctb和相关的语法元素组成。类似的关系对cu、pu和tu有效。树划分通常同时应用于亮度和色度，但是当达到色度的某些最小尺寸时例外。

6、或者，在jctvc-p1005中提出了二叉树块划分结构(d.flynn等，“hevc rangeextensions draft 6”，itu-t sg 16wp 3和iso/iec jtc 1/sc 29/wg 11视频编解码联合协作团队(jct-vc)，第16次会议：san jose,us，2014年1月9日至17日，文档：jctvc-p1005)。在所提出的二叉树划分结构中，可以使用各种二进制分裂类型将块递归地分裂成两个较小的块，如图3所示。最有效和最简单的是对称的水平和垂直分裂，如图3中前两个分裂类型所示。对于大小为m×n的给定块，信令(signal)标志以指示给定块是否被分成两个较小的块。如果是，则信令另一语法元素以指示使用哪种分裂类型。如果使用水平分裂，则将给定块分成两个大小为m×n/2的块。如果使用垂直分裂，则将给定块分成两个大小为m/2×n的块。可以迭代二叉树分裂过程，直到分裂块的大小(宽度或高度)达到最小允许块大小(宽度或高度)。可以在诸如sps的高级语法中定义最小允许块大小。由于二叉树具有两种分裂类型(即水平和垂直)，因此应指示最小允许块宽度和高度。当分裂将导致块高度小于指示的最小值时，隐含地暗示非水平分裂(non-horizontal splitting)。当分裂将导致块宽度小于指示的最小值时，隐含地暗示非垂直分裂(non-vertical splitting)。图4示出了块划分410及其对应的二叉树420的示例。在二叉树的每个分裂节点(即，非叶节点)中，使用一个标志来指示使用哪种分裂类型(水平或垂直)，其中0表示水平分裂，1表示垂直分裂。

7、二叉树结构可用于将图像区域划分为多个较小的块，诸如将切片划分为ctu，将ctu划分为cu，将cu划分为pu，或将cu划分为tu，等等。二叉树可以用于将ctu划分为cu，其中二叉树的根节点是ctu，二叉树的叶节点是cu。叶节点可以通过预测和变换编解码进一步处理。为了简化，不存在从cu到pu或从cu到tu的进一步划分，这意味着cu等于pu并且pu等于tu。因此，换句话说，二叉树的叶节点是用于预测和转换编解码的基本单元。

8、qtbt结构

9、二叉树结构比四叉树结构更灵活，因为可以支持更多的划分形状，这也是编解码效率改进的来源。但是，编码复杂度也会增加，以便选择最佳的划分形状。为了平衡复杂性和编码码效率，已经公开了一种组合四叉树和二叉树结构的方法，也称为四叉树加二叉树(qtbt)结构。根据qtbt结构，ctu(或i切片的ctb)是四叉树的根节点，ctu首先由四叉树分裂，其中一个节点的四叉树分裂可以迭代，直到节点达到允许的最小四叉树叶节点大小(即minqtsize)。如果四叉树叶节点大小不大于最大允许二叉树根节点大小(即，maxbtsize)，则可以通过二叉树进一步对其进行划分。可以迭代一个节点的二叉树分裂，直到节点达到最小允许二叉树叶节点大小(即，minbtsize)或最大允许二叉树深度(即，maxbtdepth)。二叉树叶节点，即cu(或用于i切片的cb)将用于预测(例如，图像内或图像间预测)并且在没有任何进一步划分(partition)的情况下进行变换。二叉树分裂中有两种分裂类型：对称水平分裂和对称垂直分裂。在qtbt结构中，允许的最小四叉树叶节点大小、允许的最大二叉树根节点大小、允许的最小二叉树叶节点宽度和高度以及允许的最大二叉树深度可以在高级语法中，例如在sps中指示。图5示出了块划分510及其对应的qtbt 520的示例。实线表示四叉树分裂，虚线表示二叉树分裂。在二叉树的每个分裂节点(即，非叶节点)中，一个标志指示使用哪种分裂类型(水平或垂直)，0可以指示水平分裂，1可以指示垂直分裂。

10、上述qtbt结构可用于将图像区域(例如，切片、ctu或cu)划分本文档来自技高网...

【技术保护点】

1.一种视频编解码的帧间预测方法，其中该视频编解码允许子块模式运动向量预测，该方法包括：

2.根据权利要求1所述的方法，其特征在于，该目标子块模式编解码工具对应于基于子块的时间运动向量预测。

3.根据权利要求1所述的方法，其特征在于，如果该当前块的块大小小于阈值，则满足该条件。

4.根据权利要求1所述的方法，其特征在于，如果该当前块的面积小于阈值，则满足该条件。

5.根据权利要求1所述的方法，其特征在于，如果该当前块的块宽度或该当前块的块高度小于阈值，则满足该条件。

6.一种用于视频编解码的帧间预测的装置，其中该视频编解码允许子块模式运动向量预测，该装置包括一个或多个电子电路或处理器，其被布置成：

7.一种用于视频编解码的帧间预测的方法，其中所述视频编解码允许使用包括仿射模式预测或基于子块的时间运动向量预测模式的子块模式的编解码工具，该方法包括：

8.根据权利要求7所述的方法，其特征在于，该一个或多个相邻参考块的控制点运动向量用于导出该多个子编解码单元的一个或多个仿射合并候选。

9.根

10.根据权利要求9所述的方法，其特征在于，该一个或多个相邻参考块的该仿射参数对应于该一个或多个相邻参考块的运动向量梯度、一个或多个起始运动向量和位置。

11.一种用于视频编解码的帧间预测的装置，其中该视频编解码允许使用包括仿射模式预测或基于子块的时间运动向量预测模式的子块模式的编码解码工具，该装置包括一个或多个电子电路或处理器，安排如下：

...

【技术特征摘要】

1.一种视频编解码的帧间预测方法，其中该视频编解码允许子块模式运动向量预测，该方法包括：

2.根据权利要求1所述的方法，其特征在于，该目标子块模式编解码工具对应于基于子块的时间运动向量预测。

3.根据权利要求1所述的方法，其特征在于，如果该当前块的块大小小于阈值，则满足该条件。

4.根据权利要求1所述的方法，其特征在于，如果该当前块的面积小于阈值，则满足该条件。

5.根据权利要求1所述的方法，其特征在于，如果该当前块的块宽度或该当前块的块高度小于阈值，则满足该条件。

6.一种用于视频编解码的帧间预测的装置，其中该视频编解码允许子块模式运动向量预测，该装置包括一个或多个电子电路或处理器，其被布置成：

7.一种用于视频编解码的帧间预测的方法，其中所述视频编解码允许使...

【专利技术属性】
技术研发人员：陈俊嘉，徐志玮，庄子德，陈庆晔，
申请(专利权)人：寰发股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人