用于译码块的几何划分块的帧间预测的装置及方法制造方法及图纸

技术编号：40497009 阅读：10 留言：0更新日期：2024-02-26 19:25

本发明专利技术针对视频编码和解码提出了一种装置和各种方法，用于为译码块(a coding block)推导运动矢量(motion vector，MV)。具体地，当所述译码块采用几何划分的融合模式时，为划分成两个几何划分块(partition)的所述译码块生成融合候选列表，其中，所述融合候选列表生成包括：从相邻译码单元(neighboring coding units)中推导出一个或多个空间融合候选；在推导出所述一个或多个空间融合候选之后，直接或立即推导出一个或多个时间运动矢量预测值(temporal motion vector prediction，MVP)；根据所述融合候选列表，将单向预测MV推导为所述相应几何划分块的运动矢量，其中，所述融合候选列表包括一个或多个单向预测MV和/或一个或多个双向预测MV，单向MV的推导是基于所述融合候选列表或单向MV选择规则进行的；以及，至少根据所述单向预测MV对所述译码块的几何划分块进行预测，得到所述几何划分块的预测值。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术大体上涉及视频译码领域。更具体地，本专利技术涉及对视频信号的视频译码块的帧间预测使用三角划分/几何划分(例如三角预测单元、三角划分的融合模式、三角/几何预测单元的运动矢量预测和存储)来进行视频译码块(coding block)的编码和解码。

技术介绍

1、在h.264/高级视频译码(advanced video coding，avc)或高效视频译码(highefficiency video coding，hevc)等目前视频译码方案中，帧间预测图像(也称为帧)中的运动信息被划分成大小可配置的矩形视频译码块。虽然在h.264/avc中，运动被划分成最大大小为16×16像素的对称视频译码块，即宏块，视频译码块可以进一步细分为最小的4×4像素，但hevc使用最大64×64像素的译码树单元(coding tree unit，ctu)替换宏块。由于ctu可以通过四叉树(quadtree，qt)分解方案划分成更小的译码单元(coding unit，cu)，cu又可以细分为最小8×8像素，所以ctu不仅仅是一个较大的宏块。而且，与h.264/avc相比，hevc还支持译码单元(coding unit，cu)到预测单元(prediction unit，pu)的非对称块划分(asymmetric block partitioning，amp)。

2、确定每个ctu的分解和划分方式在编码过程中根据率失真优化规则执行。虽然amp已经提高了译码效率，但译码效率问题可能会出现在视频序列中移动对象的边界上。

3、具体地，在

4、需要视频译码设备和方法(即用于编码和/或解码)，这些设备和方法以对视频译码块的帧间预测使用的三角划分或对角线划分为基础，提高了译码效率，同时降低了存储带宽要求。

技术实现思路

1、本专利技术的目的是提供各种视频译码设备及方法，这些设备和方法以对视频译码块的帧间预测使用的三角划分或对角线划分为基础，从而提高译码效率。本专利技术的保护范围由权利要求书限定。

2、上述和其它目的通过由独立权利要求请求保护的主题来实现。其它实现方式在从属权利要求、说明书和附图中是显而易见的。

3、本专利技术实施例由独立权利要求的特征定义，而这些实施例的其它有利实现方式由从属权利要求的特征定义。

4、本文使用的视频信号或视频序列是一组呈现运动图像的后续帧。换句话说，视频信号或视频序列包括多个帧(也称为图像(picture/image))。

5、本文使用的分割(segmentation)是将图像或图像区域(具体是视频译码块)划分成两个以上分段或划分块的过程。这里引入了三角划分块，它在对角线或反对角线方向上将cu分割(split)成两个三角预测单元。cu可以在对角线或反对角线方向上分割成两个三角预测单元。

6、本文使用的译码树单元(coding tree unit，ctu)表示预定义大小的视频序列的译码结构的根，包括帧的一部分(例如64×64像素)。ctu可以划分成几个cu。

7、本文使用的译码单元(coding unit，cu)表示预定义大小的视频序列的基本译码结构，包括帧的属于ctu的一部分。cu可以进一步划分成更多cu。

8、本文使用的预测单元(prediction unit，pu)表示译码树结构，是划分cu得到的结果。

9、本文描述的各种设备和方法可以用于表示用于基于分割(segmentation)的块划分的运动信息，基于分割的块划分与矩形块划分结合使用，有助于视频译码应用中的帧间预测。

10、本文描述的格式设备和方法可以用于图像之间的帧间预测，以利用自然视频序列的时间冗余。

11、在上述场景中，cu可以在对角线或反对角线方向上分割成两个三角预测单元。cu中的每个三角预测单元具有自己的运动矢量和一个或多个参考帧索引(例如第一参考索引和/或第二参考索引)，这些信息可以从运动候选列表中推导出。

12、本专利技术的总体思想可以概括为：允许三角/几何划分块的至少一个4×4子块存储双向预测运动矢量，但仅执行单向运动补偿。

13、上述和其它目的通过由独立权利要求请求保护的主题来实现。其它实现方式在从属权利要求、说明书和附图中是显而易见的。

14、根据本专利技术的一方面，提供了一种为译码块(coding block)(或图像块)推导运动矢量(motion vector，mv)的方法。所述方法包括以下步骤：当所述译码块采用三角划分的融合模式时，为划分成两个三角划分块的所述译码块生成融合候选列表，其中，所述生成融合候选列表至少包括：从相邻译码单元(neighboring coding units)中推导出一个或多个空间融合候选；在推导出所述一个或多个空间融合候选之后，直接或立即推导出一个或多个时间运动矢量预测值(temporal motion vector prediction，mvp)；至少根据所述融合候选列表，将单向预测mv推导为所述相应三角划分块的运动矢量。

15、可以理解的是，表述“译码块”和“图像块”在整个申请中可以互换。

16、在一个示例中，所述一个或多个空间融合候选以与hevc中类似的方式推导出，如图8所示。所述一个或多个空间融合候选称为a0、a1、b0、b1和b2。在图8所示位置处的候选之中，选择最多4个融合候选。推导顺序为a1、b1、b0、a0和b2。仅当位置a0、b0、b1、a1中的任一cu不可用时(由于该cu属于另一条带或分块等原因)或经过帧内译码时，才考虑位置b2。在位置a0处的候选加入融合候选列表(merge candidate list，mcl)之后，剩余候选要进行冗余检查才能添加，以确保mcl列表不包括具有相同运动信息的候选，这样提高了译码效率。

17、时间运动矢量预测值(motion vector prediction，mvp)根据属于并置参考图像的并置cu推导出，如图9所示，“6”或“7”为推导出的mvp。

18、如图6所示，沿对角线或反对角线划分视频译码块，得到两个三角划分块，例如pu0和pu1。块pu0和pu1此时可以指视频块的左下和右上三角部分或者视频块的左上和右下三角部分。术语“视频块”和“视频译码块”用作同义词。术语“三角划分块(triangle/triangularpartition)”和“三角块(triangle/triangular block)”用作同义词。

19、视频译码块可以分成包括4×4像素块的较小块单元。术语“像素”也可以指样本(sample)。因此，视频块的两个三角块pu0和pu1都可以包括多个4×4块单元，如图7所示。

20、视频块对角线或反对角线上的4×4块单元中的样本属于其中一个三角划分块。在对每本文档来自技高网...

【技术保护点】

1.一种传输方法，其特征在于，所述方法包括以下步骤：

2.如权利要求1的方法，其特征在于，所述方法还包括：

3.根据权利要求1或2所述的方法，其特征在于，所述单向预测候选推导过程包括：根据用于所述几何划分的融合模式的单向预测MV选择规则从所述双向预测运动矢量中，将单向预测MV推导为所述当前几何划分块的运动矢量，其中，所述用于所述几何划分的融合模式的单向预测MV选择规则表示所述生成的融合候选列表中的选定的双向预测MV中的第一MV或第二MV被选择为单向预测MV。

4.根据权利要求1至3任一项所述的方法，其特征在于，所述融合候选列表包括一个或多个单向预测MV和一个或多个双向预测MV，所述一个或多个双向预测MV包括所述选定的双向预测MV。

5.根据权利要求3或4所述的方法，其特征在于，所述第一融合索引指示的融合候选是具有对应于第一参考图像列表(REF_PIC_LIST0)的第一MV和对应于第二参考图像列表(REF_PIC_LIST1)的第二MV的选定双向预测MV。

6.根据权利要求1至5任一项所述的方法，其特征在于，所述码流中还包括第二融合索引index，

7.根据权利要求2至6任一项所述的方法，其特征在于，所述单向预测MV选择规则为以下任一种：

8.一种传输设备，其特征在于，所述设备包括处理电路，所述处理电路用于执行根据权利要求1至7中任一项所述的方法。

9.一种计算机程序产品，其特征在于，所述计算机程序产品包括程序代码，所述程序代码用于执行根据权利要求1至7中任一项所述的方法。

10.一种传输设备，其特征在于，所述解码器包括：

11.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质上存储有程序指令和/或数据流(视频码流)，当其在计算机上运行时，使得计算机执行如权利要求1-7任一项所述的方法。

12.一种计算机程序产品，其特征在于，所述计算机程序产品上存储有程序指令和/或数据流(视频码流)，当其在计算机上运行时，使得计算机执行如权利要求1-7任一项所述的方法。

13.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质上存储有视频码流，所述视频码流包括第一融合索引；

14.一种码流，其特征在于，所述码流包括第一融合索引；

...

【技术特征摘要】

1.一种传输方法，其特征在于，所述方法包括以下步骤：

2.如权利要求1的方法，其特征在于，所述方法还包括：

3.根据权利要求1或2所述的方法，其特征在于，所述单向预测候选推导过程包括：根据用于所述几何划分的融合模式的单向预测mv选择规则从所述双向预测运动矢量中，将单向预测mv推导为所述当前几何划分块的运动矢量，其中，所述用于所述几何划分的融合模式的单向预测mv选择规则表示所述生成的融合候选列表中的选定的双向预测mv中的第一mv或第二mv被选择为单向预测mv。

4.根据权利要求1至3任一项所述的方法，其特征在于，所述融合候选列表包括一个或多个单向预测mv和一个或多个双向预测mv，所述一个或多个双向预测mv包括所述选定的双向预测mv。

5.根据权利要求3或4所述的方法，其特征在于，所述第一融合索引指示的融合候选是具有对应于第一参考图像列表(ref_pic_list0)的第一mv和对应于第二参考图像列表(ref_pic_list1)的第二mv的选定双向预测mv。

6.根据权利要求1至5任一项所述的方法，其特征在于，所述码流中还包括第二融合索引...

【专利技术属性】
技术研发人员：马克斯·布莱瑟，赵志杰，
申请(专利权)人：华为技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人