有条件地实施运动候选列表构建过程制造技术

技术编号:32093900 阅读:14 留言:0更新日期:2022-01-29 18:24
一种视觉媒体处理方法,包括确定视觉媒体数据的第一视频块使用几何分割模式(GPM),并且视觉媒体数据的第二视频块使用非GPM模式;以及基于统一裁剪处理,构建第一视频块的第一Merge列表和第二视频块的第二Merge列表,其中第一Merge列表和第二Merge列表包括Merge候选,并且统一裁剪处理包括基于比较新Merge候选的运动信息和Merge列表中至少一个Merge候选的运动信息,将新Merge候选添加到Merge列表,其中,GPM包括将第一视频块划分成多个预测分割以分别应用运动预测,并且至少一个分割具有非矩形形状。有非矩形形状。有非矩形形状。

【技术实现步骤摘要】
【国外来华专利技术】有条件地实施运动候选列表构建过程
[0001]相关申请的交叉引用
[0002]根据适用的专利法和/或依据巴黎公约的规则,本申请旨在及时要求于2019年6月4日提交的国际专利申请第PCT/CN2019/089970号的优先权和利益。出于法律规定的所有目的,前述申请的全部公开通过引用并入作为本申请的公开的一部分。


[0003]本文档涉及视频和图像编解码和解码技术。

技术介绍

[0004]数字视频在互联网和其他数字通信网络上仍占最大的带宽使用量。随着能够接收和显示视频的连接用户设备的数量增加,预计数字视频使用所需的带宽将继续增长。

技术实现思路

[0005]所公开的技术可以由视频或图像解码器或编码器实施例使用,以使用非矩形分割(诸如三角形分割模式)来执行视频比特流的编码或解码。
[0006]在一个示例方面,公开了一种视觉媒体处理方法。该方法包括确定视觉媒体数据的第一视频块使用几何分割模式(geometric partitioning mode,GPM),并且视觉媒体数据的第二视频块使用非GPM模式;基于统一裁剪(pruning)处理,针对第一视频块构建第一Merge列表且针对第二视频块构建第二Merge列表,其中,第一Merge列表和第二Merge列表包括Merge候选,并且裁剪处理包括基于比较新Merge候选的运动信息和Merge列表中至少一个Merge候选的运动信息,将新Merge候选添加到Merge列表,其中,GPM包括将第一视频块划分成多个预测分割以分别应用运动预测,以及至少一个分割具有非矩形形状。
[0007]在另一个示例方面,公开了另一种视觉媒体处理方法。该方法包括基于规则,为视觉媒体数据的当前视频块和视觉媒体数据的比特流表示之间的转换确定可应用于当前视频块的运动信息的初始值,其中,该规则规定基于当前视频块的临近块的参考列表(表示为列表X),检查基于子块的时域运动矢量预测值编解码(SbTMVP)模式对于当前视频块是否可用,其中X是整数,并且X的值至少取决于临近块的编码条件;以及基于该确定来执行转换。
[0008]在又一示例方面,公开了另一种视觉媒体处理方法。该方法包括基于规则,为视觉媒体数据的当前视频块和视觉媒体数据的比特流表示之间的转换推导当前视频块的一个或多个子块的一个或多个并置运动矢量,其中,该规则规定使用统一的推导处理来推导一个或多个并置运动矢量,而与用于将当前视频块编解码到比特流表示中的编解码工具无关;以及使用包括一个或多个并置运动矢量的Merge列表来执行转换。
[0009]在又一示例方面,公开了另一种视觉媒体处理方法。该方法包括识别与视觉媒体数据的当前视频块的维度相关联的一个或多个条件,其中,帧内块复制(intra block copy,IBC)模式被应用于当前视频块;基于是否满足与当前视频块的维度相关联的一个或多个条件,确定当前视频块的运动候选列表的运动候选列表构建过程,并且基于运动候选
列表执行当前视频块和当前视频块的比特流表示之间的转换。
[0010]在又一示例方面,公开了另一种视觉媒体处理方法。该方法包括:为视觉媒体数据的当前视频块和视觉媒体数据的比特流表示之间的转换,确定对该转换禁用编解码技术,其中,比特流表示被配置为包括指示编解码技术的Merge候选的最大数量为零的字段;以及基于编解码技术被禁用的确定来执行转换。
[0011]在又一示例方面,公开了另一种视觉媒体处理方法。该方法包括:为当前视频块和当前视频块的比特流表示之间的转换,确定使用规定基于比特流表示中的第二语法元素而有条件地包括比特流表示中的第一语法元素的规则,该第二语法元素指示与应用于当前视频块的至少一种编解码技术相关联的Merge候选的最大数量;以及基于该确定执行当前视频块和当前视频块的比特流表示之间的转换。
[0012]在另一示例方面,上述方法可以由包括处理器的视频解码器装置来实施。
[0013]在另一示例方面,上述方法可以由包括处理器的视频编码器装置来实施。
[0014]在又一示例方面,这些方法可以体现为处理器可执行指令的形式,并存储在计算机可读程序介质上。
[0015]在本文档中进一步描述了以上和其他方面。
附图说明
[0016]图1示出了Merge候选列表构建的推导处理。
[0017]图2示出了空域Merge候选的位置的示例。
[0018]图3示出了考虑了空域Merge候选的冗余校验的候选对的示例。
[0019]图4示出了N
×
2N和2N
×
N分割的第二预测单元(prediction unit,PU)的示例位置。
[0020]图5示出了时域Merge候选的运动矢量缩放的图示示例。
[0021]图6示出了时域Merge候选的候选位置的示例,C0和C1。
[0022]图7示出了组合双向预测Merge候选的示例。
[0023]图8示出了运动矢量预测候选的推导处理的示例。
[0024]图9示出了空域运动矢量候选的运动矢量缩放的示例图示。
[0025]图10示出了4参数仿射模式(左边)和6参数仿射模型(右边)的示例简化仿射运动模型。
[0026]图11示出了每个子块的仿射运动矢量场的示例。
[0027]图12示出了仿射Merge模式的示例候选位置。
[0028]图13示出了修改后的Merge列表构建过程的示例。
[0029]图14示出了基于三角形分割的帧间预测的示例。
[0030]图15示出了应用第一加权因子组的CU的示例。
[0031]图16示出了运动矢量存储的示例。
[0032]图17示出了最终运动矢量表达(UMVE)搜索处理的示例。
[0033]图18示出了UMVE搜索点的示例。
[0034]图19示出了在DMVR的列表0和列表1之间镜像的MVD(0,1)的示例。
[0035]图20示出了可能在一次迭代中检查的MV。
[0036]图21是帧内块复制的示例。
[0037]图22是视频处理装置的示例的框图。
[0038]图23是视频处理方法的示例的流程图。
[0039]图24是其中可以实施所公开的技术的示例视频处理系统的框图。
[0040]图25是视觉媒体处理方法的示例的流程图。
[0041]图26是视觉媒体处理方法的示例的流程图。
[0042]图27是视觉媒体处理方法的示例的流程图。
[0043]图28是视觉媒体处理方法的示例的流程图。
[0044]图29是视觉媒体处理方法的示例的流程图。
[0045]图30是视觉媒体处理方法的示例的流程图。
[0046]图31是视觉媒体处理方法的示例的流程图。
具体实施方式
[0047]本文档提供了图像或视频比特流的解码器可以使用的各种技术,以提高解压缩或解码的数字视频或图像的质量。为简洁起见,术语本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种视觉媒体处理方法,包括:识别与视觉媒体数据的当前视频块的维度相关联的一个或多个条件,其中,帧内块复制(IBC)模式被应用于所述当前视频块;基于是否满足与所述当前视频块的维度相关联的一个或多个条件,确定所述当前视频块的运动候选列表的运动候选列表构建过程,以及基于所述运动候选列表执行所述当前视频块和所述当前视频块的比特流表示之间的转换。2.一种视觉媒体处理方法,包括:针对视频的当前视频块和所述视频的比特流表示之间的转换,使用基于与所述当前视频块的维度相关联的一个或多个条件的运动列表构建过程,构建运动候选列表;以及使用所述运动候选列表执行所述转换,其中,所述运动候选列表包括零个或多个帧内块复制模式候选和/或零个或多个高级运动矢量预测值候选。3.根据权利要求1

2中任一项或多项所述的方法,其中,所述运动候选列表构建过程包括在满足所述一个或多个条件的情况下跳过空域Merge候选的推导。4.根据权利要求1

2中任一项或多项所述的方法,其中,所述运动候选列表构建过程包括在满足所述一个或多个条件的情况下跳过基于历史的运动矢量候选的推导。5.根据权利要求1

2中任一项或多项所述的方法,其中,所述运动候选列表构建过程包括在满足所述一个或多个条件的情况下跳过成对Merge候选的推导。6.根据权利要求1

2中任一项或多项所述的方法,其中,所述运动候选列表构建过程包括在满足所述一个或多个条件的情况下减少最大裁剪操作的总数。7.根据权利要求5所述的方法,其中,所述最大裁剪操作的总数减少到零。8.根据权利要求1

7中任一项所述的方法,其中,在所述当前视频块的宽度和所述当前视频块的高度的乘积小于或等于阈值的情况下,满足所述一个或多个条件。9.根据权利要求8所述的方法,其中,所述阈值是64、32或16。10.根据权利要求1

9中任一项所述的方法,其中,在所述当前视频块的宽度和/或所述当前视频块的高度小于阈值的情况下,满足所述一个或多个条件。11.根据权利要求10所述的方法,其中,所述阈值是4或8。12.根据权利要求1

2中任一项或多项所述的方法,其中,所述运动候选列表包括IBC Merge列表或IBC运动矢量预测列表。13.一种视觉媒体处理方法,包括:针对视觉媒体数据的当前视频块和所述视觉媒体数据的比特流表示之间的转换,确定为所述转换禁用编解码技术,其中,所述比特流表示被配置为包括指示所述编解码技术的Merge候选的最大数量为零的字段;以及基于所述编解码技术被禁用的确定来执行所述转换。14.根据权利要求13所述的方法,其中,所述比特流表示还被配置为基于指示所述编解码技术的Merge候选的最大数量为零的字段,跳过一个或多个语法元素的信令通知。15.根据权利要求13所述的方法,其中,所述编解码技术对应帧内块复制,在所述帧内块复制中,所述当前视频块的样点是从所述当前视频块的视频区域中的其他样点编解码的。
16.根据权利要求13所述的方法,其中,所述编解码技术是子块编解码技术。17.根据权利要求1...

【专利技术属性】
技术研发人员:张莉张凯刘鸿彬王悦
申请(专利权)人:字节跳动有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1