用于位置相关预测组合的模式相关和尺寸相关的块级限制的方法和装置制造方法及图纸

技术编号:29504464 阅读:43 留言:0更新日期:2021-07-30 19:19
提供一种帧内预测方法,包括:通过使用帧内预测模式从当前块外的一个或多个参考样本确定所述当前块的样本的预测值;当不满足一个或多个预定义条件时,推导加权预测值,其中,所述一个或多个预定义条件与所述当前块的宽度和/或高度以及所述帧内预测模式中的至少一个有关;以及当不满足所述一个或多个预定义条件时,使用所述加权预测值对所述当前块进行译码。

【技术实现步骤摘要】
【国外来华专利技术】用于位置相关预测组合的模式相关和尺寸相关的块级限制的方法和装置
本专利技术总体上涉及图像处理领域,并且更具体地涉及具有位置相关预测组合的帧内预测。
技术介绍
视频译码(视频编码和解码)用于各种数字视频应用中,例如广播数字电视、互联网和移动网络上的视频传输、实时对话应用(例如视频聊天、视频会议)、DVD和蓝光光碟、视频内容获取和编辑系统以及安全应用程序的便携式摄像机。用于描绘甚至相对较短的视频所需的视频数据量也可能很大,当要在带宽容量有限的通信网络上流式传输数据或以其他方式传送数据时,可能会造成困难。因此,视频数据通常在经过现代电信网络通信之前被压缩。当视频存储在存储设备上时,视频的尺寸也可能是个问题,因为内存资源可能会受到限制。视频压缩设备通常在源处使用软件和/或硬件以在传输或存储之前对视频数据进行译码,从而减少了表示数字视频图像所需的数据量。然后由视频解压缩设备在目的地接收经压缩的数据,该视频解压缩设备对视频数据进行解码。在网络资源受限和对更高视频质量的需求不断增长的情况下,需要在几乎不牺牲图像质量的情况下提高压缩率的改进型压缩和解压缩技术。
技术实现思路
本申请的实施例提供了根据独立权利要求的用于编码和解码的装置和方法。通过独立权利要求的主题来实现前述和其他目的。根据从属权利要求、说明书和附图,进一步的实现方式是显而易见的。本文中,提供了一种帧内预测方法,所述方法包括以下步骤:通过使用帧内预测模式从当前块外的一个或多个参考样本确定当前块的样本的预测值;当不满足一个或多个预定义条件时,推导加权预测值,其中,所述一个或多个预定义条件与所述当前块的宽度和/或高度以及用于确定所述当前块的所述样本的所述预测值的所述帧内预测模式中的至少一个有关;以及当不满足所述一个或多个预定义条件时,使用所述加权预测值对所述当前块进行译码。所述当前块包括在视频序列或静止图像的当前帧中。具体地,当满足所述一个或多个预定义条件时(并且实际上,没有推导加权预测值),可使用所述预测值而不使用所述加权预测值对所述当前块进行译码。如将在下面在当前译码技术中更详细地描述,整个帧内预测过程包括:应用多个提供的帧内预测模式(例如,平面、水平、垂直、DC模式)中的特定帧内预测模式,以便获取当前块的样本/像素的预测(亮度、色度)值,并基于通过对所述预测值加权而获得的加权预测值(具体地,在位置相关预测组合(PDPC)的情况下)应用一些后滤波(平滑)。然而,专利技术人从众多实验和实际应用中获悉,后滤波可能表示相对昂贵的处理,可能比应用帧内预测模式还要复杂,这种后滤波并非在所有应用中都是合理的,甚至可能会引起其他问题。因此,如果不能达到显著的性能益处,则增加用于执行后滤波过程的硬件和/或软件复杂度可能是不合理的。例如,帧内预测模式中使用的线性模型可能会在亮度与色度之间引入一些人为的依赖性,甚至PDPC也会增强这些依赖性。鉴于此,对于本专利技术至关重要的是,并非在所有情况下都执行对通过应用所选帧内预测模式获得的预测值进行加权的过程,而是有条件地进行。因此,与适当情况下的技术相比,可减少处理器负荷以及整个译码过程的复杂性和持续时间。根据实施例,基于以下推导加权预测值:a)所述当前块中所述样本的位置(x,y)处的预测值,其中,x是所述样本的水平坐标,而y是所述样本的垂直坐标,b)所述当前块的所述宽度和/或所述高度,c)在所述当前块的第x列处在所述当前块顶部的行中与所述当前块相邻的所述当前块的上参考样本的值和在所述当前块的第y行处在所述当前块左侧的列中与所述当前块相邻的所述当前块的左参考样本的值,以及d)用于确定所述当前块的所述样本的所述预测值的所述帧内预测模式。在该实施例中,在PDPC的上下文中,将基于帧内预测模式的帧内预测与基于一些上参考样本和左参考样本的位置相关加权结合。与仅应用所选的帧内预测模式相比,在适当情况下应用PDPC后滤波可以可靠地提高预测精度。具体地,可以根据下式推导加权预测值:其中是所述样本的所述加权预测值;P(x,y)是所述样本的所述预测值;Rx,–1、R–1,y表示所述当前块的所述上参考样本和所述左参考样本;R–1,–1表示在所述当前块的左上顶点处与所述当前块相邻的所述当前块的参考样本的值;wL、wT和wTL表示权重;其中,当所述当前块是亮度块时,函数CliplCmp设置为等于限幅函数CliplY,而当所述当前块是色度块时,所述函数CliplCmp设置为等于限幅函数CliplC,其中Clip1Y(x)=Clip3(0,(1<<BitDepthY)–1,x)Clip1C(x)=Clip3(0,(1<<BitDepthC)–1,x)并且其中,BitDepthY是亮度样本的位深度,而BitDepthC是色度样本的位深度。可以通过下式推导上述权重:wL=V>>((x<<1)>>nScaleX);wT=V>>((y<<1)>>nScaleY);其中,V、nScaleX、nScaleY是预定值(例如,V为16或32;NScaleX可能与NScaleY不同,即,涉及非正方形预测块;另请参见下面的详细描述);以及当所述帧内预测模式是DC模式时,wTL=–(wL>>4)–(wT>>4),当所述帧内预测模式是平面模式时,wTL=0,当所述帧内预测模式是水平模式时,wTL=wT,以及当所述帧内预测模式是垂直模式时,wTL=wL。例如,NScaleX=NScaleY=(log2(w)+log2(h)+2)>>2,其中,w和h分别是当前(正方形)块的所述宽度和所述高度,以样本为单位。以上在PDPC的上下文中计算加权预测值的具体方式可以提高预测精度。专利技术人进行的广泛研究允许识别特定条件类别,在这些特定条件类别下,特别是在PDPC的上下文中,基于加权预测值应用后滤波可能是不利的。因此,一个或多个预定义条件可以包括以下条件中的至少一个:a)所述当前块的所述宽度和所述高度的总和小于第一阈值和/或所述当前块的所述宽度和所述高度的总和大于第二阈值;b)所述当前块的所述宽度和所述高度的总和小于第一阈值,或者所述当前块的所述宽度和所述高度的总和大于第二阈值;并且帧内预测模式是平面模式,或者满足下式的偏斜非对角线模式中的一个:((predMode>=VDIA_IDX–numModes&&predMode!=VDIA_IDX)||(predMode!=2&&predMode<=(2+numModes))),其中,VDIA_IDX是所述对角线模式的索引,numModes是预定义的整数,并且predMode是所述帧内预测模式的索引;...

【技术保护点】
1.一种帧内预测方法,包括:/n通过使用帧内预测模式从当前块外的一个或多个参考样本确定所述当前块的样本的预测值;/n当不满足一个或多个预定义条件时,推导加权预测值,其中,所述一个或多个预定义条件与所述当前块的宽度和/或高度以及所述帧内预测模式中的至少一个有关;以及/n当不满足所述一个或多个预定义条件时,使用所述加权预测值对所述当前块进行译码。/n

【技术特征摘要】
【国外来华专利技术】20181231 US 62/786,551;20190101 US 62/787,3741.一种帧内预测方法,包括:
通过使用帧内预测模式从当前块外的一个或多个参考样本确定所述当前块的样本的预测值;
当不满足一个或多个预定义条件时,推导加权预测值,其中,所述一个或多个预定义条件与所述当前块的宽度和/或高度以及所述帧内预测模式中的至少一个有关;以及
当不满足所述一个或多个预定义条件时,使用所述加权预测值对所述当前块进行译码。


2.根据权利要求1所述的方法,其中,所述当前块包括在视频序列或静止图像的当前帧中。


3.根据权利要求1或2所述的方法,还包括:
当满足所述一个或多个预定义条件时,使用所述预测值而不使用所述加权预测值对所述当前块进行译码。


4.根据权利要求1至3中任一项所述的方法,其中,基于以下推导所述加权预测值:
a)所述当前块中所述样本的位置(x,y)处的预测值,其中,x是所述样本的水平坐标,而y是所述样本的垂直坐标,
b)所述当前块的所述宽度和/或所述高度,
c)在所述当前块的第x列处在所述当前块顶部的行中与所述当前块相邻的所述当前块的上参考样本的值和在所述当前块的第y行处在所述当前块左侧的列中与所述当前块相邻的所述当前块的左参考样本的值,以及
d)所述帧内预测模式。


5.根据权利要求4所述的方法,其中,根据以下公式推导所述加权预测值:


其中

是所述样本的所述加权预测值;
P(x,y)是所述样本的所述预测值;
Rx,–1、R–1,y表示所述当前块的所述上参考样本和所述左参考样本的所述值;
R–1,–1表示在所述当前块的左上顶点处与所述当前块相邻的所述当前块的参考样本的值;
wL、wT和wTL表示权重;
其中,当所述当前块是亮度块时,函数CliplCmp设置为等于限幅函数CliplY,而当所述当前块是色度块时,所述函数CliplCmp设置为等于限幅函数CliplC,其中
Clip1Y(x)=Clip3(0,(1<<BitDepthY)–1,x)
Clip1C(x)=Clip3(0,(1<<BitDepthC)–1,x)



并且其中,BitDepthY是亮度样本的位深度,而BitDepthC是色度样本的位深度。


6.根据权利要求5所述的方法,其中,所述权重通过下式推导:
wL=V>>((x<<1)>>nScaleX);
wT=V>>((y<<1)>>nScaleY);
其中,V、nScaleX、nScaleY是预定值;
以及
当所述帧内预测模式是DC模式时,wTL=–(wL>>4)–(wT>>4),
当所述帧内预测模式是平面模式时,wTL=0,
当所述帧内预测模式是水平模式时,wTL=wT,以及
当所述帧内预测模式是垂直模式时,wTL=wL。


7.根据权利要求6所述的方法,其中,V是16或32。


8.根据权利要求6或7所述的方法,其中
NScaleX=NScaleY=(log2(w)+log2(h)+2)>>2,
其中,w和h分别是所述当前块的所述宽度和所述高度,以样本为单位。


9.根据权利要求6或7所述的方法,其中,NScaleX不同于NScaleY。


10.根据权利要求1至9中任一项所述的方法,其中,所述一个或多个预定义条件包括以下条件中的至少一个:
a)所述当前块的所述宽度和所述高度的总和小于第一阈值和/或所述当前块的所述宽度和所述高度的总和大于第二阈值;
b)所述当前块的所述宽度和所述高度的总和小于第一阈值,或者所述当前块的所述宽度和所述高度的总和大于第二阈值;并且所述帧内预测模式是平面模式,或者满足下式的偏斜非对角线模式中的一个:((predMode>=VDIA_IDX–numModes&&predMode!=VDIA_IDX)||(predMode!=2&&predMode<=(2+numModes))),
其中,VDIA_IDX是所述对角线模式的索引,numModes是预定义的整数,并且predMode是所述帧内预测模式的索引;
c)所述当前块的所述宽度和所述高度的总和小于第一阈值;所述当前块的所述宽度和所述高度的总和大于第二阈值;并且所述帧内预测模式是平面模式,或者满足下式的所述偏斜非对角线模式中的一个:((predMode>=VDIA_IDX–numModes&&predMode!=VDIA_IDX)||(predMode!=2&&predMode<=(2+numModes))...

【专利技术属性】
技术研发人员:阿列克谢·康斯坦丁诺维奇·菲利波夫瓦西里·亚历斯维奇·拉夫特斯基陈建乐
申请(专利权)人:华为技术有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1