一种视频解码方法、装置、计算机设备及存储介质制造方法及图纸

技术编号:23349682 阅读:26 留言:0更新日期:2020-02-15 06:04
本申请实施例提供一种视频解码方法、装置、计算机设备及存储介质。该视频解码方法对已编码视频比特流的当前图片中的当前块的预测信息进行解码,该预测信息指示基于扩展运动矢量候选列表的预测模式。进一步地,该视频解码方法通过迭代地(i)将当前块的宽度增加第一网格尺寸并(ii)将当前块的高度增加第二网格尺寸,直到迭代次数等于指示最大搜索次数的值,对当前块进行扩展,以生成扩展块。然后,该视频解码方法在扩展块中搜索和定位多个块,并在预测模式下构建扩展运动矢量候选列表。

A video decoding method, device, computer equipment and storage medium

【技术实现步骤摘要】
一种视频解码方法、装置、计算机设备及存储介质交叉引用本申请要求2018年8月3日提交的美国临时申请第62/714,552号“统一相邻合并候选者和非相邻合并候选者”、2018年9月24日提交的美国临时申请第62/735,818号“合并中的扩展候选搜索方法和视频编码中的AMVP”以及2019年6月20日提交的美国申请第16/440,315号“用于统一相邻合并候选和非相邻合并候选的方法和装置”的优先权。在先申请的全部内容以引用方式结合在本申请中。
本申请实施例涉及视频编码领域,尤其涉及一种视频解码方法、装置、计算机设备及存储介质。
技术介绍
本文提供的背景描述是为了总体上呈现本申请的上下文。当前署名的专利技术人的工作,对于其在该
技术介绍
部分所描述的范围内以及在提交时不能作为现有技术的描述的多个方面而言,既不明确地也不暗示地被认可为是本专利技术的现有技术。视频编码和解码可以使用具有运动补偿的图片间预测来执行。未压缩的数字视频可以包括一系列图片,每个图片具有例如1920×1080亮度采样和相关联的色度采样的空间维度。该系列图片可以具有固定或可变的图片速率(非正式地也称为帧速率),例如每秒60图片或60Hz。未压缩的视频具有显著的比特率要求。例如,每个样本8比特的1080p604:2:0的视频(1920x1080亮度样本分辨率,60Hz帧速率)需要接近1.5Gbit/s的带宽。一小时这样的视频需要超过600千兆字节的储存空间。视频编码和解码的一个目的可以是通过压缩减少输入视频信号中的冗余。压缩可以有助于减少上述带宽或存储空间要求,在某些情况下减少两个数量级或更多。无损压缩和有损压缩,以及两者的组合均可采用。无损压缩是指可以从压缩的原始信号中重建原始信号的精确副本的技术。当使用有损压缩时,重建信号可能与原始信号不同,但是在原始信号和重建信号之间的失真足够小时,使得重建信号对于目标应用有用。有损压缩广泛应用于视频。容忍的失真量取决于应用;例如,某些消费者流媒体应用的用户可能比电视分发应用的用户可以容忍更高的失真。可达到的压缩比可以反映出:更高的允许/容忍失真可以产生更高的压缩比。运动补偿可以是有损压缩技术,并且可以涉及这样的技术,上述技术中,来自先前重建的图片或其一部分(参考图片)的样本数据块,在由运动矢量(英文:MotionVector,简称为MV)指示的方向上空间移位之后,用于预测新重建的图片或图片部分。在某些情况下,参考图片可以与当前正在重建的图片相同。MV可以具有二个维度X和Y,或者三个维度,第三维度可以是使用中的参考图片的指示(该第三维度可以间接地是时间维度)。在一些视频压缩技术中,应用于样本数据的某区域的MV可以根据其它MV来预测,例如,根据与正在重建的区域在空间上相邻的样本数据的另一区域相关的,并在解码顺序中位于该MV之前的其他MV来预测。这样做可以大幅度减少MV编码所需要的数据量,从而消除冗余并增加压缩。MV预测可以有效地工作,例如,因为当编码来自于相机的输入视频信号(称为自然视频)时,存在比单个MV所适用的区域更大的区域沿相似方向移动的统计可能性,因此,在某些情况下,可以使用从邻近区域的MV导出的相似运动矢量来预测。这会使为给定区域找到的MV与从周围MV预测的MV相似或相同,并且在熵编码之后,这又可以比直接对MV进行编码所使用的比特数更少的比特数来表示。在某些情况下,MV预测可以是从原始信号(即:采样流)导出的信号(即:MV)的无损压缩的示例。在其它情况下,MV预测本身可能是有损的,例如,由于在根据几个周围的MV计算预测值时的舍入误差。H.265/HEVC(ITU-TH.265建议书,“高效视频编解码(HighEfficiencyVideoCoding)”,2016年12月)中描述了各种MV预测机制。在H.265提供的多种MV预测机制中,本申请描述的是在下文中称作“空间合并”的技术。
技术实现思路
本申请实施例提供了一种视频解码方法、装置、计算机设备以及存储介质。本申请实施例提供了一种视频解码方法,包括对已编码视频比特流的当前图片中的当前块的预测信息进行解码,该预测信息指示基于扩展运动矢量候选列表的预测模式;通过迭代地将当前块的宽度增加第一网格尺寸并将当前块的高度增加第二网格尺寸直到迭代次数等于指示最大搜索次数的值,扩展当前块以生成扩展块;在扩展块中搜索并定位多个块,多个块包括与当前块的邻近块不相邻的左上角的块、上方中间的块、右上角的块、左侧中间的块和左下角的块;在预测模式下,构建扩展运动矢量候选列表,该扩展运动矢量候选列表包括至少一个相邻运动矢量候选和非相邻运动矢量候选,该相邻运动矢量候选是与当前块的相邻的邻近块,该非相邻运动矢量候选是扩展块的多个块中与当前块不相邻的块。在一个实施例中,将当前块的相邻时间运动矢量预测值TMVP扩展到扩展块的非相邻TMVP。当相邻TMVP位于当前块的右下角时,将扩展块的右下角的非相邻TMVP添加至扩展运动矢量候选列表中,并且当相邻TMVP不位于当前块的右下角时,将不位于扩展块的右下角的非相邻TMVP添加到扩展运动矢量候选列表中。在一个实施例中,获取所述指示最大搜索次数的值,所述指示最大搜索次数的值在序列参数集(SPS)、图片参数集(PPS)或条目头部中预定义或用信号通知,并且当迭代次数超过指示最大搜索次数的值时停止当前块的扩展。在另一实施例中,获取由编码器和解码器定义的,或在SPS、PPS或条目头部中用信号通知的搜索网格信息,其中搜索网格信息包括第一网格尺寸和第二网格尺寸。在一个实施例中,基于当前块的位置、第一网格尺寸和第二网格尺寸来计算扩展块的新宽度和新高度。在另一实施例中,获取在宏中定义的或在SPS、PPS或条目头部中用信号通知的指示最大搜索范围的值,并且当搜索循环次数超过指示最大搜索次数的值,搜索范围超过当前块上方的最后一个编码树单元CTU行,或者搜索范围超过指示最大搜索范围的值时,停止搜索和定位所述扩展运动矢量候选列表中的块。在一些实施例中,对于当前块左侧的块和当前块上方的块,在所述多个块中以相同的顺序搜索多个相邻运动矢量候选和多个非相邻运动矢量候选。在一些实施例中,基于当前块的位置、第一网格尺寸和第二网格尺寸来定位扩展块的左上角的坐标,并且基于当前块的位置、第一网格尺寸和第二网格尺寸来计算扩展块的宽度(新宽度)和高度(新高度)。处理电路还可以基于扩展块的左上角坐标、扩展块的宽度(新宽度)和高度(新高度)来定位运动矢量候选块的位置。在一些实施例中,当搜索范围超过当前块上方的最后一个CTU行时,使用存储在当前块上方的最后一个CTU行中的运动矢量数据来搜索和定位用于扩展运动矢量候选列表的块。在一些实施例中,当搜索范围达到当前块所在的当前CTU左侧的CTU内部时,用左侧CTU的最右边一列的位置或当前CTU的最左边一列的位置来替换运动矢量候选块的位置。在一些其它实施例中,当搜索范围达到当前块所在的当前CTU上方的CTU内部时,使用上部CTU的底部列的位置或当前CTU的本文档来自技高网
...

【技术保护点】
1.一种视频解码方法,其特征在于,包括:/n对已编码视频比特流的当前图片中的当前块的预测信息进行解码,所述预测信息指示基于扩展运动矢量候选列表的预测模式;/n通过迭代地将所述当前块的宽度增加第一网格尺寸,和将当前块的高度增加第二网格尺寸,直到迭代次数等于指示最大搜索次数的值,对所述当前块进行扩展以生成扩展块;/n在所述扩展块中搜索并定位多个块,所述多个块包括与所述当前块的邻近块不相邻的左上角的块、上方中间的块、右上角的块、左侧中间的块和左下角的块;/n在所述预测模式下,构建所述扩展运动矢量候选列表,所述扩展运动矢量候选列表包括至少一个相邻运动矢量候选和非相邻运动矢量候选,所述相邻运动矢量候选是与所述当前块的相邻的邻近块,所述非相邻运动矢量候选是所述扩展块的多个块中与所述当前块不相邻的块。/n

【技术特征摘要】
20180803 US 62/714,552;20180924 US 62/735,818;20191.一种视频解码方法,其特征在于,包括:
对已编码视频比特流的当前图片中的当前块的预测信息进行解码,所述预测信息指示基于扩展运动矢量候选列表的预测模式;
通过迭代地将所述当前块的宽度增加第一网格尺寸,和将当前块的高度增加第二网格尺寸,直到迭代次数等于指示最大搜索次数的值,对所述当前块进行扩展以生成扩展块;
在所述扩展块中搜索并定位多个块,所述多个块包括与所述当前块的邻近块不相邻的左上角的块、上方中间的块、右上角的块、左侧中间的块和左下角的块;
在所述预测模式下,构建所述扩展运动矢量候选列表,所述扩展运动矢量候选列表包括至少一个相邻运动矢量候选和非相邻运动矢量候选,所述相邻运动矢量候选是与所述当前块的相邻的邻近块,所述非相邻运动矢量候选是所述扩展块的多个块中与所述当前块不相邻的块。


2.根据权利要求1所述的方法,其特征在于,还包括:
将所述当前块的相邻时间运动矢量预测值TemporalMotionVectorPrediction,TMVP扩展为所述扩展块的非相邻TMVP;
当相邻TMVP位于所述当前块的右下角时,将所述扩展块的右下角的非相邻TMVP添加至所述扩展运动矢量候选列表中;以及
当所述相邻TMVP不位于所述当前块的右下角时,将不位于所述扩展块的右下角的非相邻TMVP添加至所述扩展运动矢量候选列表中。


3.根据权利要求1所述的方法,其特征在于,所述扩展所述当前块以生成扩展块还包括:
获取所述指示最大搜索次数的值,所述指示最大搜索次数的值在序列参数集SequenceParameterSet,SPS、图片参数集PictureParameterSet,PPS或条目头部中预定义或用信号通知;
获取由编码器和解码器定义的,或在SPS、PPS或条目头部用信号通知的搜索网格信息,所述搜索网格信息包括所述第一网格尺寸和所述第二网格尺寸;以及
基于所述当前块的位置、所述第一网格尺寸和所述第二网格尺寸,计算所述扩展块的新宽度和新高度;以及
当迭代次数超过所述指示最大搜索次数的值时,停止所述当前块的扩展。


4.根据权利要求1所述的方法,其特征在于,所述在所述扩展块中搜索和定位多个块还包括:
获取在宏中定义的,或在序列参数集SPS、图片参数集PPS或条目头部用信号通知的指示最大搜索范围的值;
对于所述当前块左侧的块和所述当前块上方的块,在所述多个块中以相同的顺序搜索所述相邻运动矢量候选和所述非相邻运动矢量候选;
基于所述当前块的位置、所述第一网格尺寸和所述第二网格尺寸,将所述扩展块的左上角的坐标定位为(Sx,Sy);
基于所述当前块的位置、所述第一网格尺寸和所述第二网格尺寸,计算所述扩展块的新宽度和新高度;
将所述扩展块的左上角的块定位为(Sx-Lx,Sy-Ly),其中,Lx和Ly分别是所述运动矢量候选的宽度尺寸和高度尺寸;
将所述扩展块的上方中间的块定位为(Sx+(新宽度>>1),Sy-Ly)或(Sx+(新宽度>>1)-Lx,Sy-Ly),其中,>>是逐位右移操作;
将所述扩展块的左侧中间的块定位为(Sx-Lx,Sy+(新高度>>1))或(Sx-Lx,Sy+(新高度>>1)-Ly),其中,>>是逐位右移操作;
通过沿着跨越所述扩展块的中部的垂直线对所述扩展块的左上角处块进行垂直镜像来定位所述扩展块的右上角的块;以及
通过沿着跨越所述扩展块的中部的水平线对所述扩展块的左上角的块进行水平镜像来定位所述扩展块的左下角的块。


5.根据权利要求3的方法,其特征在于,所述计算所述扩展块的新宽度和所述扩展块的新高度还包括:
通过定位围绕所述当前块中心的所述扩展块,来计算所述扩展块的第一偏移量和所述扩展块的第二偏移量;或者
通过定位围绕所述当前块的左上角的所述扩展块,来计算所述扩展块的第一偏移量和所述扩展块的第二偏移量。


6.根据权利要求1所述的方法,其特征在于,在所述扩展块中搜索和定位所述多个块还包括在以下情况下停止搜索和定位所述扩展运动矢量候选列表中的块:
当搜索循环次数超过所述指示最大搜索次数的值时;
当搜索范围超过所述当前块上方的最后一个编码树单元CodingTreeUnit,CTU行时;
当所述搜索范围超过指示最大搜索范围的值时;
当所述搜索范围达到所述当前块所在的当前CTU左侧的CTU内部时;或者
当所述搜索范围达到所述当前块所在的当前CTU上方的CTU内部时。


7.根据权利要求6所述的方法,其特征在于,当所述搜索范围超过所述当前块上方的最后一个编码树单元CTU行时停止搜索和定位所述扩展运动矢量候选列表中的所述块的步骤还包括:使用存储在所述当前块上方的最后一个CTU行中的运动矢量数据来为所述扩展运动矢量候选列表搜索和定位所述块。


8.根据权利要求6所述的方法,其特征在于,停止搜索和定位所述扩展运动矢量候选列表中的所述块还包括:当所述搜索范围达到当前块所在的当前CTU左侧的CTU内部时,使用左侧CTU最右边一列的位置或当前CTU最左边一列的位置来替换扩展运动矢量候选列表的块的位置;以及
当所述搜索范围达到所述当前块所在的当前CTU上方的CTU内部时,使用上方CTU的底部列的位置或者当前CTU的顶部列的位置来替换扩展运动矢量候选列表的块的位置。


9.一种用于视频解码装置,其特征在于,包括:
解码模块,用于对已编码视频比特流的当前图片中的当...

【专利技术属性】
技术研发人员:夜静刘杉李翔李贵春许晓中
申请(专利权)人:腾讯美国有限责任公司
类型:发明
国别省市:美国;US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1