根据运动信息压缩方案通过层间运动信息预测对图像进行编码或解码的方法和设备技术

技术编号:20657464 阅读:20 留言:0更新日期:2019-03-23 08:51
本发明专利技术涉及用于可分级视频编码器和解码器中的运动矢量预测的方法、装置和计算机程序。本发明专利技术涉及还已知为运动推导处理的用以确定可分级编码方案的增强层中的运动信息预测结果的处理。该处理包括对挑选由于压缩方案而可用的更相关的运动信息所使用的参考层中的位置进行校正。因此,改进了运动信息预测。

Method and equipment for encoding or decoding images through inter-layer motion information prediction according to motion information compression scheme

The invention relates to a method, device and computer program for motion vector prediction in a scalable video encoder and decoder. The present invention also relates to the processing of motion information prediction results in an enhancement layer known as motion derivation processing for determining scalable coding schemes. The process includes correcting the position in the reference layer used to select more relevant motion information available due to the compression scheme. Therefore, the motion information prediction is improved.

【技术实现步骤摘要】
根据运动信息压缩方案通过层间运动信息预测对图像进行编码或解码的方法和设备(本申请是申请日为2014年3月24日、申请号为201480032319.0、专利技术名称为“根据运动信息压缩方案通过层间运动信息预测对图像进行编码或解码的方法和设备”的申请的分案申请。)
本专利技术通常涉及可分级视频编码和解码领域,尤其涉及将扩展高效率视频编码(HEVC)标准的可分级视频编码和解码。更特别地,本专利技术涉及用于可分级视频编码器和解码器中的运动矢量预测的方法、装置和计算机程序。
技术介绍
视频编码是将一系列视频图像变换成紧凑的数字化位流以使得可以传输或存储这些视频图像的方式。编码装置用于对视频图像进行编码,而关联的解码装置可用于对位流进行重建以供显示和观看。一般目的是将位流形成为具有与原始视频信息相比更小的大小。这样有利地降低了针对传送网络或存储装置所要求的用以传输或存储位流码的容量。特别是关于解码部分,已将常见的标准化方法用于编码处理的格式和方法。绝大多数的过去视频标准将视频图像分割成较小的段(被称为宏块或块)。在最终确定的新高效率视频编码(HEVC)视频压缩标准中,根据考虑中的原始图像片段的特性,宏块被所谓的最大编码单位(LCU)(还被称为编码树块(CTB))替代,并且被分区并调整成现在被称为编码单位(CU)的块。这样使得能够对视频图像的包含相对较多信息的区域进行更详细的编码,并且使得针对特征较少的区域的编码工作较少。注意,根据视频压缩文献的以下不同术语,图像区域也是已知的:像素块、像素的块、块、编码单位(CU)和宏块。现在正定义HEVC的可分级扩展。在该扩展中,图像被视为包括多个层级层。层级层包括基本层(等同于原始视频序列的低质量版本的图像(或帧)的集合)以及一个或多个增强层(还已知为细化层)。原本通过以类似于静止图像或图片的数字编码的方式单独对各宏块进行编码来处理视频图像。随后的编码模型允许根据相邻宏块(空间或INTRA(帧内)预测)或者通过与相邻帧中的相似宏块相关联(时间预测)来预测一个帧中的特征。这样使得能够使用已可用的编码信息,由此缩短整体所需的编码位率的量。在值的残差集合中捕获到要编码的原始块和预测所使用的块之间的差。然后,以残差和预测所使用的块的标识符的形式对原始块进行编码。许多不同类型的预测是可能的。有效编码在考虑到各预测模式用以在位流中代表将要编码的块所引起的位流大小的情况下,选择在解码时针对该块提供最佳质量的最佳预测模式。解码后的图片质量和所需位率的降低之间的权衡(还已知为率/失真权衡)是整体目标。在时间预测的情况下,可以进行多种预测,并且可以聚集为单向预测和双向预测这两个主要类型。在单向预测的情况下,要预测的块与一个预测结果相关联。将该预测结果的位置编码作为运动信息。该运动信息由包含预测结果的参考帧的索引(在标准中被称为ref_idx)和如下的矢量构成,其中该矢量是由垂直位移和给出所参考的帧中的预测结果块的位置的水平位移所定义的。在双向预测的情况下,要编码的块与在两个不同的参考帧中所获取到的两个预测结果相关联。结果,运动信息包括两个矢量和参考帧的两个索引。可以以预测方式对运动信息自身进行编码。可以使用针对相同帧中的相邻编码单位所获得的运动信息作为空间运动信息预测结果。可以使用从其它帧中的同位置编码单位所获得的运动信息作为时间运动信息预测结果。然后,利用与所使用的运动信息预测结果有关的索引以及表示所选择的运动信息预测结果和要编码的运动信息之间的差的残差信息来对针对要编码的块所要编码的运动信息进行编码。根据与先前图像相对应的运动信息所进行的运动信息的预测要求编码器和解码器存储先前编码图像的运动场。该运动场可以表示用以更能存储如4k2k或8k4k视频那样的分辨率大的视频的大量数据。为了限制HEVC编解码器的存储要求,HEVC标准采用了代替整个运动场而是使用压缩运动场来进行运动信息预测的策略。仅在使用先前图像的运动信息的情况下才要求存储运动场。在HEVC中,可以使得时间运动信息预测结果的使用变得无效。在这种情况下,可以通过防止存储运动信息来进一步降低HEVC编解码器的存储要求。可分级编解码器的主要思路其中之一是重复使用来自使用给定编解码器(例如,HEVC)进行编码后的参考层(RL)的信息,以对增强层的信息进行编码。将期望如下:使用在参考层中所确定的运动信息来对增强层中的运动信息进行预测编码。特别地,如果在参考层中使得时间运动信息预测结果的使用变得无效,则可能发生以下情况:可能不存在可用的运动信息以用于进行增强层中的运动信息预测。
技术实现思路
本专利技术是为了解决前述担心中的一个或多个而设计的。本专利技术涉及用以确定可分级编码方案的增强层中的运动信息预测结果的处理(还已知为运动推导处理)。该处理包括对挑选由于压缩方案而可用的更相关的运动信息所使用的参考层中的位置进行校正。根据本专利技术的第一方面,提供一种用于根据可分级的编码格式来对图像进行编码的方法,所述编码格式至少包括参考层和增强层,基于运动信息来对所述图像的至少一部分进行预测编码,基于运动信息预测结果的集合来对所述运动信息自身进行预测编码,所述方法至少针对所述增强层中的图像区域包括以下步骤:基于图像中属于所述参考层的其它部分的运动信息来确定运动信息预测结果的集合;以及确定所述增强层中的要编码的图像区域在所述参考层中的同位位置,以选择与所述同位位置相关联的运动信息作为运动信息预测结果的所述集合的一部分,其中,所述方法还包括以下步骤:将所述同位位置的至少一个坐标X校正为通过以下表达式所给出的新值X’:其中,是((X+4)/16)取整数值的截断。因此,改进了运动信息预测。根据本专利技术的另一方面,提供一种用于根据可分级的编码格式来对图像进行解码的方法,所述编码格式至少包括参考层和增强层,基于运动信息来对所述图像的至少一部分进行预测编码,基于运动信息预测结果的集合来对所述运动信息自身进行预测编码,所述方法至少针对所述增强层中的图像区域包括以下步骤:基于图像中属于所述参考层的其它部分的运动信息来确定运动信息预测结果的集合;以及确定所述增强层中的要编码的图像区域在所述参考层中的同位位置,以选择与所述同位位置相关联的运动信息作为运动信息预测结果的所述集合的一部分,其中,所述方法还包括以下步骤:将所述同位位置的至少一个坐标X校正为通过以下表达式所给出的新值X’:其中,是((X+4)/16)取整数值的截断。根据本专利技术的另一方面,提供一种用于根据可分级的编码格式来对图像进行编码的装置,所述编码格式至少包括参考层和增强层,基于运动信息来对所述图像的至少一部分进行预测编码,基于运动信息预测结果的集合来对所述运动信息自身进行预测编码,所述装置至少针对所述增强层中的图像区域包括:预测结果确定模块,用于基于图像中属于所述参考层的其它部分的运动信息来确定运动信息预测结果的集合;以及位置确定模块,用于确定所述增强层中的要编码的图像区域在所述参考层中的同位位置,以选择与所述同位位置相关联的运动信息作为运动信息预测结果的所述集合的一部分,其中,所述装置还包括:位置校正模块,用于将所述同位位置的至少一个坐标X校正为通过以下表达式所给出的新值X’:其中,是((X+4)/16)取整数值的截断。根据本专利技术本文档来自技高网
...

【技术保护点】
1.一种用于根据可分级的编码格式来对图像进行编码的方法,所述编码格式至少包括参考层和增强层,基于运动信息来对所述图像的至少一部分进行预测编码,基于来自运动信息预测结果候选的集合的运动信息预测结果来对所述运动信息自身进行预测编码,所述方法至少针对所述增强层中的图像区域包括以下步骤:基于与图像中属于所述参考层的部分相关联的运动信息来确定包括运动信息预测结果候选的运动信息预测结果候选的集合;以及确定所述增强层中的要编码的图像区域在所述参考层中的同位位置,其特征在于,所述方法还包括以下步骤:将所述同位位置的至少一个坐标X校正为通过以下表达式所给出的新值X’:X’=((X+4)>>4)

【技术特征摘要】
2013.04.05 GB 1306221.11.一种用于根据可分级的编码格式来对图像进行编码的方法,所述编码格式至少包括参考层和增强层,基于运动信息来对所述图像的至少一部分进行预测编码,基于来自运动信息预测结果候选的集合的运动信息预测结果来对所述运动信息自身进行预测编码,所述方法至少针对所述增强层中的图像区域包括以下步骤:基于与图像中属于所述参考层的部分相关联的运动信息来确定包括运动信...

【专利技术属性】
技术研发人员:C·吉斯科特P·乌诺G·拉罗彻E·弗朗考伊斯
申请(专利权)人:佳能株式会社
类型:发明
国别省市:日本,JP

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1