用于在帧间预测下执行的运动补偿的视频解码方法和装置制造方法及图纸

技术编号:16106290 阅读:33 留言:0更新日期:2017-08-30 00:25
用于在帧间预测下执行的运动补偿的视频解码方法和装置,该方法包括由视频解码器的处理器执行的计算机可执行步骤,以实现:从基准图片存储器检索整数样本;在第一方向上对整数样本应用第一分数样本插值,以生成第一组分数样本;以及在第二方向上对第一组分数样本应用第二分数样本插值,以生成第二组分数样本,通过将两个第二组分数样本组合而生成双向预测样本,两个第二组分数样本彼此不同,双向预测样本的值被截取以利用整数样本的第一比特深度来表示第一组分数样本利用与该第一比特深度无关的恒定的第二比特深度来表示,作为第一和第二分数样本插值,应用至少具有[‑1,4,‑11,40,40,‑11,4,‑1]的8抽头FIR滤波器来生成四分之一像素样本。

【技术实现步骤摘要】
用于在帧间预测下执行的运动补偿的视频解码方法和装置本申请是原案申请号为201280031173.9的专利技术专利申请(国际申请号:PCT/US2012/043674,申请日:2012年6月22日,专利技术名称:用于运动补偿预测的方法和设备)的分案申请。相关申请本专利文献要求2011年6月24日提交的临时美国专利申请No.6,501,112的在35U.S.C.§119(e)下的申请日的利益,其完整内容以引用方式并入本文。
本专利技术涉及用于帧间预测的运动补偿,具体地讲,涉及实现低复杂度和高精度的运动补偿中使用的分数样本(fractionalsample)插值。
技术介绍
数字视频需要大量数据来以未压缩方式表示数字视频序列(例如,一系列帧)中的每一帧。由于带宽限制,对于大多数应用而言通过计算机网络发送未压缩的数字视频不可行。另外,未压缩的数字视频需要大量存储空间。通常以一些方式对数字视频进行编码,以降低存储要求并降低带宽要求。对数字视频进行编码的一种技术是帧间预测。帧间预测利用了不同帧之间的时间冗余。视频的时间上相邻的帧通常包括基本上保持相同的像素块。在编码处理过程中,运动矢量使一个帧中的像素块的移动与另一帧中的类似像素块相互关联。因此,系统不需要对像素块编码两次,而是对像素块编码一次并提供运动矢量以预测另一像素块。对数字视频进行编码的另一技术是帧内预测。帧内预测在不参照其它帧中的像素的情况下对帧或其一部分进行编码。帧内预测利用了帧内的像素块之间的空间冗余。由于空间上相邻的像素块通常具有相似的属性,所以通过参照相邻块之间的空间相关来提高编码处理的效率。可通过基于相邻块中使用的预测模式预测目标块来利用这种相关。在帧间预测中,基于运动估计和补偿预测接收的图片。视频中的运动对象常常从一个帧到一个帧地出现,使得它的全部或一部分在那些后续帧中重新定位。不管那些重新定位,帧序列之间的相关较高,导致冗余。可通过将当前帧中的样本与基准帧中的相同对象的位置进行比较并相关来降低这种时间冗余。具体地讲,在运动估计过程中,将当前帧或其分区与基准帧进行比较,所述基准帧在时间上可在当前帧之前或前面。将相应基准帧中设置的搜索范围内的像素图案与当前帧中展现的像素图案进行比较,直至找到包含与待编码的当前帧中的像素图案最匹配的像素图案的基准帧为止。基于比较结果,来估计帧间位移矢量或运动矢量。利用估计的运动矢量,运动补偿生成当前帧的预测。可通过对基准图片中的像素(称为整数位置处的样本,或简称为整数样本)应用插值以增加基准图片的分辨率,来增加运动矢量准确度和编码效率。插值是为了利用整数样本的值生成各个整数样本之间的分数样本。整数样品之间生成越多分数样本,基准图片的分辨率变得越高,可越精确和准确地补偿分数样本位移。例如,为了准确地补偿仅为半个像素的位移的运动对象的移动,需要至少半像素插值。可利用许多种不同的块尺寸来执行运动估计和补偿。可针对具有4×4、4×8、8×4、8×8、8×16、16×8或16×16像素的分区确定各个运动矢量。提供小的运动补偿分区提高了处理精细运动细节的能力。H.264/AVC采用2步骤方法并实现高达四分之一像素分辨率的运动补偿。在H.264/AVC中,第一步骤使用6抽头滤波器来从周围整数样本的值生成半像素分辨率的中间值。在第二步骤中,对整数样本的值和中间值取平均,或者在中间值之间取平均,以生成四分之一像素位置处的分数样本(或简称为四分之一像素样本)。在B切片中,可对来自两个预测的两个预测分数样本进一步取平均。然而,请注意,多重平均运算在级联时会引入舍入误差,其对运动补偿的准确度和效率有不利影响。视频编码联合协作组(JCT-VC)的提案D321和E242解决了与双向平均关联的舍入误差问题。这些文献提出增加舍入操作,所述舍入操作被限制在两个预测之后的双向平均的最后步骤处进行。JCT-VC草案E603公开了使用8抽头滤波器来实现四分之一像素分辨率。在E603中,一些四分之一像素样本通过将8抽头滤波器应用于最近的整数样本并将滤波结果截断为预定比特深度来导出。剩余四分之一像素样本通过两个处理来导出。在第一处理中,中间值通过在垂直方向上将8抽头滤波器应用于最近整数样本来导出。在第二处理中,在水平方向上将8抽头滤波器应用于中间值,并将滤波结果截断至预定比特深度。此2处理方法的优点在于,第二处理中的垂直滤波和水平滤波不要求固定顺序,因此没有必要向解码器提供有关第二处理中的垂直滤波和水平滤波的顺序的信令。然而,E603中讨论的运动补偿需要定义附加滤波操作来生成中间值。应用于中间值的滤波操作开销高,且需要高计算复杂度,尤其是对于具有高比特深度的视频数据而言。另外,在E603讨论的运动补偿中,中间值没有被截断为确保从其计算的四分之一像素样本的准确度。因此,在E603讨论的运动补偿过程中,所计算出的值的按位精度不恒定。在上述第一处理的结尾,所得样本值的精度增加了由8抽头滤波器的增益确定的量。通过将8抽头滤波器应用于中间值,在截断至预定精度之前精度再次增加了与第一处理中相同的量。因此,第二处理中需要截断的分辨率是第一处理所需要的两倍,以便在第二步骤的结尾使分辨率回到原始比特深度。
技术实现思路
鉴于上述现有技术,本专利技术提供了一种用于帧间预测的新颖的运动补偿操作。该运动补偿对样本应用分数样本插值以生成分数样本。在根据本专利技术的运动补偿中,在第一方向上对样本应用第一分数样本插值以生成第一组分数样本。在第二方向上对第一组分数样本应用第二分数样本插值,以生成第二组分数样本。在本专利技术中,利用与样本的表示精度无关的精度来表示第一组分数样本。在本专利技术的一方面中,所述分数样本插值应用具有以下三组系数中的一个的8抽头FIR滤波器来生成四分之一像素样本:[-1,4,-10,58,17,-5,1,0];[-1,4,-11,40,40,-11,4,-1];以及[0,1,-5,17,58,-10,4,-1]。在本专利技术的一方面中,所述分数样本插值包括截断各个滤波结果,使得所述分数样本具有期望的精度。贯穿所述第一分数插值处理和第二分数插值处理,所述期望的精度可以是恒定的。截断处理可涉及使截断结果朝负无穷大舍入。这通过不将任何偏移增加到截断处理之前的滤波结果来实现。另外,在本专利技术的另一方面中,可独立于样本的原始比特深度将所述样本按比例放大至第二比特深度,该第二比特深度对于所述样本而言是恒定的。所述第二比特深度可被设置为等于可用于表示样本的比特数,按比例放大因子被设置为等于可用于表示样本的比特数减去样本的原始比特深度。另外,在本专利技术的另一方面中,用按比例放大的样本减去偏移。本专利技术提供了一种用于在帧间预测下执行的运动补偿的视频解码方法,该视频解码方法包括计算机可执行步骤,所述计算机可执行步骤由视频解码器的处理器执行,以实现:从基准图片存储器检索整数样本;在第一方向上对从所述基准图片存储器检索出的整数样本应用第一分数样本插值,以生成第一组分数样本;以及在第二方向上对所述第一组分数样本应用第二分数样本插值,以生成第二组分数样本,通过将两个所述第二组分数样本组合而生成双向预测样本,该两个所述第二组分数样本彼此不同,所述双向预测样本的值被截取以利用所述整数样本的第一比特深度来表示,所述整数样本利本文档来自技高网
...
用于在帧间预测下执行的运动补偿的视频解码方法和装置

【技术保护点】
一种用于在帧间预测下执行的运动补偿的视频解码方法,该视频解码方法包括计算机可执行步骤,所述计算机可执行步骤由视频解码器的处理器执行,以实现:从基准图片存储器检索整数样本;在第一方向上对从所述基准图片存储器检索出的整数样本应用第一分数样本插值,以生成第一组分数样本;以及在第二方向上对所述第一组分数样本应用第二分数样本插值,以生成第二组分数样本,通过将两个所述第二组分数样本组合而生成双向预测样本,该两个所述第二组分数样本彼此不同,所述双向预测样本的值被截取以利用所述整数样本的第一比特深度来表示,所述整数样本利用第一比特深度来表示,所述第一组分数样本利用与所述整数样本的第一比特深度无关的恒定的第二比特深度来表示,作为所述第一分数样本插值和所述第二分数样本插值,应用至少具有[‑1,4,‑11,40,40,‑11,4,‑1]的8抽头FIR滤波器来生成四分之一像素样本。

【技术特征摘要】
2011.06.24 US 61/501,1121.一种用于在帧间预测下执行的运动补偿的视频解码方法,该视频解码方法包括计算机可执行步骤,所述计算机可执行步骤由视频解码器的处理器执行,以实现:从基准图片存储器检索整数样本;在第一方向上对从所述基准图片存储器检索出的整数样本应用第一分数样本插值,以生成第一组分数样本;以及在第二方向上对所述第一组分数样本应用第二分数样本插值,以生成第二组分数样本,通过将两个所述第二组分数样本组合而生成双向预测样本,该两个所述第二组分数样本彼此不同,所述双向预测样本的值被截取以利用所述整数样本的第一比特深度来表示,所述整数样本利用第一比特深度来表示,所述第一组分数样本利用与所述整数样本的第一比特深度无关的恒定的第二比特深度来表示,作为所述第一分数样本插值和所述第二分数样本插值,应用至少具有[-1,4,-11,40,40,-11,4,-1]的8抽头FIR滤波器来生成四分之一像素样本。2.根据权利要求1所述的视频解码方法,其中,所述第一分数样本插值和所述第二分数样本插值包括:截断各个滤波结果,使得所述分数样本具有所述第二比特深度。3.根据权利要求2所述的视频解码方法,其中,贯穿所述第一分数插值处理和所述第二分数插值处理,所述第二比特深度是恒定的。4.根据权利要求2所述的视频解码方法,其中,截断各个滤波结果的步骤包括:使截断结果朝负无穷大舍入。5.根据权利要求1-4中的任一项所述的视频解码方法,其中,所述整数样本的第一比特深度被设置为8或10。6.根据权利要求1-5中的任...

【专利技术属性】
技术研发人员:F·J·宝森
申请(专利权)人:株式会社NTT都科摩
类型:发明
国别省市:日本,JP

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1