一种整像素运动估计方法、装置、电子设备及介质制造方法及图纸

技术编号:30247597 阅读:14 留言:0更新日期:2021-10-09 20:31
本申请提供一种整像素运动估计方法、装置、电子设备及存储介质。其中,所述方法包括:基于组合划分方式,将当前最大编码单元LCU划分为不重叠的多个第一类编码单元和多个第二类编码单元;将每个第二类编码单元再通过一次水平划分或垂直划分,分为两个第一类编码单元;对所有第一类编码单元进行运动估计,得到每个第一类编码单元对应的运动矢量;根据每个第二类编码单元划分得到的两个第一类编码单元的运动矢量,基于预设的继承方式得到所述第二类编码单元的运动矢量,相较于现有技术,本申请能够降低编码单元级别运动估计的带宽需求和复杂度,易于硬件实现。易于硬件实现。易于硬件实现。

【技术实现步骤摘要】
一种整像素运动估计方法、装置、电子设备及介质


[0001]本申请涉及视频编解码
,具体涉及一种整像素运动估计方法、装置、电子设备及存储介质。

技术介绍

[0002]视频编解码技术的主要作用,是在可用的计算资源内,追求尽可能高的视频重建质量和尽可能高的压缩比。
[0003]运动估计(Motion Estimation,ME)是广泛应用于主流编码器中的一个非常重要的编码工具,其已经被证明在消除帧间冗余上具有较高的有效性。ME通过在参考帧上搜索当前预测单元(Prediction Unit,PU)的最优搜索点(Search Point),从而获取通过两者位置的差别,即运动矢量(Motion Vector,MV)。ME可以进一步分为整像素运动估计(Integer Pixel Motion Estimation,IME)和分像素运动估计(Fractional Pixel Motion Estimation,FME)。
[0004]IME通过在一个预先定义好的搜索范围,即搜索窗(Search Window)内的整像素间进行搜索最优MV。为了获取较为精准的搜索结果,则需要搜索窗尽可能的大,但是这样会让IME由于需要遍历更多的搜索点,极大增加复杂度和带宽消耗。因此,有较多的快速IME方法被提了出来。
[0005]例如,AVS3(Advanced Video Coding,先进视频编码)标准中给出了一种分为三个阶段的跳点搜索方法。
[0006]第一个阶段,首先利用一个螺旋搜索对搜索的起始点进行一个微调得到SP1_0,之后以SP1_0为中心点,进行搜索半径为逐渐加大的菱形模式搜索(Diamond Search),得到最优搜索点SP1_1。如果SP1_1距离初始搜索点距离较远,则进行第二阶段,否则认为是最优搜索点。
[0007]第二个阶段,在以SP1_1为中心,搜索范围(Search Range,SR)为边长的一个方形内,进行一定步长(Stride)的光栅模式搜索(Raster Search),得到最优点SP2。
[0008]第三个阶段,以SP2为中心点,进行小范围的菱形模式搜索,获得最优点SP3,作为最终最优匹配点。
[0009]且由于AVS3标准中,引入了新的编码块划分机制,允许二叉树(BT,Binary Tree),四叉树(QT,Quart Tree)和拓展四叉树(EQT,Extended Quart Tree)并存,大大增加了编码单元(Coding Unit,CU)的数量,一个CU在帧间预测模式下,将不再被分为多个PU,则上述的IME方法是按照CU级别进行的。
[0010]首先,AVS3编码器中的IME方法并不利于硬件实现,因为它具有分阶段收敛的特性,每个阶段搜索的起始点无法得知,导致其具有不规则的数据流。
[0011]其次,由于CU划分技术相较于上一代编码标准增加了例如EQT等更多灵活的划分方式。虽然不再对CU进行PU划分,但是需要进行运动估计的CU依然大幅增加。假设最大编码单元(Largest Coding Unit,LCU)尺寸为64x64,在AVS3标准给出的IPPP编码配置下可划分
出约1549个CU,其中每一个CU都需要进行运动估计,其复杂度和带宽消耗巨大。对于硬件来说,则面临着延迟和硬件资源消耗之间的取舍。

技术实现思路

[0012]本申请的目的是提供一种整像素运动估计方法、装置、电子设备及存储介质,以降低CU级别运动估计的带宽需求和复杂度,易于硬件实现。
[0013]本申请第一方面提供一种整像素运动估计方法,包括:
[0014]基于组合划分方式,将当前最大编码单元LCU划分为不重叠的多个第一类编码单元和多个第二类编码单元,其中,所述组合划分方式包括第一类划分方式和第二类划分方式,第一类划分方式对应第一类编码单元,第二类划分方式对应第二类编码单元;
[0015]将每个第二类编码单元再通过一次水平划分或垂直划分,分为两个第一类编码单元;
[0016]对所有第一类编码单元进行运动估计,得到每个第一类编码单元对应的运动矢量;其中,所有第一类编码单元包括采用第一类划分方式划分得到的第一类编码单元,以及第二类编码单元划分得到的第一类编码单元;
[0017]根据每个第二类编码单元划分得到的两个第一类编码单元的运动矢量,基于预设的继承方式得到所述第二类编码单元的运动矢量。
[0018]本申请第二方面提供一种整像素运动估计装置,包括:
[0019]第一划分模块,用于基于组合划分方式,将当前最大编码单元LCU划分为不重叠的多个第一类编码单元和多个第二类编码单元,其中,所述组合划分方式包括第一类划分方式和第二类划分方式,第一类划分方式对应第一类编码单元,第二类划分方式对应第二类编码单元;
[0020]第二划分模块,用于将每个第二类编码单元再通过一次水平划分或垂直划分,分为两个第一类编码单元;
[0021]运动估计模块,用于对所有第一类编码单元进行运动估计,得到每个第一类编码单元对应的运动矢量;其中,所有第一类编码单元包括采用第一类划分方式划分得到的第一类编码单元,以及第二类编码单元划分得到的第一类编码单元;
[0022]继承模块,用于根据每个第二类编码单元划分得到的两个第一类编码单元的运动矢量,基于预设的继承方式得到所述第二类编码单元的运动矢量。
[0023]本申请第三方面提供一种电子设备,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器运行所述计算机程序时执行以实现本申请第一方面所述的方法。
[0024]本申请第四方面提供一种计算机可读介质,其上存储有计算机可读指令,所述计算机可读指令可被处理器执行以实现本申请第一方面所述的方法。
[0025]相较于现有技术,本申请提供的整像素运动估计方法,基于组合划分方式,将当前最大编码单元LCU划分为不重叠的多个第一类编码单元和多个第二类编码单元;将每个第二类编码单元再通过一次水平划分或垂直划分,分为两个第一类编码单元;对所有第一类编码单元进行运动估计,得到每个第一类编码单元对应的运动矢量;根据每个第二类编码单元划分得到的两个第一类编码单元的运动矢量,基于预设的继承方式得到所述第二类编
码单元的运动矢量,相较于现有技术,本申请对于第二类编码单元的运动矢量,采用已有的运动矢量进行其运动矢量继承,仅需计算相当于两个搜索点的代价,大大减少了其计算复杂度和硬件实现的资源,因此本申请能够降低CU级别运动估计的带宽需求和复杂度,易于硬件实现。
附图说明
[0026]通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本申请的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
[0027]图1示出了本申请提供的一种整像素运动估计方法的流程图;
[0028]图2示本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种整像素运动估计方法,其特征在于,包括:基于组合划分方式,将当前最大编码单元LCU划分为不重叠的多个第一类编码单元和多个第二类编码单元,其中,所述组合划分方式包括第一类划分方式和第二类划分方式,第一类划分方式对应第一类编码单元,第二类划分方式对应第二类编码单元;将每个第二类编码单元再通过一次水平划分或垂直划分,分为两个第一类编码单元;对所有第一类编码单元进行运动估计,得到每个第一类编码单元对应的运动矢量;其中,所有第一类编码单元包括采用第一类划分方式划分得到的第一类编码单元,以及第二类编码单元划分得到的第一类编码单元;根据每个第二类编码单元划分得到的两个第一类编码单元的运动矢量,基于预设的继承方式得到所述第二类编码单元的运动矢量。2.根据权利要求1所述的方法,其特征在于,第一类划分方式包括二叉树BT和/或四叉树QT,第二类划分方式为拓展四叉树EQT,第一编码单元为BT/QT CU,第二编码单元为EQT CU。3.根据权利要求1或2所述的方法,其特征在于,所述对所有第一类编码单元进行运动估计,得到每个第一类编码单元对应的运动矢量,包括:采用分层运动估计方法对当前LCU进行运动估计,得到每个第一类编码单元对应的运动矢量。4.根据权利要求3所述的方法,其特征在于,所述采用分层运动估计方法对当前LCU进行运动估计,得到每个第一类编码单元对应的运动矢量,包括:设置一个搜索窗,以当前LCU对应位置,即运动矢量MV为(0,0)所对应的点为中心,以第一范围进行搜索;对搜索窗像素和编码单元原始像素进行第一比例的降采样,利用降采样图像对当前LCU进行全搜索运动估计,获取代价最小的两个运动矢量,记为第一MV和第二MV;再设置三个搜索窗,分别以第一MV、第二MV和当前LCU的预测运动矢量所指向的点为中心,以第二范围进行搜索,对搜索窗像素和编码单元原始像素进行第二比例的降采样,利用降采样图像对当前LCU进行全搜索运动估计,三个搜索窗各选出最优MV,从三个最优MV中再选出一个最优MV,记为第三MV;再设置一个搜索窗,以第三MV所指向的点为中心,以第三范围进行搜索,搜索窗像素和原始像素不进行降采样,在当前LCU上进行可变块运动估计,得到当前LC...

【专利技术属性】
技术研发人员:向国庆朱玺仲张鹏张广耀宋磊贾惠柱
申请(专利权)人:杭州博雅鸿图视频技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1