运动矢量的预测方法、装置、电子设备及存储介质制造方法及图纸

技术编号:36523802 阅读:16 留言:0更新日期:2023-02-01 16:01
本公开提供了一种运动矢量的预测方法、装置、电子设备及存储介质,涉及人工智能领域,具体涉及云计算、视频编解码以及媒体云技术等技术领域,可应用在智能云场景下。具体实现方案为:获取待编码的视频帧的复杂度表征值;基于所述复杂度表征值,配置所述视频帧对应的候选运动矢量数量,使得所述视频帧的所述复杂度表征值越小,配置的对应的所述候选运动矢量的数量越少;基于所述候选运动矢量数量,预测所述视频帧中各图像块的运动矢量。本公开的技术,能够有效地提高运动矢量的预测的灵活性,提高运动矢量的预测效率。运动矢量的预测效率。运动矢量的预测效率。

【技术实现步骤摘要】
运动矢量的预测方法、装置、电子设备及存储介质


[0001]本公开涉及人工智能领域,具体涉及云计算、视频编解码以及媒体云技术等
,可应用在智能云场景下。尤其涉及一种运动矢量的预测方法、装置、电子设备及存储介质。

技术介绍

[0002]高效视频编码(High Efficiency Video Coding;HEVC)是新一代的视频编码压缩标准,与前一代H.264/AVC标准相比,在同等清晰度下,可以节省将近50%的码率。它可以广泛应用于与视频压缩相关的领域,比如直播、点播等。
[0003]HEVC主要由预测、变换、量化、环路滤波、熵编码等主要技术组成。例如,预测是HEVC的编码器中的一个重要模块,它可以分为帧内预测和帧间预测。其中,帧内预测是指利用同一帧图像中已编码的图像块的重构像素值,按一定的方式来进行待编码图像块的预测的方法。帧间预测是指利用已编码的前向或后向考帧中的图像块来进行待编码图像块的预测的方法。帧间预测会采用逐块匹配的方式,获取参考帧中与当前待编码图像块匹配的最佳匹配块,进而基于当前待编码图像块与最佳匹配块的位置,得到该待编码图像块的运动向量,也就是MV,这个过程被称为运动估计。不同的图像块的MV在时域和空域上也有一定的相关性。因此,可以利用相邻的图像块的MV进行当前块MV的预测,仅对预测残差进行编码,则能节省MV的编码比特数。

技术实现思路

[0004]本公开提供了一种运动矢量的预测方法、装置、电子设备及存储介质,涉及人工智能领域。
[0005]根据本公开的一方面,提供了一种运动矢量的预测方法,包括:
[0006]获取待编码的视频帧的复杂度表征值;
[0007]基于所述复杂度表征值,配置所述视频帧对应的候选运动矢量数量;
[0008]基于所述候选运动矢量数量,预测所述视频帧中各图像块的运动矢量。
[0009]根据本公开的另一方面,提供了一种运动矢量的预测装置,包括:
[0010]第一获取模块,用于获取待编码的视频帧的复杂度表征值;
[0011]配置模块,用于基于所述复杂度表征值,配置所述视频帧对应的候选运动矢量数量;
[0012]预测模块,用于基于所述候选运动矢量数量,预测所述视频帧中各图像块的运动矢量。
[0013]根据本公开的再一方面,提供了一种电子设备,包括:
[0014]至少一个处理器;以及
[0015]与所述至少一个处理器通信连接的存储器;其中,
[0016]所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一
个处理器执行,以使所述至少一个处理器能够执行如上所述的方面和任一可能的实现方式的方法。
[0017]根据本公开的又一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使所述计算机执行如上所述的方面和任一可能的实现方式的方法。
[0018]根据本公开的再另一方面,提供了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现如上所述的方面和任一可能的实现方式的方法。
[0019]根据本公开的技术,能够有效地提高运动矢量的预测的灵活性,提高运动矢量的预测效率。
[0020]应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
[0021]附图用于更好地理解本方案,不构成对本公开的限定。其中:
[0022]图1是根据本公开第一实施例的示意图;
[0023]图2是根据本公开第二实施例的示意图;
[0024]图3是本实施例提供的当前图像块的空域运动矢量候选列表选取示意图;
[0025]图4是本实施例提供的时域候选运动矢量的获取示意图;
[0026]图5是本实施例提供的时域候选运动矢量的获取位置示意图;
[0027]图6是根据本公开第三实施例的示意图;
[0028]图7是根据本公开第四实施例的示意图;
[0029]图8是用来实现本公开实施例的方法的电子设备的框图。
具体实施方式
[0030]以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
[0031]显然,所描述的实施例是本公开一部分实施例,而不是全部的实施例。基于本公开中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的全部其他实施例,都属于本公开保护的范围。
[0032]需要说明的是,本公开实施例中所涉及的终端设备可以包括但不限于手机、个人数字助理(Personal Digital Assistant,PDA)、无线手持设备、平板电脑(Tablet Computer)等智能设备;显示设备可以包括但不限于个人电脑、电视等具有显示功能的设备。
[0033]另外,本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。
[0034]Merge是在HEVC的基础上提出的一种MV预测技术,可以利用时域或空域相邻图像
块的MV,对当前待编码的图像块的MV进行预测。HEVC的Merge模式中,会为当前待编码的图像块建立一个MV候选列表,列表
[0035]中可以包括有5个候选MV,通过遍历这5个MV,计算率失真代价最小
[0036]的MV作为当前待编码的图像块的MV。编码时,在码流中只需传输最优
[0037]MV在列表中的索引即可,以提高编码效率。现有技术的上述MV预测技
[0038]术,所有图像中的待编码图像块的候选MV数量固定,都是5,导致MV预测过程过于死板,预测效率低下。
[0039]图1是根据本公开第一实施例的示意图;如图1所示,本实施例提供一种运动矢量的预测方法,可以应用于视频编码中的编码器中,具体可以包括如下步骤:
[0040]S101、获取待编码的视频帧的复杂度表征值;
[0041]S102、基于复杂度表征值,配置视频帧对应的候选运动矢量数量;
[0042]S103、基于候选运动矢量数量,预测视频帧中各图像块的运动矢量。
[0043]本实施例的运动矢量的预测方法,应用于视频编码过程中的帧间预测环节。由于涉及到的是帧间预测,故可以对视频帧中第一帧之外的所有视频帧中的各编码块进行运动矢量的预测。
[0044]本实施例的待编码的视频帧的复杂度表征值,用于表征对应的视频帧的复杂程度。例如,复杂度表征值越高,表示该视频帧的复杂度越高;而复杂本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种运动矢量的预测方法,包括:获取待编码的视频帧的复杂度表征值;基于所述复杂度表征值,配置所述视频帧对应的候选运动矢量数量;基于所述候选运动矢量数量,预测所述视频帧中各图像块的运动矢量。2.根据权利要求1所述的方法,其中,获取待编码的视频帧的复杂度表征值,包括:获取所述视频帧中各图像块的运动矢量;基于所述视频帧中各所述图像块的运动矢量,计算所述视频帧中所有图像块的运动矢量的绝对值的方差的总和,作为所述视频帧的复杂度表征值。3.根据权利要求1所述的方法,其中,基于所述复杂度表征值,配置所述视频帧对应的候选运动矢量数量,包括:基于所述复杂度表征值、第一预设表征值和第二预设表征值,确定所述视频帧的复杂程度类型;所述第二预设表征值大于所述第一预设表征值;基于所述视频帧的复杂程度类型,配置所述视频帧对应的候选运动矢量数量。4.根据权利要求3所述的方法,其中,基于所述复杂度表征值、第一预设表征值和第二预设表征值,确定所述视频帧的复杂程度类型,包括:若所述复杂度表征值大于或者等于所述第二预设表征值,确定所述视频帧的复杂程度类型为复杂;若所述复杂度表征值小于所述第一预设表征值,确定所述视频帧的复杂程度类型为简单;或者若所述复杂度表征值大于或者等于所述第一预设表征值,且小于所述第二预设表征值,确定所述视频的复杂程度类型为中等。5.根据权利要求3所述的方法,其中,基于所述视频帧的复杂程度类型,配置所述视频帧对应的候选运动矢量数量,包括:若所述视频帧的复杂程度类型为复杂时,配置所述视频帧对应的候选运动矢量数量为五个;若所述视频帧的复杂程度类型为简单时,配置所述视频帧对应的候选运动矢量数量为两个;或者若所述视频帧的复杂程度类型为中等时,配置所述视频帧对应的候选运动矢量数量为三个或者四个。6.根据权利要求3

5任一所述的方法,其中,基于所述复杂度表征值、第一预设表征值和第二预设表征值,确定所述视频帧的复杂程度类型之前,所述方法还包括:获取多个视频帧测试序列中各所述视频帧测试序列对应的第一表征值和第二表征值;基于所述多个视频帧测试序列中各所述视频帧测试序列的第一表征值和所述第二表征值,获取所述第一预设表征值和所述第二预设表征值。7.根据权利要求6所述的方法,其中,获取多个视频帧测试序列中各所述视频帧测试序列对应的第一表征值和第二表征值,包括:对于各所述视频帧测试序列,对所述视频帧测试序列中的各所述视频帧进行下采样,得到对应的下采样帧;对于各所述下采样帧,获取所述下采样帧中的各编码块;
对于各所述下采样帧,计算所述下采样帧中的各所述编码块的运动矢量;对于各所述下采样帧,基于所述下采样帧中各所述编码块的运动矢量,计算所述下采样帧中所有的所述编码块的运动矢量的绝对值的方差,作为所述下采样帧的复杂度表征值;基于所述视频帧测试序列的各所述下采样帧的复杂度表征值,按照预设的各种复杂程度类型的视频帧的数量占比,配置所述第一表征值和所述第二表征值。8.根据权利要求6或7所述的方法,其中,基于所述多个视频帧测试序列中各所述视频帧测试序列的第一表征值和所述第二表征值,获取所述第一预设表征值和所述第二预设表征值,包括:取所述多个视频帧测试序列中的各所述视频帧测试序列的第一表征值的平均,作为所述第一预设表征值;取所述多个视频帧测试序列中的各所述视频帧测试序列的第二表征值的平均,作为所述第二预设表征值。9.一种运动矢量的预测装置,包括:第一获取模块,用于获取待编码的视频帧的复杂度表征值;配置模块,用于基于所述复杂度表征值,配置所...

【专利技术属性】
技术研发人员:邹箭
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1