一种视频编码方法、装置、电子设备及介质制造方法及图纸

技术编号:37331323 阅读:10 留言:0更新日期:2023-04-21 23:08
本公开提供了一种视频编码方法、装置、电子设备及介质,涉及人工智能领域,具体涉及云计算、视频编码、媒体云技术,可应用在智能云场景下。具体实现方案为:获取对待编码视频帧进行视频帧预测,得到的待编码残差帧。然后获取待编码视频帧的最大划分深度;其中,最大划分深度为待编码视频帧的复杂度等级对应的划分深度;复杂度等级基于相同对象在待编码视频帧与参考帧之间的位置偏移量确定;复杂度最高等级对应的划分深度大于或等于复杂度最低等级对应的划分深度。之后基于最大划分深度,将待编码残差帧划分为多个变换单元,并对每个变换单元进行变换处理。实现了在保证视频编码质量基础上,减小视频编码的运算量。减小视频编码的运算量。减小视频编码的运算量。

【技术实现步骤摘要】
一种视频编码方法、装置、电子设备及介质


[0001]本公开涉及人工智能领域,具体涉及云计算、视频编码、媒体云技术,可应用在智能云场景下。

技术介绍

[0002]高效率视频编码(High Efficiency Video Coding,HEVC)是新一代的视频编码压缩标准,与前一代H.264高级视频编码(H.264/Advanced video coding,H.264/AVC)标准相比,HEVC在保证解码后的视频为同等清晰度的情况下,可节省将近50%的码率。HEVC可广泛应用于各种视频压缩相关的领域,如视频直播和视频点播等。
[0003]基于HEVC的视频编码过程中,需要对视频帧进行预测、变换、量化、环路滤波和熵编码等处理。其中,变换处理是一个重要的处理过程,变换单元(transform unit,TU)是变换处理的基本单元,变换处理的主要作用是将视频帧的信号从空域转换到频域,并将频域信号的能量集中到频域右上角,使其他频域区域的能量较少,甚至将能量较少的区域中的能量置为零。

技术实现思路

[0004]本公开提供了一种视频编码方法、装置、电子设备及介质。
[0005]本公开实施例的第一方面,提供了一种视频编码方法,包括:
[0006]获取对待编码视频帧进行视频帧预测,得到的待编码残差帧,所述待编码残差帧表示所述待编码视频帧与视频帧预测结果之间的误差;
[0007]获取所述待编码视频帧的最大划分深度;其中,所述最大划分深度用于表示最多允许划分的变换单元层级数,所述最大划分深度为所述待编码视频帧的复杂度等级对应的划分深度;所述复杂度等级基于相同对象在所述待编码视频帧与参考帧之间的位置偏移量确定;复杂度最高等级对应的划分深度大于或等于复杂度最低等级对应的划分深度;
[0008]基于所述最大划分深度,将所述待编码残差帧划分为多个变换单元,并对每个变换单元进行变换处理。
[0009]本公开实施例的第二方面,提供了一种视频编码装置,包括:
[0010]获取模块,用于获取对待编码视频帧进行视频帧预测,得到的待编码残差帧,所述待编码残差帧表示所述待编码视频帧与视频帧预测结果之间的误差;
[0011]所述获取模块,还用于获取所述待编码视频帧的最大划分深度;其中,所述最大划分深度用于表示最多允许划分的变换单元层级数,所述最大划分深度为所述待编码视频帧的复杂度等级对应的划分深度;所述复杂度等级基于相同对象在所述待编码视频帧与参考帧之间的位置偏移量确定;复杂度最高等级对应的划分深度大于或等于复杂度最低等级对应的划分深度;
[0012]划分模块,用于基于所述获取模块获取的所述最大划分深度,将所述待编码残差帧划分为多个变换单元,并对每个变换单元进行变换处理。
[0013]本公开实施例的第三方面,提供了一种电子设备,包括:
[0014]至少一个处理器;以及
[0015]与所述至少一个处理器通信连接的存储器;其中,
[0016]所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行第一方面中任一项所述的方法。
[0017]本公开实施例的第四方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行根据第一方面中任一项所述的方法。
[0018]本公开实施例的第五方面,提供了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现根据第一方面中任一项所述的方法。
[0019]应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
[0020]附图用于更好地理解本方案,不构成对本公开的限定。其中:
[0021]图1是本公开实施例提供的一种划分变换单元的示例性示意图;
[0022]图2是本公开实施例提供的一种视频编码方法的流程图;
[0023]图3是本公开实施例提供的一种视频帧预处理方法的流程图;
[0024]图4是本公开实施例提供的一种确定复杂度等级的方法流程图;
[0025]图5是本公开实施例提供的一种确定预设门限值的方法流程图;
[0026]图6是本公开实施例提供的另一种视频编码方法的流程图;
[0027]图7是本公开实施例提供的一种视频编码装置的结构示意图;
[0028]图8是用来实现本公开实施例的视频编码方法的电子设备的框图。
具体实施方式
[0029]以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
[0030]离散余弦变换(Discrete Cosine Transform,DCT)处理以TU为基本单元进行变换,不同的TU尺寸对应着不同的变换结果,而变换结果直接影响了后续的量化、熵编码以及率失真优化(Rate

distortion optimization,RDO)等编码过程,因此变换处理中TU的尺寸选择十分重要。
[0031]目前,对于编码树单元(coding tree unit,CTU)中每个2N
×
2N的编码单元(coding unit,CU)而言,CU的标志位决定了CU是否可以划分为4个N
×
N的TU。在划分时还需要参考CU所属的视频帧对应的最大划分深度,其中最大划分深度表示从CU中划分出TU的最大划分层级。例如,最大划分深度为3,表示允许对CU最多划分三层得到TU。
[0032]同一个CTU包括的各CU的大小可以不同,且TU支持的尺寸为4
×
4、8
×
8、16
×
16以及32
×
32,因此实际从同一个CTU中划分得到的TU层级可能不同。
[0033]例如,参见图1,图1中左侧最外层正方形表示CTU,其余的实线正方形表示CU,虚线
正方形表示TU;图1右侧四叉树表示各单元之间的关联关系。CTU中f是一个CU,假设该CU的标志位表示不可以划分,则不对f进行划分。CTU的左上角的a、b、c、d分别是一个CU,且仅有c的标志位表示可以划分,则对c进一步划分为4个TU,此次划分深度为1,不超过最大划分深度3,但假设此次划分得到的TU尺寸为4
×
4,达到最小TU尺寸,因此不允许继续划分。CTU的右上角e是一个CU,假设该CU的标志位表示可以划分,则按照最大划分深度和TU支持的尺寸,对e可以划分两层,得到16个4
×
4的TU。CTU的右下角的g、l、m、h、i、j、k分别是一个CU,且仅有m的本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种视频编码方法,包括:获取对待编码视频帧进行视频帧预测,得到的待编码残差帧,所述待编码残差帧表示所述待编码视频帧与视频帧预测结果之间的误差;获取所述待编码视频帧的最大划分深度;其中,所述最大划分深度用于表示最多允许划分的变换单元层级数,所述最大划分深度为所述待编码视频帧的复杂度等级对应的划分深度;所述复杂度等级基于相同对象在所述待编码视频帧与参考帧之间的位置偏移量确定;复杂度最高等级对应的划分深度大于或等于复杂度最低等级对应的划分深度;基于所述最大划分深度,将所述待编码残差帧划分为多个变换单元,并对每个变换单元进行变换处理。2.根据权利要求1所述的方法,在所述获取对待编码视频帧进行视频帧预测,得到的待编码残差帧之前,所述方法还包括:获取待编码视频帧;根据各对象在所述待编码视频帧中与在所述参考帧中的位置偏移量,确定所述待编码视频帧的复杂度等级;根据各复杂度等级与划分深度之间的预设对应关系,确定所述待编码视频帧的复杂度等级对应的最大划分深度。3.根据权利要求2所述的方法,其中,所述根据各对象在所述待编码视频帧中与在所述参考帧中的位置偏移量,确定所述待编码视频帧的复杂度等级,包括:将所述待编码视频帧划分为多个目标编码块;其中,各目标编码块的并集为所述待编码视频帧,且各目标编码块之间没有交集;确定每个目标编码块的运动向量,所述运动向量为目标编码块包括的各对象在所述待编码视频帧中与在所述参考帧中的位置偏移向量;根据各目标编码块的运动向量,确定所述待编码视频帧的复杂度等级。4.根据权利要求3所述的方法,其中,所述根据各目标编码块的运动向量,确定所述待编码视频帧的复杂度等级,包括:确定各目标编码块的运动向量的绝对值的方差;若所述方差小于第一预设门限值,则确定所述待编码视频帧的复杂度等级为最低等级;若所述方差大于或等于所述第一预设门限值,且小于或等于第二预设门限值,则确定所述待编码视频帧的复杂度等级为中间等级;其中,所述第二预设门限值大于所述第一预设门限值;若所述方差大于所述第二预设门限值,则确定所述待编码视频帧的复杂度等级为最高等级。5.根据权利要求3所述的方法,其中,所述将所述待编码视频帧划分为多个目标编码块,包括:对所述待编码视频帧进行下采样,得到下采样帧;将所述下采样帧划分为多个目标编码块。6.根据权利要求4所述的方法,在所述根据各对象在所述待编码视频帧中与在所述参考帧中的位置偏移量,确定所述待编码视频帧的复杂度等级之前,所述方法还包括:
获取测试视频的测试视频帧;分别将每个测试视频帧划分为多个测试编码块;其中,各测试编码块的并集为所述测试视频帧,且各测试编码块之间没有交集;分别确定每个测试视频帧包括的各测试编码块的运动向量,并确定所述各测试编码块的运动向量的绝对值的方差;按照预设比例,将所述测试视频的各测试视频帧对应的方差,划分为最小方差集合、中间方差集合和最大方差集合;所述中间方差集合的最大值小于所述最大方差集合的最小值,所述中间方差集合的最小值大于所述最小方差集合的最大值;根据所述中间方差集合的最大值,确定所述第二预设门限值,并根据所述中间方差集合的最小值,确定所述第一预设门限值。7.根据权利要求6所述的方法,其中,所述测试视频存在多个;所述根据所述中间方差集合的最大值,确定所述第二预设门限值,包括:获取针对每个测试视频得到的中间方差集合的最大值;将获取的各最大值的平均值,作为所述第二预设门限值;所述根据所述中间方差集合的最小值,确定所述第一预设门限值,包括:获取针对每个测试视频得到的中间方差集合的最小值;将获取的各最小值的平均值,作为所述第一预设门限值。8.根据权利要求2

7任一项所述的方法,其中,所述根据各复杂度等级与划分深度之间的预设对应关系,确定所述待编码视频帧的复杂度等级对应的最大划分深度,包括:根据各复杂度等级、预测类型与最大划分深度三者之间的预设对应关系,确定所述待编码视频帧的复杂度等级和预测类型对应的最大划分深度。9.一种视频编码装置,包括:获取模块,用于获取对待编码视频帧进行视频帧预测,得到的待编码残差帧,所述待编码残差帧表示所述待编码视频帧与视频帧预测结果之间的误差;所述获取模块,还用于获取所述待编码视频帧的最大划分深度;其中,所述最大划分深度用于表示最多允许...

【专利技术属性】
技术研发人员:邹箭
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1