一种编码单元划分的快速决策方法技术

技术编号:34348083 阅读:26 留言:0更新日期:2022-07-31 05:11
本发明专利技术属于视频编码处理技术领域,公开了一种编码单元划分的快速决策方法,包括以下步骤:当前编码单元(CU)开始遍历所有模式前,先对其尺寸进行辨别;如果其宽度和高度相等,则获取当前编码单元(CU)的局部二值模式(LBP)特征;如果局部二值模式(LBP)特征值小于阈值TH1,则当前编码单元(CU)纹理特性简单,跳过多类型树的划分;如果局部二值模式(LBP)特征值大于或等于阈值TH1,则当前编码单元(CU)纹理特性复杂,进一步获取当前编码单元(CU)各子块像素方差的方差,选取最大的方差相对应的划分方式作为其最优的划分方式。本发明专利技术能够降低编码过程的复杂度及对应所耗费的编码时间。码过程的复杂度及对应所耗费的编码时间。码过程的复杂度及对应所耗费的编码时间。

A fast decision method for coding unit division

【技术实现步骤摘要】
一种编码单元划分的快速决策方法


[0001]本专利技术属于视频编码处理
,尤其涉及一种编码单元划分的快速决策方法。

技术介绍

[0002]随着视频市场的发展,超高清视频和虚拟现实视频因为可以提供更逼真的感知质量变得越来越受欢迎。相对应地,UHD和VR视频由于其高分辨率和亮度的动态范围广泛,导致数据量急剧增加,HEVC(High Efficiency Video Coding)视频编码标准已不足以满足未来市场所需的压缩能力。联合视频探索小组(Joint Video Exploration Team,JVET)正在开发下一代标准VVC(Versatile Video Coding)。为了进一步提高帧内预测的编码性能,在VVC中提出了多种新颖的编码技术,例如于非正方形块的广角帧内预测、多参考线帧内预测和帧内子分区。相较于HEVC这些技术的引入都显著地增强了编码器的性能,但与此同时编码器的复杂度也急剧增加。帧内模式下,VVC的编码复杂度平均是HEVC的18倍,所以研究视频帧内模式下的快速编码算法是很有必要的。
[0003]HEVC中,编码单元的划分采用四叉树结构,编码单元(Coding Unit,CU)大小的决策占据了大部分的编码时间,而VVC中编码单元划分采用四叉树加多类型树(Quad Tree plus Multi

type Tree,QTMT)结构,不仅可以将CU划分为正方形,而且可以将其划分为矩形,这使VVC的CU能够适应视频内容的更多纹理模式,同时计算量也更大。在视频编码标准中,通过蛮力率失真优化(Rate Distortion Optimization,RDO)先检查所有可能的CU的RD成本,然后选择具有最小RD成本的CU的组合作为CTU划分结果。如果能快速确定CTU的划分结果,避免蛮力搜索全过程,将会大幅缩短编码器的编码时间,从而降低编码器复杂度。另一方面,设计快速的CTU划分决策算法具有挑战性,如果只专注于时间的缩短,划分算法不够精确导致做出错误的决策过多,将会导致编码性能下降。因此视频帧内编码下的快速CTU划分决策算法还需进一步探索,以实现编码时间和编码性能间的平衡。
[0004]通过对国内外文献的研究,帧内编码的快速CTU划分决策算法主要分为启发式方法和数据驱动方法两大类。启发式方法是在编码过程中提取中间特征,例如:纹理同质性、空间相关性,建立统计模型,通过这些模型尽早确定CTU的划分决策,提前终止RDO搜索过程,以跳过CTU划分过程中不必要的搜索来缩短编码器的编码时间;在数据驱动的方法中,把帧内模式下的CU大小决策问题视为一个多分类问题,使用深度学习模型从足够多的数据中自动学习CTU的划分方式,避免了启发式方法中严重依赖于手工提取特征的缺点,但由于复杂的网络计算,也给编码器增加了计算负担。

技术实现思路

[0005]本专利技术实施例的目的在于提供一种编码单元划分的快速决策方法,能够降低编码过程的复杂度及对应所耗费的编码时间。
[0006]本专利技术实施例是这样实现的:
[0007]一种编码单元划分的快速决策方法,包括以下步骤:
[0008]当前编码单元(CU)开始遍历所有模式前,先对其尺寸进行辨别;
[0009]如果其宽度和高度不相等,则进行原始的率失真优化遍历方法选取最优的划分模式;
[0010]如果其宽度和高度相等,则获取当前编码单元(CU)的局部二值模式(LBP)特征;
[0011]如果局部二值模式(LBP)特征值小于阈值TH1,则当前编码单元(CU)纹理特性简单,跳过多类型树的划分;
[0012]如果局部二值模式(LBP)特征值大于或等于阈值TH1,则当前编码单元(CU)纹理特性复杂,进一步获取当前编码单元(CU)各子块像素方差的方差,选取最大的方差相对应的划分方式作为其最优的划分方式;其中,阈值TH1为预设值,所述划分方式为水平二叉树划分方式、水平三叉树划分方式、竖直二叉树划分方式或竖直三叉树划分方式;
[0013]具体的,依据局部二值模式(LBP)特征值中1的个数来判断当前编码单元(CU)的复杂纹理是水平方向还是竖直方向,如果是水平方向,则选择水平二叉树划分方式或者水平三叉树划分方式,如果是竖直方向,则选择竖直二叉树划分方式或者竖直三叉树划分方式。
[0014]本专利技术在VVC中,图片是以块为单位编码的。在对图像进行编码时,对于均匀区域中的CU块,倾向于选择较大的CU块,对于质地丰富的CU块,倾向于选择较小的CU块。对于纹理简单或一致的纹理,通过一种帧内预测模式可以准确预测纹理中的像素值。本专利技术将原始视频编码器中通过自上而下计算RD成本和自下而上搜索比较确定最优CTU划分的过程变成了只有自上而下的过程,对于启发式算法,经过对编码单元纹理复杂度的计算来决定是否进行下一步划分,如果不划分就可以提前终止CTU的划分过程,如果划分,进一步决定使用哪一种划分模式;对于数据驱动算法,在正式编码之前先预测CU划分的概率,若大于阈值则进行划分,若小于该阈值则不划分,提前终止CTU划分过程,从而降低编码过程的复杂度及对应所耗费的编码时间。将CTU整体划分过程看成多层分类问题来解决,每个深度上划分模式的选择是一个分类问题。
附图说明
[0015]图1是VVC中CTU划分示例图;
[0016]图2是本专利技术的编码单元划分方式决策模型流程图;
[0017]图3是本专利技术采用的多类型树划分方式示意图。
具体实施方式
[0018]为了使本专利技术的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本专利技术进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本专利技术,并不用于限定本专利技术。
[0019]与上一代编码技术H.265/HEVC相比,H.266/VVC编码框架仍由块划分、预测、变换量化、环路滤波、嫡编码等多个模块组成,但在每个模块中都添加了提高视频编码效果的关键技术,具体如下:
[0020]1、块划分
[0021]对于编码单元的划分问题,在HEVC标准中,CTU在其每个CU深度上要么选择不分
割,要么通过四叉树拆分成更小的方形CU,编码单元具有64
×
64,32
×
32,16
×
16,8
×
8四种不同大小,分别对应深度值0,1,2,3。而在VVC标准中,CTU采用的划分结构为QTMT结构。CTU首先可以选择不分割或用四叉树分割成更小的CU,然后在其每个CU深度上可以用四叉树或多类型树进一步分割成更小的CU,其中多类型树包括二叉树和三叉树,且每种树结构具有水平和竖直两种模式。一旦CU选择使用多类型树进行分割,后续将不能再使用四叉树进行划分。对于某阶段,最多可以有六种划分模式供选择(即非分裂,四叉树,水平二叉树,竖直二叉树,水平三叉树和竖直三叉树),直到满足CU的最小宽度或高度为4。默认CTU的大小为128
×
128,最小的CU为4
×
4,这本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种编码单元划分的快速决策方法,其特征在于,包括以下步骤:当前编码单元(CU)开始遍历所有模式前,先对其尺寸进行辨别;如果其宽度和高度不相等,则进行原始的率失真优化遍历方法选取最优的划分模式;如果其宽度和高度相等,则获取当前编码单元(CU)的局部二值模式(LBP)特征;如果局部二值模式(LBP)特征值小于阈值TH1,则当前编码单元(CU)纹理特性简单,跳过多类型树的划分;如果局部二值模式(LBP)特征值大于或等于阈值TH1,则当前编码单元(CU)纹理特性复杂,进一...

【专利技术属性】
技术研发人员:杨威杨金锋景晓军袁航江巧捷邓达豪
申请(专利权)人:广东南方电信规划咨询设计院有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1