帧内色度预测模式快速选择制造技术

技术编号:26226895 阅读:34 留言:0更新日期:2020-11-04 11:05
本发明专利技术提出了用于对视频编码比特流中的色度分量进行帧内预测模式选择的方法,包括:确定当前CU的纹理复杂度值;基于纹理复杂度值,从包含多种帧内色度预测候选模式的帧内色度预测候选模式集合中确定一子集;针对所确定的子集中的各个帧内色度预测候选模式计算率失真代价(RD‑cost);以及根据所计算的RD‑cost来选择最佳帧内色度预测模式以用于色度分量的帧内预测。

【技术实现步骤摘要】
帧内色度预测模式快速选择
本专利技术涉及图像与视频处理领域,更具体而言,涉及色度分量的帧内预测模式快速选择。本专利技术提出了在多功能视频编码(VVC)中,基于CU纹理复杂度进行对帧内色度预测模式进行快速选择的方法、编解码器和设备。
技术介绍
2010年4月,两大国际视频编码标准组织VCEG和MPEG成立视频压缩联合小组JCT-VC(JointcollaborativeTeamonVideoCoding),一同开发高效视频编码HEVC(Highefficiencyvideocoding)标准,其也称为H.265。HEVC标准的第一版已经在2013年的一月份完成。并于2013年4月、2014年10月和2015年4月相继发布的3个版本,这些版本能够很容易地从网络上获得,并且本申请将上述HEVC标准的三个版本并入本说明书中作为本专利技术的
技术介绍
。HEVC提出了全新的语法单元:编码单元(CU)是进行预测、变换、量化和熵编码的基本单元,预测单元(PU)是进行帧内帧间预测的基本单元,变换单元(TU)是进行变换和量化的基本单元。另外,每个CU定义了共享相同预测模式(帧内或帧间)的区域。如图1所示,在HEVC中,可以进行帧内预测模式和帧间预测模式的切换。在帧内预测模式和帧间预测模式中,HEVC都采用编码树单元(CTU)的编码结构,CTU是HEVC编解码的基本处理单元。CTU由1个亮度CTB、2个色度CTB和相应的语法元素组成。图2显示了在一个LCU(最大编码单元)编码后的CTU结构。在HEVC中,LCU可以只包含一个编码单元(CU),也可以使用CTU四叉树结构划分出为不同大小的CU。HEVC中有四种大小CU,大小分别为:64x64、32x32、16x16和8x8。CU块越小,其在CTU树中位置越深。当CU为64x64、32x32和16x16时称为2Nx2N模式(表示可以划分为更小的CU),当CU为8x8时称为NxN模式(表示不可以进行进一步划分)。对于帧内预测,CU被分成两个PartMode(2Nx2N和NxN),这取决于它是否可以被分成更小的CU。尺寸为64x64、32x32和16x16的CU属于2N×2N,尺寸为8×8的CU属于N×N。在HEVC中,PU进行帧内帧间预测的基本单元,PU的划分是以CU为基础的,具有五种规则大小64x64、32x32、16x16、8x8和4x4。更具体地,PU尺寸基于PartMode:对于2N×2N的PartModePU尺寸与CU相同,对于N×N的PartModeCU可以被划分为四个4×4子PU。对于2N*2N的CU模式,帧内预测PU的可选模式包括2N*2N和N*N,帧间预测PU的可选模式有8种,包括4种对称模式(2N*2N,N*2N,2N*N,N*N)和4种非对称模式(2N*nU,2N*nD,nL*2N,nR*2N),其中,2N*nU和2N*nD分别以上下1:3、3:1的比例划分,nL*2N和nR*2N分别以左右1:3、3:1的比例划分。在HEVC中,仍然继续使用H.264/AVC的拉格朗日率失真优化(RDO)进行模式选择,为每一个帧内模式计算其RDO:J=D+λR其中,J为拉格朗日代价(亦即RD-cost),D表示当前帧内模式的失真,R表示编码当前预测模式下所有信息所需的比特数,λ为拉格朗日因子。其中D通常使用绝对哈达玛变换差之和(SATD)来实现。处理一帧视频图像需要首先将其划分成多个LCU(64x64),然后依次编码每个LCU。每个LCU依次递归划分,其通过计算当前深度的RD-cost判定是否继续划分。一个LCU最小可划分至8x8大小的单元,如图2所示。编码器通过比较深度的RD-cost值判定是否继续划分,如果当前深度内的4个子CU的编码代价总和大于当前CU,则不继续划分;反之则继续划分,直至划分结束。本领域技术人员容易理解,由于CTU是对LCU进行CU划分的树状编码结构,CTU中的CU划分方式是以LCU开始的,因此在本领域中这两个名词经常可交换地使用。在帧内预测中,每个PU使用总共35种预测模式。使用粗略模式决策(RMD),我们可以获得64x64、32x32和16x16块的三种候选模式以及8x8和4x4块的八种候选模式。通过合并来自相邻块的最可能模式(MPM)来获得每个PU大小的最佳候选列表。然后,通过RDO来选择当前PU的最佳帧内预测模式。当完成当前CU中包括的所有PU的帧内预测时,完成当前CU的帧内预测。通过当前CU的RD-cost与当前CU及其4个子CU的四个子CU的总RD-cost之间的比较来选择具有较小RD-cost的次优CU内部预测完成。当完成所有CU分区时,完成当前CTU帧内预测。对于HEVC,当对LCU进行编码时,应当执行85个CU(一个64×64CU,四个32×32CU,十六个16×16CU和六十四个8×8CU)的帧内预测。当CU被编码时,应当执行一个PU或四个子PU的帧内预测。大量CU和PU导致帧内预测的高复杂性。在HEVC的基础上,多功能视频编码(VersatileVideoCoding)VVC(H.266)的研究由JVET组织于2018年4月10美国圣地亚哥会议上提出的,在H.265/HEVC基础上改进的新一代视频编码技术,其主要目标是改进现有HEVC,提供更高的压缩性能,同时会针对新兴应用(360°全景视频和HDR)进行优化。VCC的相关文件和测试平台可以从https://jvet.hhi.fraunhofer.de/获得,并且H.266的提案可以从http://phenix.it-sudparis.eu/jvet/获得。VVC依然沿用H.264就开始采用的混合编码框架,其VTM8编码器的一般性方框图如图1所示。帧间和帧内预测编码:消除时间域和空间域的相关性。变换编码:对残差进行变换编码以消除空间相关性。熵编码:消除统计上的冗余度。VVC将在混合编码框架内,着力研究新的编码工具或技术,提高视频压缩效率。J.Chen,Y.Ye,S.Kim.“AlgorithmdescriptionforVersatileVideoCodingandTestModel8(VTM8),”DocumentJVET-Q2002,Brussels,Belgium,Jan2020中详细论述了VVC中所采用的若干新技术(如上所述,其可以从http://phenix.it-sudparis.eu/jvet/获得)。在本文中,将其全部内容并入本文作为本文公开内容的一部分,特别是其第3.3节中论述了针对帧内编码的新技术。虽然VVC和HEVC中都采用树结构来进行CTU划分,但是在VVC采用了与HEVC不同的树结构CTU划分方式。如上所述地,在HEVC中,使用四叉树结构将CTU划分为CU(即编码树)。关于帧内编码和帧间编码的决策是在叶节点CU处做出的。然后,根据PU划分类型,每个叶CU可以进一步划分为1、2或4个预测单元PU。在每个PU内,使用相同的预测过程,并将相关信息以PU为基础发送到解码器段。在基于PU的预测过程本文档来自技高网...

【技术保护点】
1.一种用于对视频编码比特流中的色度分量进行帧内预测模式选择的方法,其特征在于,包括:/n确定当前CU的纹理复杂度值;/n基于所述纹理复杂度值,从包含多种帧内色度预测候选模式的帧内色度预测候选模式集合中确定一子集;/n针对所确定的子集中的各个帧内色度预测候选模式计算率失真代价(RD-cost);以及/n根据所计算的RD-cost来选择最佳帧内色度预测模式以用于所述色度分量的帧内预测。/n

【技术特征摘要】
1.一种用于对视频编码比特流中的色度分量进行帧内预测模式选择的方法,其特征在于,包括:
确定当前CU的纹理复杂度值;
基于所述纹理复杂度值,从包含多种帧内色度预测候选模式的帧内色度预测候选模式集合中确定一子集;
针对所确定的子集中的各个帧内色度预测候选模式计算率失真代价(RD-cost);以及
根据所计算的RD-cost来选择最佳帧内色度预测模式以用于所述色度分量的帧内预测。


2.如权利要求1所述的方法,其特征在于,其中,基于所述纹理复杂度值,从包含多种帧内色度预测候选模式的帧内色度预测候选模式集合中确定一子集进一步包括:
当所述纹理复杂度值大于第一阈值时,确定所述帧内色度预测候选模式集合中的第一子集作为所述子集;或者
当所述纹理复杂度值小于第二阈值时,确定所述帧内色度预测候选模式集合中的第二子集作为所述子集,所述第二子集不同于所述第一子集;或者
当所述纹理复杂度大于等于所述第二阈值并小于等于所述第一阈值时,将所述子集确定为是所述帧内色度预测候选模式集合本身。


3.如权利要求1或2所述的方法,其特征在于,其中,所述帧内色度预测候选模式集合包括8种帧内色度预测候选模式:DM模式、LM模式、LM-L模式、LM-A模式、DC模式、平面模式、垂直模式和水平模式。


4.如权利要求1或2所述的方法,其特征在于,其中,基于所述纹理复杂度值,从包含多种帧内色度预测候选模式的帧内色度预测候选模式集合中确定一子集进一步包括:
当所述纹理复杂度值大于所述第一阈值时,所述子集包括DM模式、水平模式和垂直模式;或者
当所述纹理复杂度值小于所述第二阈值时,所述子集包括DM模式、LM模式、LM-L模式、LM-A模式、DC模式以及平面模式;或者
当所述纹理复杂度大于等于所述第二阈值并小于等于所述第一阈值时,所述子集包括DM模式、LM模式、LM-L模式、LM-A模式、DC模式、平面模式、垂直模式和水平模式。


5.一种用于...

【专利技术属性】
技术研发人员:张萌萌刘志岳文
申请(专利权)人:北京工业职业技术学院
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1