HEVC中基于数学统计和分类训练的帧内预测方法及装置制造方法及图纸

技术编号:9697350 阅读:147 留言:0更新日期:2014-02-21 06:23
本申请公开了一种HEVC中基于数学统计和分类训练的帧内预测方法和帧内预测装置,该方法包括以下步骤:步骤1,设置编码参数。步骤2,获取训练样本数据。步骤3,DC模式的PU块的分类。步骤4,使用原始帧中获得参考像素样本组和原始像素样本组作为训练样本。步骤5,进行样本训练。通过采用根据本发明专利技术的实施例的方法和装置,与现有技术相比,更加注重于图像纹理的变化分布,提高了DC和PLANAR模式的预测精度,在图像背景细节位置有更好的主观效果,同时增加了DC和PLANAR预测模式的比例。

【技术实现步骤摘要】
HEVC中基于数学统计和分类训练的帧内预测方法及装置
本专利技术涉及高性能视频编码(HEVC, High Efficiency Video Coding)领域,更具体地,涉及高性能视频编码中基于数学统计和分类训练的帧内预测方法及装置。
技术介绍
由于H.264/MPEG-4AVC是在03年发布的,已经过9年,那么随着网络技术和终端处理能力的不断提高,人们对目前广泛使用的MPEG-2、MPEG-4、H.264等,提出了新的要求。希望能够提供:1)高清,2) 3D,3)移动无线,以满足新的家庭影院、远程监控、数字广播、移动流媒体、便携摄像、医学成像等新领域的应用。另外,H.264/AVC发布后,经过几年的积累(新型运动补偿、变换、插值和熵编码等技术的发展),具备了推出新一代视频编码标准的技术基础。2010年4月在德国德累斯顿召开了 JCT-VT第一次会议,确定新一代视频编码标准名称:HEVC (High Efficiency Video Coding),并且建立了测试模型。HEVC 是由 ITU-TVCEG和IS0/IEC MPEG标准组织联合成立的视频项目。第一版的HEVC标准已于2013年I月出版。目前,工作组正在计划额外的工作对现有的HEVC标准进行扩展,包括专业用途、更高的精确度和颜色格式的支持,可扩展编码、3D/立体/多视点编码等。HEVC已被设计用来解决本质上的H.264/MPEG-4AVC的所有现有应用需求,接下来的工作重点特别集中在两个关键问题:提高视频的分辨率和增加使用的并行处理架构。HEVC的设计就是为了处理所有H.264/MPEG-4AVC所产生的应用需求。HEVC主要关注两个关键议题:提升视频分辨率和推行并行处理架构。HEVC的语法具有通用性,使得它可以适用各种应用。HEVC只有比特流结构和语法是标准化的,以及对比特流的限制和比特流与所解码产生的图像的映射关系。这个映射是通过语法的语义和解码过程的定义实现的,使得只要是符合标准要求的解码器,在给定的符合标准约束的比特流条件下解码结果都是一样的。这种标准范围的限制允许最大的程度的自由以最优化实现方式使得适用于特定的应用(平衡压缩质量、实施成本等)。新一代视频压缩标准的核心目标是在H.264/AVChigh profile的基础上,压缩效率提高一倍。即在保证相同视频图像质量的前提下,视频流的码率减少50%。在提高压缩效率的同时,可以允许编码端适当提高复杂度。帧内预测对于I帧和P/B帧来说是一个重要的编码工具,但在P/B帧中使用得较少。本专利技术所提方法针对于HEVC中I帧帧内预测的改进。I帧是一种独立的帧,且是每一个GOP的第一帧。它是用来作为新的关注点或重新同步点的起点,并可以用来实现快进、倒带等的随机接入的能力,也不会产生明显的模糊,并能增强视频的视觉质量。随着硬件的快速发展,I帧有利于多核心多线程的并行处理。I帧是视频编码中十分重要的一种帧。I帧是视频编码中的关键帧,而帧内预测对I帧的编码又十分重要,预测直接影响了量化、变换和熵编码的性能。HEVC仍旧采用传统的混合编码结构,取得很大编码增益主要归结于HEVC采用了很多新颖的技术。其中帧内部分是基于空间域的帧内预测,HEVC将预测角度扩展为180°范围内的33方向,且采用灵活的块划分,将基本单元块分为CU(编码单兀,coding unit)、TU (变换单兀,transform units)和 PU (预测单兀,prediction unit),块的大小范围扩展为64X64至4X4。然而,HEVC中现有的DC预测模式利用求参考像素平均值的方法,并不能对所有的块有很好的预测效果。此外,PLANAR预测模式利用梯度插值的方法也有些粗糙,影响了预测性能。因此,对于这两种平均使用概率最高的预测模式(DC预测模式和PLANAR预测模式),仍存在改进的空间。
技术实现思路
本申请的专利技术人考虑到现有技术的上述情况而作出了本专利技术。本专利技术的方法专注于HEVC I帧帧内部分预测方法的改进。本专利技术提出了基于数学统计和分类训练的帧内预测方法,用以训练和改进HEVC编码中的上述两种预测模式DC和PLANAR的预测加权系数。本专利技术提高了 DC和PLANAR两种模式的使用比率,在相同PSNR的情况下减小了码率,对视频图像的主观质量有一定的改进。本专利技术要解决的技术问题:HEVC中DC和PLANAR模式现有的预测方法比较简单,因此相对于角度预测模式,这两种模式都导致预测结果存在较大的预测误差,尤其在PU块的右下角位置。根据本专利技术的实施例,提供了一种用于高性能视频编码的帧内预测方法,包括以下步骤:步骤1,输入视频序列数据,其中,所述视频序列数据由视频帧的各像素的亮度值组成,所述视频帧被划分为多个编码单元块,编码单元块被进一步为划分预测单元块,其中,每个预测单元块的在该视频帧内的多个相邻像素作为该预测单元块的参考像素;步骤2,利用高性能视频编码的多种标准帧内预测模式,分别对所述视频帧的各个预测单元块进行帧内预测,并且,对于各个预测单元块,分别确定所述多种预测模式中率失真代价最小的一个预测模式作为最佳预测模式;步骤3,计算最佳预测模式为多种标准帧内预测模式中的第一预测模式的各个预测单元块的参考像素的方差值,将计算出的各个预测单元块的所述方差值与预定的方差阈值相比较,并且,根据比较结果,将所述最佳预测模式为第一预测模式的预测单元块分成多组预 测单元块;步骤4,对于所述多组预测单元块中的每组预测单元块,使用最小二乘法,对方程求解,求出该组预测单元块中的每个预测单元块中的每个像素位置的加权预测系数矩阵家。,,其大小为nXl,其中,玉为该组预测单元块的所有参考像素的亮度值组成的mX η矩阵,其中η为每个预测单元块的参考像素的数目,m为该组预测单元块中的预测单元块数目,^(/,./)为每个预测单元块内的各个像素的亮度值所组成的目标像素点矩阵,其大小为mXl,1、j分别表示该像素在预测单元块内的垂直和水平方向上的坐标。根据本专利技术的实施例,所述帧内预测方法还包括以下步骤:步骤5,继续输入视频序列数据,并对新输入的视频序列数据进行步骤2和3中的操作,得到多组预测单元块;步骤6,利用所述加权预测系数矩阵f ,,对多组预测单元块中的每组预测单元块中的每个预测单元块的参考像素的亮度值进行加权相加,加权相加的结果作为所述每个预测单元块内的相应位置(i,j)的像素的预测亮度值。根据本专利技术的实施例,提供了一种用于进行如权利要求2至10中的一个所述的帧内预测方法的帧内预测装置,包括HEVC编码单元模块、HEVC预测单元模块和样本训练模块,其中,所述HEVC编码单元模块对视频帧的最大编码单元进行四叉树划分,将最大编码单元划分成多个编码单元块,所述HEVC编码单元模块对编码单元块继续进行四叉树划分,将每个编码单元块在当前划分层中划分成一个预测单元块,在下一划分层中划分成多个预测单元块,所述HEVC预测单元模块在预测单元块内通过帧内预测、量化、变换、伪熵编码操作,得到当前预测单元块的当前预测模式下的码率和率失真代价,比较当前划分层和下一划分层的码率和率失真代价,根据比较结果判断采用当前划分层还是下一划分层的预测单元块划分,所述样本训练模块包括本文档来自技高网
...

【技术保护点】
一种高性能视频编码中基于数学统计和分类训练的帧内预测方法,包括以下步骤:步骤1,输入视频序列数据,其中,所述视频序列数据由视频帧的各像素的亮度值组成,所述视频帧被划分为多个编码单元块,编码单元块被进一步为划分预测单元块,其中,每个预测单元块的在该视频帧内的多个相邻像素作为该预测单元块的参考像素;步骤2,利用高性能视频编码的多种标准帧内预测模式,分别对所述视频帧的各个预测单元块进行帧内预测,并且,对于各个预测单元块,分别确定所述多种预测模式中率失真代价最小的一个预测模式作为最佳预测模式;步骤3,计算最佳预测模式为多种标准帧内预测模式中的第一预测模式的各个预测单元块的参考像素的方差值,将计算出的各个预测单元块的所述方差值与预定的方差阈值相比较,并且,根据比较结果,将所述最佳预测模式为第一预测模式的预测单元块分成多组预测单元块;步骤4,对于所述多组预测单元块中的每组预测单元块,使用最小二乘法,对方程求解,求出该组预测单元块中的每个预测单元块中的每个像素位置的加权预测系数矩阵其大小为n×1,其中,为该组预测单元块的所有参考像素的亮度值组成的m×n矩阵,其中n为每个预测单元块的参考像素的数目,m为该组预测单元块中的预测单元块数目,为每个预测单元块内的各个像素的亮度值所组成的目标像素点矩阵,其大小为m×1,i、j分别表示该像素在预测单元块内的垂直和水平方向上的坐标。FDA0000417017810000011.jpg,FDA0000417017810000012.jpg,FDA0000417017810000013.jpg,FDA0000417017810000014.jpg...

【技术特征摘要】
1.一种高性能视频编码中基于数学统计和分类训练的帧内预测方法,包括以下步骤: 步骤I,输入视频序列数据,其中,所述视频序列数据由视频帧的各像素的亮度值组成,所述视频帧被划分为多个编码单元块,编码单元块被进一步为划分预测单元块,其中,每个预测单元块的在该视频帧内的多个相邻像素作为该预测单元块的参考像素; 步骤2,利用高性能视频编码的多种标准帧内预测模式,分别对所述视频帧的各个预测单元块进行帧内预测,并且,对于各个预测单元块,分别确定所述多种预测模式中率失真代价最小的一个预测模式作为最佳预测模式; 步骤3,计算最佳预测模式为多种标准帧内预测模式中的第一预测模式的各个预测单元块的参考像素的方差值,将计算出的各个预测单元块的所述方差值与预定的方差阈值相比较,并且,根据比较结果,将所述最佳预测模式为第一预测模式的预测单元块分成多组预测单元块; 步骤4,对于所述多组预测单元块中的每组预测单元块,使用最小二乘法,对方程云求解,求出该组预测单元块中的每个预测单元块中的每个像素位置的加权预测系数矩阵,其大小为nXl,其中,互为该组预测单元块的所有参考像素的亮度值组成的mXn矩阵,其中η为每个预测单元块的参考像素的数目,m为该组预测单元块中的预测单元块数目,S (/,./)为每个预测单元块内的各个像素的亮度值所组成的目标像素点矩阵,其大小为mX 1,1、j分别表示该像素在预测单元块内的垂直和水平方向上的坐标。2.根据权利要求1所述的帧内预测方法,还包括以下步骤: 步骤5,继续输入视频序列数据,并对新输入的视频序列数据进行步骤2和3中的操作,得到多组预测单元块; 步骤6,利用所述加权预测系数矩阵Wu,对多组预测单元块中的每组预测单元块中的每个预测单元块的参考像素的亮度值进行加权相加,加权相加的结果作为所述每个预测单元块内的相应位置(i,j)的像素的预测亮度值。3.根据权利要求1或2所述的帧内预测方法,其中,所述步骤3还包括: 步骤3-1,计算最佳预测模式为多种标准帧内预测模式中的第二预测模式的各个预测单元块的参考像素的在水平方向和垂直方向上的梯度值,将计算出的各个预测单元块的所述梯度值与预定的梯度阈值相比较,并且,根据比较结果,将所述最佳预测模式为第二预测模式的预测单元块分成多组预测单元块。4.根据权利要求1所述的帧内预测方法,其中,所述多种预测模式包括33种角度预测模式、DC预测模式、以及PLANAR预测模式。5.根据权利要求4所述的帧内预测方法,其中,所述第一预测模式是DC预测模式。...

【专利技术属性】
技术研发人员:魏芳黄慧明
申请(专利权)人:北京邮电大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利