一种改进的H264帧内预测模式选择算法制造技术

技术编号:22849424 阅读:17 留言:0更新日期:2019-12-17 23:24
一种改进的H.264帧内预测模式选择算法,属于图像处理领域,其特征在于采用一种改进的帧内预测模式快速选择算法。通过研究频域高频分量特征,使用训练的阈值实现对intra 4×4和intra 16×16模型的快速分离。同时,针对intra 4×4预测模式过多的问题,利用改进的Kirsh算子表征出图像的纹理方向,缩减了4×4预测模式。实验结果表明,改进的帧内预测模式快速选择算法在编码时间方面缩减了67.81%,同时PSNR与码率基本不变。解决了内预测模式选择过程中编码时间过长的问题。

An improved H264 intra prediction mode selection algorithm

【技术实现步骤摘要】
一种改进的H264帧内预测模式选择算法
本专利技术应用背景为图像处理领域。
技术实现思路
涉及对图像处理过程中对图像的帧内预测模式快速选择算法进行改进,其目的在于解决帧内预测模式选择过程中编码时间过长的问题,降低编码时间,适应各种内容复杂程度不同的视频序列。
技术介绍
在图像处理领域中,由于H.264帧内预测模式选择过程中存在较长编码时间,需要通过优化来降低编码时间,来适应各种内容复杂程度不同的视频序列。目前,现有的帧内模式选择算法有基于RDO的模式选择和基于SATD的模式选择。前者在对图像的处理过程中要对图像进行重构,经变换、量化、逆量化、逆变换和重建一系列操作,工作量大,同时他只适用于高细节度的图像序列,在一些硬件平台较低和图像细节度较高的场景中不宜使用。后者虽然运算复杂度降低了,但是在预测精度上却明显降低了。随着图像处理技术的发展,除了上述传统方法方法外,业界开始通过改进Kirsch算子来解决该问题。帧内预测快速选择算法通过高频系数特征来提取当前宏块的内部特征,从而判断出当前宏块是适用intra4×4还是intra16×16,解决了全搜索算法需同时对两种模型预测而造成冗余运算的缺陷,并在intra4×4模型中利用Kirsh算子通过边缘检测很好的表征出了图像的纹理方向,解决了intra4×4预测模式较多的问题。其中针对Kirsh算子仍存在运算量过大的问题,通过剔除不相关的4个方向和循环矩阵变换的方法,使得加法运算量相比较原算法消减了3/14,乘法运算量消减了1/8。
技术实现思路
为解决帧内预测模式选择过程中编码时间过长的问题,提出了一种改进的帧内预测模式快速选择算法。通过研究频域高频分量特征,使用训练的阈值实现对intra4×4和intra16×16模型的快速分离。同时,针对intra4×4预测模式过多的问题,利用改进的Kirsh算子表征出图像的纹理方向,缩减了4×4预测模式。为实现上述目的,本专利技术采用以下技术案:一种改进的H.264帧内预测模式选择算法,包括图像的全局搜索模块和intra4*4预测模式选择两个部分。全局搜索模块包括高频系数的计算,intra4*4预测模式则包括水平和垂直的平均梯度方向的计算以及根据计算出的梯度来选择合适的预测模式。图像的全局搜索模块利用变换域的中高频系数特征来提取当前宏块的内部特征,从而判断出当前宏块是适用intra4×4还是intra16×16。水平和垂直的平均梯度方向的计算,利用改进的Kirsh算子4个方向模板求解方向偏导数。根据前一步求解的4个方向偏导数求出水平和垂直方向的差分,同时统计出其方向上的差分和,利用梯度方向选择合适的预测模式。由于梯度方向垂直于图像的纹理方向,因此所求得的梯度方向需减去90°即表示为图像纹理方向。Kirsh算子通过边缘检测很好的表征出了图像的纹理方向,解决了intra4×4预测模式较多的问题。附图说明图1为本专利技术说明书附图;图2为本专利技术帧内预测模式选择算法的优化流程;图3为本专利技术算法与原算法在五种不同测试序列中的三种评价标准的对比(PSNR/dB、BR/(kb/s)、ENT/s分别代表:Y分量峰值信噪比、输出码率、编码时间);图4为本专利技术算法、原算法以及FMDM算法在五种不同序列中的实验对比;图5为本专利技术在Baseline档下NEW和Paris两组内容细节程度不同序列的性能对比;具体实施方法附图中,相同部分在不同的视图中采用相同的标号表示,并且所描述的各种元件不必按照比例绘制,下面结合附图和实施例对本专利技术进一步说明。图1为说明书框图,是整个帧内预测模式选择算法的系统框图。图2是帧内预测模式选择算法的流程图。对于输入的图像序列,把当前16×16亮度宏块分解成16个4×4子块,并依次做整数DCT,利用评价函数统计各子块频域矩阵中高频分量,如若当前中高频系数相对较大,则说明当前宏块各像素点灰度值相关性较弱,图像纹理细节较多,适用于intra4×4预测模型;若当前中高频系数相对较小(趋于0),则说明当前宏块各像素点灰度值相关性较强,图像内容平坦,适用于intra16×16预测模型,平坦宏块评价函数如公式(1)所示:,(1)其中,valueAC表示4×4子块中高频系数之和,aij表示当前位置的频域系数,TH为判断阈值。经过对大量视频序列实验训练,TH=9.61时能准确判断94%左右宏块内容的平坦性及所适用的预测模式。针对intra4×4,利用改进的Kirsh算子推导出当前4×4宏块的梯度方向。在方向偏导数的求解过程中,利用循环矩阵求卷积的方法减少方向偏导数的运算。分为以下三个步骤:步骤1:利用Kirsh算子4个方向模板求解方向偏导数。如公式(2)所示,分别求出4个方向上的偏导数。式中f(i,j)表示当前位置的灰度值;r代表模板的方向,取值范围为0°、315°、270°、225°:(2)然而同时对4个方向上进行如上公式计算,运算负担影响了图像边缘检测处理的速度。利用循环矩阵变换的原理,通过仅计算一个方向的偏导数来迭代出剩余3个方向的偏导数,由此可以有效的减少方向导数上的运算量。在已求解D0(i,j)情况下可通过公式(3)直接迭代出剩余方向的偏导数值:(3)步骤2:根据前一步求解的4个方向偏导数求出水平和垂直方向的差分,同时统计出其方向上的差分和,如公式(4)所示:(4)步骤3:利用梯度方向选择合适的预测模式:(5)由于梯度方向垂直于图像的纹理方向,因此所求得的梯度方向需减去90°即表示为图像纹理方向。图3对5组序列进行了测试,其中Original代表原帧内预测参考算法,Proposed代表本文改进后算法。通过对实验数据分析,发现在三种档次的编码标准下,图像内容平坦的序列ENT相对较短,且码率也较小;对于图像内容细节丰富的序列ENT较长,码率较大。本文改进后算法相对原算法,对于平坦序列及细节序列在编码时间上均有缩减。图4表示在Baseline档下改进后算法相比原算法,对图像内容平坦的序列ENT平均缩减了70.42%,对图像内容细节丰富的序列平均缩减了67.81%。对比FMDM算法,改进后算法在细节丰富的序列下进一步缩减了8.83%的编码时间,在内容平坦的序列下进一步缩减了6.51%。由以上数据可知,改进后算法不仅能极大的减少内容平坦序列的编码时间,在细节较为丰富的图像序列下减少的时间也相当可观。图5分别表示了Baseline档下两组内容细节程度不同的测试序列的性能。由图可知,改进后算法在平坦序列和细节丰富的视频序列下均缩减了一定比例的编码时间,且随着编码帧数的增加,缩减比例也增加。同时,在率失真方面改进算法与原标准算法、FMDM算法基本一致,表明本算法保持了良好的率失真性能。本文档来自技高网...

【技术保护点】
1.一种改进的H.264帧内预测模式选择算法,其特征在于,包括图像的全局搜索模块和intra 4*4预测模式选择两个部分,全局搜索模块包括高频系数的计算,intra 4*4预测模式则包括水平和垂直的平均梯度方向的计算以及根据计算出的梯度来选择合适的预测模式。/n

【技术特征摘要】
1.一种改进的H.264帧内预测模式选择算法,其特征在于,包括图像的全局搜索模块和intra4*4预测模式选择两个部分,全局搜索模块包括高频系数的计算,intra4*4预测模式则包括水平和垂直的平均梯度方向的计算以及根据计算出的梯度来选择合适的预测模式。


2.根据权利要求1所述,一种改进的H.264帧内预测模式选择算法,其特征在于全局搜索模块利用变换域的中高频系数特征来提取当前宏块的内部特征,从而判断出当前宏块是适用intra4×4还是intra16×16。


3.根据权利要求1所述,一种改进的H...

【专利技术属性】
技术研发人员:周金治黄涛吴斌
申请(专利权)人:西南科技大学
类型:发明
国别省市:四川;51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1