当前位置: 首页 > 专利查询>武汉大学专利>正文

图像压缩最优量化参数的估计方法技术

技术编号:36527305 阅读:18 留言:0更新日期:2023-02-01 16:07
本发明专利技术公开了一种图像压缩最优量化参数的估计方法,包括如下步骤:步骤1,选定图像集合,对图像集合中的每幅图像I

【技术实现步骤摘要】
图像压缩最优量化参数的估计方法


[0001]本专利技术属于图像压缩的
,具体涉及一种图像压缩最优量化参数的估计方法。

技术介绍

[0002]在有限带宽的信道上实现高通量图像传输,原始图像数据都需要经过有损压缩。编码器产生的有损压缩的结果,一方面必须确保大小在带宽限制的范围内,避免信息丢失;另一方面,应当尽可能的占足带宽,以保证更优的传输图像质量。为满足以上两个需求,就要求各类编码器有合理的码率控制算法。
[0003]现有的图像压缩算法JPEG或者JPEG2000都可以统一概括为输入数据经时频变换、量化和编码三个步骤:(1)预处理,在图像压缩中一般是指对颜色图进行多分量转换,或者对数据进行时频转换;(2)量化,就是利用人眼对分辨率精度的局限性对图像原始数据做精度降采样,从而减少数据量,便于后续数据的压缩;(3)编码,即根据不同图像编码标准进行数据的压缩编码,最后生成压缩码流。其中,量化部分数据精度降采样的操作,是图像质量受损的主要原因。量化参数QP(Quantization Parameter,QP)的设定会直接影响量化后的数据精度,从而进一步影响压缩后数据流的大小和图像质量。所以量化参数的合理设定对实现码率控制至关重要。
[0004]目前,在有限带宽下,高通量图像编码中针对量化参数QP优化的码率控制算法,应能够确保带宽的使用不超出限制范围,不丢失数据,不影响图像重建;又能尽量用足带宽以达到更好的图像质量,呈现更优的视觉感受和更低的失真率。根据率失真理论,在限定带宽下,图像内容的复杂度越高,量化参数QP更大,保证不超过指定码率,反之图像内容的复杂度低时,量化参数QP可以小一些,充分的利用带宽,提高图像的还原质量。
[0005]图像内容的复杂度的计算方法,有图像的信息熵(Entropy)、绝对变换差的和(SATD)以及图像的梯度(Gradient)。这些特征具有某一方面的代表性,由于图像类型、光照条件等原因,量化参数估计准确性有进一步提升的空间.
[0006]图像的信息熵(Entropy)本是统计学中的概念,在图像处理中,能够反映图像的均值信息量。图像的信息熵是对图像内容不确定性的一种度量,也能在一定程度上反应图像内容的复杂程度[1],计算公式如式(1)所示。其中,p表示某个像素值k在整幅图像中出现的频率,见式(2)。当每个灰度值出现的概率p相等时,该图像的信息熵取最大值;当只有一个灰度值在图像中出现,即p为1时,该图像的信息熵取最小值0。在实际图像中则反映为当一幅图像的灰度值在整个取值区间上波动时,图像的信息熵偏大,反之灰度值较为单一时,信息熵偏小。因此图像的信息熵常被认为能够反映图像的纹理复杂程度[1]。在许多图像或视频编码的环境下,信息熵都对内容编码有很重要的作用[2]。
[0007]Entropy=

∑plog2p;
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(1)
[0008][0009]绝对变换差的和(SATD)能够反映图像和视频帧的残差信号大小,在视频编码中常用来作为编码复杂度的度量,并已被证明与压缩后视频占用码率有较强的线性关系,因此能在视频编码中参与量化参数QP决策[3][4]。SATD将残差信号变换到频域然后再对绝对值求和,如式(3)所示,其中H表示哈达玛矩阵,M为方阵的大小,X是残差信号方阵:
[0010]SATD=∑
M

M
|HXH|;
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(3)
[0011]图像的梯度(Gradient)能够反映图像中像素值的位置关系[1],相比于图像包含更多空间分布的细节,相当于一种二维的特征参数。梯度的本意是某函数在某一点处变化率最大,变化最快。而将梯度这个参数引入图像处理中,就变成了反映图像中凸起和边缘的参数[5]。图像梯度的计算公式见式(4),其中I
i,j
为图像I在位置(i,j)的像素值,计算结果由水平像素之间的差值和垂直像素之间的差值共同决定,能够反映二维图像的结构信息:
[0012][0013]由于图像内容的多样性,依靠图像复杂度的单一特征参数或者线性加权的方法,带宽受限条件下的最优量化参数预测仍然有失效的情况,因此,需要开发一种预测精度更高的最优量化参数估计方法。
[0014]参考文献:
[0015][1]Rafael C.Gonzalez,Richard E.Woods,Steven L.Eddins.数字图像处理[M].电子工业出版社,2005.
[0016][2]Tu C,Tran T D.Context

based entropy coding of block transform coefficients for image compression[J].IEEE Transactions on Image Processing,2002,11(11):1271

1283.
[0017][3]W.Gao,S.Kwong,Q.Jiang,C.

K.Fong,P.H.Wong,W.Y.Yuen,Data

driven rate ontrol for rate

distortion optimization in HEVC based on simplified effective nitial QP learning,IEEE Trans.Broadcast.65(1)(2018)94

108.
[0018][4]M.Karczewicz and X.Wang,“Intra Frame Rate Control Based on SATD,Document:JCTVC

M0257,13th Meeting,Incheon,KR,Apr.2013.
[0019][5]Chen G H,Yang C L,Xie S L.Gradient

based structural similarity for image quality assessment[C]//2006International Conference on Image Processing.IEEE,2006:2929

2932.

技术实现思路

[0020]本专利技术的目的在于针对现有技术的不足之处,提供一种图像压缩最优量化参数的估计方法,该方法在受限带宽下能够估计最优的图像压缩量化参数,充分运用了带宽,提高了图像传输的质量。
[0021]为解决上述技术问题,本专利技术采用如下技术方案:
[0022]一种图像压缩最优量化参数的估计方法,包括如下步骤:
[0023]步骤1,选定图像集合,对图像集合中的每幅图像I
i
,设定目标码率B0计算每幅图像的最优量化参数QP;
[00本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种图像压缩最优量化参数的估计方法,其特征在于,包括如下步骤:步骤1,选定图像集合,对图像集合中的每幅图像I
i
,设定目标码率B0计算每幅图像的最优量化参数QP;步骤2,计算图像集合中每幅图像复杂度特征向量C
i
;步骤3,构建多层神经网络NN,对于该多层神经网络NN,输入层为图像复杂度特征向量C
i
,输出层为回归型量化参数QP
i
,采用图像集合训练多层神经网络NN,并对训练后的多层神经网络NN进行验证和预测,选择测试精度最高的多层神经网络NN;步骤4:对于图像I

,计算其图像复杂度特征向量C

,并输入到步骤3中得到的多层神经网络NN中,从而得到输出的量化参数最优估计QP

。...

【专利技术属性】
技术研发人员:艾浩军徐永昌乾方圆
申请(专利权)人:武汉大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1