基于最小量化误差准则的字典学习静态图像有损压缩方法技术

技术编号:16217484 阅读:35 留言:0更新日期:2017-09-15 23:47
本发明专利技术公开了一种基于最小量化误差准则的字典学习静态图像有损压缩方法,用于解决现有静态图像有损压缩方法量化误差大的技术问题。技术方案是将稀疏系数对应索引的信息熵作为正则项加入稀疏编码的目标函数中,在使用正交匹配追踪算法选取字典原子时,通过最小化信息熵来限制字典原子的分散度,降低稀疏系数对应索引的编码代价;同时,在字典学习的过程中,通过对稀疏系数进行排序,并寻找使得稀疏系数总离差平方和最小的k惯序划分,将每个划分作为一个量化组,不同量化组之间采用不同的量化步长,同一个量化组内采用相同的量化步长,从而使最终的量化误差最小。

Lossless compression method of dictionary learning static image based on minimum quantization error criterion

The invention discloses a dictionary learning static image lossy compression method based on the minimum quantization error criterion, which is used to solve the technical problems of the existing static image lossy compression method and the large quantization error. The technical scheme is the objective function of the information entropy of the sparse coefficient corresponding index as the regularization term added in sparse encoding, using orthogonal matching pursuit algorithm to select the dictionary atoms, by minimizing the dispersion of information entropy to limit the dictionary, reduce the sparse coefficients of the corresponding index encoding cost; at the same time, in the process of dictionary learning, through to sort the sparse coefficient, and find the sparse coefficient of deviation square and minimum K used sequence division, each division as a quantitative group, between different quantization group with different quantization step, using the same quantization step with a quantitative group, in order to make the final minimum quantization error.

【技术实现步骤摘要】
基于最小量化误差准则的字典学习静态图像有损压缩方法
本专利技术涉及一种静态图像有损压缩方法,特别是涉及一种基于最小量化误差准则的字典学习静态图像有损压缩方法。
技术介绍
文献“Compressibilityconstrainedsparserepresentationwithlearntdictionaryforlowbit-rateimagecompression,IEEETransactionsonCircuitsandSystemsforVideoTechnology,2014,Vol24(10),p1743–1757”公开了一种基于凸松弛与压缩约束的稀疏编码方法用于图像的有损压缩。该方法使用基于凸松弛的稀疏编码代替了传统的追踪匹配算法,强化了图像表示系数的稀疏性和稳定性。同时,将压缩约束加入到稀疏编码的求解过程中,将稀疏编码问题转化为范数优化问题,通过循环迭代逼近该问题的最优解,从而获得图像在给定的超完备字典上的稀疏系数。最终,通过对稀疏系数进行量化和熵编码获得低码率的压缩图像码流。文献所述方法在超完备字典上选取的字典原子分散在整个字典空间中,使得字典原子的整体信息熵较高,难以进行有效的编码压缩;另外,文献所述方法中,量化表使用K-means算法进行学习,该过程独立于字典学习过程,因此量化表无法适应学习到的超完备字典,造成量化误差变大。
技术实现思路
为了克服现有静态图像有损压缩方法量化误差大的不足,本专利技术提供一种基于最小量化误差准则的字典学习静态图像有损压缩方法。该方法将稀疏系数对应索引的信息熵作为正则项加入稀疏编码的目标函数中,在使用正交匹配追踪算法选取字典原子时,通过最小化信息熵来限制字典原子的分散度,降低稀疏系数对应索引的编码代价;同时,在字典学习的过程中,通过对稀疏系数进行排序,并寻找使得稀疏系数总离差平方和最小的k惯序划分,将每个划分作为一个量化组,不同量化组之间采用不同的量化步长,同一个量化组内采用相同的量化步长,从而使最终的量化误差最小。本专利技术解决其技术问题所采用的技术方案是:一种基于最小量化误差准则的字典学习静态图像有损压缩方法,其特点是包括以下步骤:步骤一、对训练图像进行分块和规范化。将所有训练图像划分为16×16的图像块,对于每个图像块,按照公式(1)进行规范化其中,vij表示图像块中坐标为(i,j)的像素点的灰度值,m,n分别表示图像块的长宽。将图像块拉直为向量构成字典学习的输入信号。步骤二、先利用自组织特征映射对部分图像块进行初步聚类,再通过K-means算法对所有图像块进行聚类。在聚类中,使用欧氏距离来度量任意两个图像块之间的距离其中,si,sj表示任意两个不同的图像块向量,d(si,sj)表示其欧氏距离。步骤三、利用字典学习算法对每个类簇训练一个超完备字典和一个量化表,字典中的每个原子即为该类簇图像块共有的结构模式。同时将稀疏系数的量化误差和其对应索引的信息熵作为正则项加入字典学习的目标函数中,通过迭代求解公式(3)和公式(5)对量化表和字典同时进行学习,减小最终的编码代价。其中,S是原始输入信号矩阵,每列为图像块拉直后的输入信号si,D是字典,A是稀疏系数矩阵,αj是稀疏系数矩阵A的第j列,表示信号sj在字典D上分解的表示系数,kmax是稀疏度限制,pi是字典原子di的使用概率,M为字典中的字典原子个数。随后,将每个类簇的字典和量化表分别拼接成全局字典和全局量化表,存储在编码端和解码端。步骤四、图像编码时,将图像分成直流分量和交流分量两部分。对直流分量进行DPCM编码。对交流分量利用稀疏编码在全局字典上进行分解,得到对应的稀疏系数矩阵,对该稀疏系数矩阵利用全局量化表进行量化,随后,对量化后的交流分量对应的稀疏系数矩阵中非零元素及其索引进行Huffman编码,形成最终的码流。步骤五、解码过程为编码过程的逆过程。通过字典与稀疏系数矩阵相乘重建出信号矩阵S,再对信号矩阵每列加上对应的直流分量并重新排列,从而恢复出图像。本专利技术的有益效果是:该方法将稀疏系数对应索引的信息熵作为正则项加入稀疏编码的目标函数中,在使用正交匹配追踪算法选取字典原子时,通过最小化信息熵来限制字典原子的分散度,降低稀疏系数对应索引的编码代价;同时,在字典学习的过程中,通过对稀疏系数进行排序,并寻找使得稀疏系数总离差平方和最小的k惯序划分,将每个划分作为一个量化组,不同量化组之间采用不同的量化步长,同一个量化组内采用相同的量化步长,从而使最终的量化误差最小。下面结合具体实施方式对本专利技术作详细说明。具体实施方式本专利技术基于最小量化误差准则的字典学习静态图像有损压缩方法具体步骤如下:1.图像分块与规范化。对所有训练图像首先按照光栅扫描顺序,平移量为2,将其划分为16×16的图像块然后对每个图像块bi进行参照公式(1)进行规范化最后,将图像块拉直为向量构成字典学习的输入信号。2.图像块聚类。为了保证学习到的字典的纯度,需要先对图像块进行聚类,使每类中都是相似图像块。由于对训练图像进行有交叠分块,获得的图像块数量非常之多,故首先从所有图像块中随机抽取10%的图像块,利用自组织特征映射算法进行初步聚类,获得初步聚类簇数k和聚类中心然后将初步聚类中心作为初始值,使用K-Means算法对所有图像块进行聚类。在聚类中,使用欧氏距离来度量任意两个图像块之间的距离3.字典学习与量化表学习。在传统的稀疏编码算法中,由于信号是在一个过完备字典上进行分解,重建一个信号s时存在着多组不同的字典原子的线性组合,信号s1可以通过字典原子di和dj的线性组合s1=α1di+β1dj进行重建;信号s2既可以通过s2=α2dp+β2dq重建,又可以通过s2=α2′di+β2′dj重建。后一种重建方案中s1和s2使用了相同的字典原子,则字典原子的选择较为稀疏,编码其对应的索引值时只需要较短的字长,有利于提高压缩比。在本专利技术中,将字典原子索引值的信息熵作为正则项加入稀疏编码的目标函数中,使得最终的编码代价最小。修改后的目标函数参照公式(3)式中pi的计算参照公式(4)其中,ai表示稀疏系数矩阵A的第i行,δ是个极小的实数,防止分母为0。经过稀疏编码后得到原始信号矩阵的稀疏系数矩阵A,由于A中都是浮点数,难以压缩存储,故需要对其进行量化Q(A),此时需要重新更新字典D使重建误差最小化。更新字典的过程被称为字典学习,此时的目标函数参照公式(5)其中Q(·)为量化函数。在量化时,为了减小总体量化误差,采用非均匀量化,即对较大的稀疏系数使用大量化步长,对较小的稀疏系数使用小量化步长。为了实现上述目标,将稀疏系数矩阵A中的非零元素表示为(aij,idxij)的形式,aij表示非零元素,idxij表示其对应的索引。首先,对aij进行升序排序得到升序数列L。随后,将升序数列L划分成k个惯序子数列{L1,L2,…,Lk},且使得划分后的总体离差平方和最小,即满足公式(6)其中,表示子数列Li的平均值,lj表示子数列Li中的第j个数。此时,k个子数列对应k个不同的量化组,不同的量化组间采用不同的量化步长,同一个量化组内采用相同的量化步长。量化时使用八位二进制码e0e1e2e3e4e5e6e7对稀疏系数进行表示。当k=3时,稀疏系数矩阵被分为八个量化组,其本文档来自技高网...

【技术保护点】
一种基于最小量化误差准则的字典学习静态图像有损压缩方法,其特征在于包括以下步骤:步骤一、对训练图像进行分块和规范化;将所有训练图像划分为16×16的图像块,对于每个图像块,按照公式(1)进行规范化

【技术特征摘要】
1.一种基于最小量化误差准则的字典学习静态图像有损压缩方法,其特征在于包括以下步骤:步骤一、对训练图像进行分块和规范化;将所有训练图像划分为16×16的图像块,对于每个图像块,按照公式(1)进行规范化其中,vij表示图像块中坐标为(i,j)的像素点的灰度值,m,n分别表示图像块的长宽;将图像块拉直为向量构成字典学习的输入信号;步骤二、先利用自组织特征映射对部分图像块进行初步聚类,再通过K-means算法对所有图像块进行聚类;在聚类中,使用欧氏距离来度量任意两个图像块之间的距离其中,si,sj表示任意两个不同的图像块向量,d(si,sj)表示其欧氏距离;步骤三、利用字典学习算法对每个类簇训练一个超完备字典和一个量化表,字典中的每个原子即为该类簇图像块共有的结构模式;同时将稀疏系数的量化误差和其对应索引的信息熵作为正则项加入字典学习的目标函数中,通过迭代求解公式(3)和公式(5)对量化表和字典同时进行学习,减小最终的编码代价;

【专利技术属性】
技术研发人员:夏勇王昊张艳宁
申请(专利权)人:西北工业大学
类型:发明
国别省市:陕西,61

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1