一种基于多目标张量塔克分解的图像压缩方法技术

技术编号:37443650 阅读:12 留言:0更新日期:2023-05-06 09:15
本发明专利技术属于图像压缩领域,公开了一种基于多目标张量塔克分解的图像压缩方法。本发明专利技术考虑图像高维的本征结构信息,利用多目标优化算法优化塔克张量分解,寻找尽可能小的张量维度压缩比来实现加权相似性尽可能大、特征相似性尽可能大、信息保真度标准尽可能大、Hu不变矩相似度尽可能大的压缩图像,并结合利用精英反向学习的环境选择策略以及CRITIC权重决策法,得到一个全面考虑图像亮度、对比度、结构、特征相似度、共同信息以及描述图像特征的不变矩等多个角度的压缩图像。多个角度的压缩图像。多个角度的压缩图像。

【技术实现步骤摘要】
一种基于多目标张量塔克分解的图像压缩方法


[0001]本专利技术属于图像压缩领域,具体为一种基于多目标优化算法来优化张量塔克分解进而进行图像压缩的方法。

技术介绍

[0002]图像出现在交流以及工作中的方方面面,人类可以用它很好地进行信息的获取,也不可置否地会应用到图像处理。然而,随着图像技术的发展,图像数据集越来越大,导致图像容量的增加,图像的存储和传输也面临着诸多挑战。所以,如何压缩数据,获得高压缩比,是近几年大家非常关心的问题。幸运的是,每个波段(空间冗余)以及相邻波段(波段冗余)中的像素值之间存在很强的相关性。这些冗余允许开发有效的压缩算法。
[0003]传统的图像压缩方法是先把图像所包含的数据进行向量化后再对其相应的压缩处理,这种做法会丢失图像高维空间的本征结构信息,而张量(tensor)是一种对向量和矩阵高阶扩展的多维数据存储形式,它可以完整地表示高维数据,这样一来图像高维空间数据的本征结构信息就可以得到保护。如此说来,向量就可以视作一维张量,矩阵就可以视作二维张量,而在现实中遇到的更多的是三维、四维张量及以上。从几何的角度来说,一维张量构成的就是一条线,二维张量是平面上的矩形,而三维张量是立方体,以此类推。换个角度理解,三维张量可以看做是多个矩阵堆叠而成,张量的应用面很广,大多数的数据都可以用张量表示,比如一张彩色图片是由像素矩阵和第三维的RGB颜色通道组成的三维张量,那么构成彩色图片的张量大小为H*W*3。为了更多地保留图像的结构信息,本专利技术采用了塔克分解这种高维图像压缩方法。
[0004]此外,基于多目标优化算法的张量塔克分解主要考虑以下的问题:(1)在人类视觉下,保证压缩后的图像清晰度更高;(2)在确保图像视觉清晰度的情况下减少图像的压缩比;(3)使原图像更多的结构信息保存在压缩后的图像中;(3)使原图像更多的特征信息保存在压缩后的图像中。

技术实现思路

[0005]在不考虑图像高维的本征结构信息的情况,或在不多方面多角度地考虑图像压缩前后的结构以及特征的情况下,图像的大量有用信息都会存在丢失的现象,而在考虑图像高维的本征结构信息以及图像压缩前后多方面的结构以及特征的情况下,平衡不好图像压缩后各项特征信息之间的比例,会导致图像的压缩质量和压缩率不能两全。为了解决这个问题,本专利技术将多目标优化算法和基于张量塔克分解的图像压缩相结合,提出了一种通过多目标优化算法来优化张量塔克分解进而进行图像压缩的方法。
[0006]本专利技术的技术方案:
[0007]一种多目标张量塔克分解的图像压缩方法,包括:
[0008]获取要压缩的原始图像的张量,构建原始图像的张量塔克分解模型,近似分解为一个核心张量和三个因子矩阵,然后利用该模型构建解压,得到重构图像。
[0009]构建图像压缩的多目标质量评估优化模型,包括:
[0010]以图像压缩前后的张量维度压缩比最小,图像压缩前后关于亮度对比度以及结构对比的加权结构相似性最大,衡量图像压缩前后的相位以及梯度相似性的特征相似性最大,图像压缩前后衡量图像共同信息的信息保真度标准最大,衡量图像不变矩特征的Hu不变矩相似度最大,分别构建对应的目标函数。
[0011]采用多目标优化算法求解所述塔克分解的多目标优化模型,得到塔克分解的图像压缩最优方案集。
[0012]采用客观赋权的决策方法,从最优压缩方案中选择出一个最适合的图像压缩方案。
[0013]进一步地,所述根据输入的要压缩的原始图像,构建图像的塔克分解模型,包括:
[0014][0015]其中,J1、J2、J3为彩色图像A的三阶张量表示,J1、J2分别为彩色图像的宽W和高H,J3表示彩色图像的RGB三通道;B(j1,j2,j3)是指j1×
j2×
j3的三阶张量,相当于SVD分解中的奇异值张量;为j
n
×
j
n
(n=1,2,3)的矩阵,表示张量的特征张量;是指矩阵P和矩阵Q的哈达玛积,即二者矩阵对应位置的乘积。
[0016]彩色图像由此被分解成一个核心张量B以及三个因子矩阵U
(1)
、U
(2)
、U
(3)
,可以取前K3个最大的子张量以及该张量对应的特征向量来近似,即
[0017][0018]在解压图像重构过程中,通过下式恢复得到重构图像。
[0019][0020]其中N为图像的维度数,表示第n(n=1,2,..,N)次向量积,U
n
为I
n
×
I
n
的矩阵,n=1、2、3。
[0021]进一步地,以图像压缩前后张量维度压缩量最小构建目标函数,具体为:
[0022][0023]其中D
X
表示X的维度乘积,如果X为w
×
h的二维矩阵,则D
X
=w
×
h,如果X为w
×
h
×
l的三维张量,则D
X
=w
×
h
×
l。
[0024]进一步地,以加权结构相似性最大构建目标函数,具体为:
[0025][0026]其中,M是要计算的维度总数,β
v
是第v维的权重,第v维IW

SSIM度量定义如下式所示:
[0027][0028]其中,x
v,u
和y
v,u
为第v个维度的第u个局部图像块,从第u个评价窗口中提取;w
v,u

第v个维度中第u个空间位置计算的信息内容权重;c(x
v,u
,y
v,u
)为对比度对比函数;s(x
v,u
,y
v,u
)为结构对比函数;
[0029]对于v=1...M

1,IW

SSIM
v
如下式所示:
[0030][0031]其中,N
v
为尺度中评价窗口的数量,l(x
v,u
,y
v,u
)为亮度对比函数;
[0032]进一步地,以特征相似性最大构建目标函数,具体为:
[0033][0034]其中,YIQ颜色空间是基于RGB三原色颜色空间的转换,S
C
(x)是S
I
(x)和S
Q
(x)合并来得到色度相似性度量,I、Q具有范围相同的取值空间;PC
m
(x)=max(PC1(x),PC2(x)),PC1(x)、PC2(x)分别表示压缩前后图像的相位一致性;λ>0且用于调整色度;Ω代表着整张图片的像素域,FSIM
C
越大说明当前压缩后的彩色图像质量越好,表明该彩色图像更加接近原始的彩色图像,S
L
(x)是提取压缩前后图像的相位一致性S<本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种多目标张量塔克分解的图像压缩方法,其特征在于,包括:(1)获取要压缩的原始图像的张量,构建原始图像的张量塔克分解模型,近似分解为一个核心张量和三个因子矩阵,然后利用张量塔克分解模型构建解压,得到重构图像;根据输入的要压缩的原始图像,构建原始图像的张量塔克分解模型:其中,J1、J2、J3为彩色图像A的三阶张量表示,J1、J2分别为彩色图像的宽W和高H,J3表示彩色图像的RGB三通道;B(j1,j2,j3)是指j1×
j2×
j3的三阶张量,相当于SVD分解中的奇异值张量;为j
n
×
j
n
(n=1,2,3)的矩阵,表示张量的特征张量;是指矩阵P和矩阵Q的哈达玛积,即二者矩阵对应位置的乘积;彩色图像由此被分解成一个核心张量B以及三个因子矩阵U
(1)
、U
(2)
、U
(3)
,取前K3个最大的子张量以及该张量对应的特征向量来近似,即在解压图像重构过程中,通过下式恢复得到重构图像;其中N为图像的维度数,表示第n(n=1,2,..,N)次向量积,U
n
为I
n
×
I
n
的矩阵,n=1、2、3;(2)构建图像压缩的多目标质量评估优化模型,包括:以图像压缩前后的张量维度压缩比最小、图像压缩前后关于亮度对比度以及结构对比的加权结构相似性最大、衡量图像压缩前后的相位以及梯度相似性的特征相似性最大、图像压缩前后衡量图像共同信息的信息保真度标准最大、衡量图像不变矩特征的Hu不变矩相似度最大为目标分别构建对应的目标函数;(2.1)以图像压缩前后的张量维度压缩量最小构建目标函数,具体为:其中,D
X
表示X的维度乘积,如果X为w
×
h的二维矩阵,则D
X
=w
×
h,如果X为w
×
h
×
l的三维张量,则D
X
=w
×
h
×
l;(2.2)以加权结构相似性最大构建目标函数,具体为:其中,M是要计算的维度总数,β
v
是第v维的权重,第v维IW

SSIM度量定义如下式所示:其中,x
v,u
和y
v,u
为第v个维度的第u个局部图像块,从第u个评价窗口中提取;w
v,u
为第v个维度中第u个空间位置计算的信息内容权重;c(x
v,u
,y
v,u
)为对比度对比函数;s(x
v,u
,y
v,u
)为结构对比函数;对于v=1...M

1,IW

SSIM
v
如下式所示:
其中,N
v
为尺度中评价窗口的数量,l(x
v,u
,y
v,u
)为亮度对比函数;(2.3)以特征相似性最大构建目标函数,具体为:其中,YIQ颜色空间是基于RGB三原色颜色空间的转换,S
C
(x)是S
I
(x)和S
Q
(x)合并来得到色度相似性度量,I、Q具有范围相同的取值空间;PC
m
(x)=max(PC1(x),PC2(x)),PC1(x)、PC2(x)分别表示压缩前后图像的相位一致性;λ>0且用于调整色度;Ω代表着整张图片的像素域,FSIM
C
越大说明当前压缩后的彩色图像质量越好,表明该彩色图像更加接近原始的彩色图像,S
L
(x)是提取压缩前后图像的相位一致性S
PC
(x)和梯度特征S
G
(x)合并得到的;(2.4)以信息保真度标准最大构建目标函数,具体为:其中,将压缩后图像的第k个子带射频D
k
的N
k
个系数表示成同理将未压缩图像的该系数表示成该系数表示成表示相应系数的非线性依赖;(2.5)以Hu不变矩相似度最大构建目标函数,具体为:其中,θ是矩阵X和Y的夹角,
·
是向量X和Y的数量积,||A||是向量A的模;A
oringin
是压缩前...

【专利技术属性】
技术研发人员:曹斌杨星伊
申请(专利权)人:河北工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1