当前位置: 首页 > 专利查询>武汉大学专利>正文

高光谱图像压缩方法、装置、设备及可读存储介质制造方法及图纸

技术编号:30047554 阅读:9 留言:0更新日期:2021-09-15 10:49
本发明专利技术提供一种高光谱图像压缩方法、装置、设备及可读存储介质。该方法包括:通过训练集对卷积神经网络进行训练,其中,卷积神经网络包括非线性变换模块、量化模块以及熵模型;使用测试集验证训练完成的卷积神经网络的压缩性能,当训练完成的卷积神经网络的压缩性能达标时,通过训练完成的卷积神经网络对高光谱图像进行压缩处理。通过本发明专利技术,对于高光谱图像压缩具有较好的率失真性能。像压缩具有较好的率失真性能。像压缩具有较好的率失真性能。

【技术实现步骤摘要】
高光谱图像压缩方法、装置、设备及可读存储介质


[0001]本专利技术涉及图像处理
,尤其涉及一种高光谱图像压缩方法、装置、设备及可读存储介质。

技术介绍

[0002]高光谱图像具有丰富而独特的光谱信息,给基于高光谱图像的很多应用,比如农作物分类、质量检测、灾难预测等任务带来了极大的便利。然而这种优势在有限的传输带宽和存储能力下,也制约着高光谱图像的进一步发展。因此,如何有效解决高光谱图像大数据量带来的各种挑战是高光谱图像得以广泛应用的前提和关键。
[0003]在高光谱图像压缩算法中,变换编码因其较小的计算复杂度和良好的适应性而得到广泛应用。基于变换编码的图像压缩算法包括四部分:变换,量化和熵编码,反变换,分开实现编码过程和去相关过程。
[0004]变换是通过一定的方式将图像从像素域变换到一个更为紧凑的空间,现有基于变换编码的高光谱图像压缩方法一般假设高光谱图像为高斯源,在此条件下只需可逆的线性变换即能将像素映射成独立的潜在表示,通过量化和熵编码将潜变量压缩成码流用于存储和传输。然而,实际场景的高光谱图像具有明显的非高斯特性,使得线性变换不再适用,非线性变换的探索为该问题提供了新的方法和思路。近年来,以人工神经网络尤其是深度学习为工具的非线性变换的发展改变了传统图像压缩手工设参的状况。现有基于深度学习的图像压缩技术表现出巨大的潜力,性能已超过工业界的H.266/VVC(Versatile Video Coding,VVC)标准。然而,这些方法多用于处理三波段的自然图像,对于高光谱图像的压缩相对较少
[0005]变换过程使得量化和和熵编码得以在一个紧凑空间执行,相较于RGB自然图像,高光谱图像的光谱间具有更强的相关性,这使得经过相同的变换过程,高光谱图像得到的潜在表示具有与RGB图像不同的统计特性。经过量化,潜变量变成离散形式,然后基于熵编码算法对该离散形式进行编码。而熵编码的过程依赖于潜变量的概率分布模型,由最小熵理论可知,设计的熵模型越接近真实的潜变量分布,码率越小,熵率优化过程中得到的解越接近最优解。
[0006]结合上述分析,目前基于深度学习的压缩技术还需要进一步根据高光谱图像的特点,设计更加灵活准确的熵模型,以减少熵模型与真实潜变量分布之间的失配,从而达到最优的率失真性能。

技术实现思路

[0007]为解决上述技术问题,本专利技术提供一种高光谱图像压缩方法、装置、设备及可读存储介质。
[0008]第一方面,本专利技术提供一种高光谱图像压缩方法,所述高光谱图像压缩方法包括:
[0009]通过训练集对卷积神经网络进行训练,其中,卷积神经网络包括非线性变换模块、
量化模块以及熵模型;
[0010]使用测试集验证训练完成的卷积神经网络的压缩性能,当训练完成的卷积神经网络的压缩性能达标时,通过训练完成的卷积神经网络对高光谱图像进行压缩处理。
[0011]可选的,在所述通过训练集对卷积神经网络进行训练的步骤之前,还包括:
[0012]将样本高光谱图像在空间维切分成若干固定大小的立方块;
[0013]按预设比例将所述若干固定大小的立方块划分为训练集和测试集。
[0014]可选的,非线性变换模块对高光谱图像的空间和光谱维进行正向非线性变换,得到潜变量;量化模块通过添加均匀噪声的方式对潜变量进行量化;熵模型用于得到潜变量的概率分布,以供在熵编码时基于所述概率分布确定潜变量中每个元素所分配的码字。
[0015]可选的,基于率失真准则对卷积神经网络训练过程进行约束,用来确定非线性变换模块以及熵模型中的参数值。
[0016]可选的,所述非线性变换包括正向变换:Y=g
a
(W
a
X+b
a
),反向变换:),反向变换:其中,表示输入的高光谱图像,表示重构图像,H,W,B分别对应高光谱图像的行、列和波段数,表示潜变量,h,w,N分别对应潜变量的行、列和滤波器的个数,和表示正变换网络参数,和表示反变换网络参数,g
a
(.)表示非线性正向变换函数,g
s
(.)表示非线性反向变换函数。
[0017]可选的,所述通过添加均匀噪声的方式对潜变量进行量化的函数表达如下:
[0018][0019]其中,training表示训练过程,testing表示测试过程,表示单位均匀噪声,round表示取整操作,表示量化后的潜向量。
[0020]可选的,将潜变量的统计特性引入熵模型的设计,同时,引入额外的变量构造一个条件模型,以提高熵模型的精度。
[0021]第二方面,本专利技术还提供一种高光谱图像压缩装置,所述高光谱图像压缩装置包括:
[0022]训练模块,用于通过训练集对卷积神经网络进行训练,其中,卷积神经网络包括非线性变换模块、量化模块以及熵模型;
[0023]处理模块,用于使用测试集验证训练完成的卷积神经网络的压缩性能,当训练完成的卷积神经网络的压缩性能达标时,通过训练完成的卷积神经网络对高光谱图像进行压缩处理。
[0024]第三方面,本专利技术还提供一种高光谱图像压缩设备,所述高光谱图像压缩设备包括处理器、存储器、以及存储在所述存储器上并可被所述处理器执行的高光谱图像压缩程序,其中所述高光谱图像压缩程序被所述处理器执行时,实现如上所述的高光谱图像压缩方法的步骤。
[0025]第四方面,本专利技术还提供一种可读存储介质,所述可读存储介质上存储有高光谱图像压缩程序,其中所述高光谱图像压缩程序被处理器执行时,实现如上所述的高光谱图像压缩方法的步骤。
[0026]本专利技术中,通过训练集对卷积神经网络进行训练,其中,卷积神经网络包括非线性变换模块、量化模块以及熵模型;使用测试集验证训练完成的卷积神经网络的压缩性能,当训练完成的卷积神经网络的压缩性能达标时,通过训练完成的卷积神经网络对高光谱图像进行压缩处理。通过本专利技术,对于高光谱图像压缩具有较好的率失真性能。
附图说明
[0027]图1为本专利技术实施例方案中涉及的高光谱图像压缩设备的硬件结构示意图;
[0028]图2为本专利技术高光谱图像压缩方法一实施例的流程示意图;
[0029]图3为本专利技术高光谱图像压缩装置一实施例的功能模块示意图。
[0030]本专利技术目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
[0031]应当理解,此处所描述的具体实施例仅仅用以解释本专利技术,并不用于限定本专利技术。
[0032]第一方面,本专利技术实施例提供一种高光谱图像压缩设备,该高光谱图像压缩设备可以是个人计算机(personal computer,PC)、笔记本电脑、服务器等具有数据处理功能的设备。
[0033]参照图1,图1为本专利技术实施例方案中涉及的高光谱图像压缩设备的硬件结构示意图。本专利技术实施例中,高光谱图像压缩设备可以包括处理器1001(例如中央处理器Central Processing Unit,CPU),本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种高光谱图像压缩方法,其特征在于,所述高光谱图像压缩方法包括:通过训练集对卷积神经网络进行训练,其中,卷积神经网络包括非线性变换模块、量化模块以及熵模型;使用测试集验证训练完成的卷积神经网络的压缩性能,当训练完成的卷积神经网络的压缩性能达标时,通过训练完成的卷积神经网络对高光谱图像进行压缩处理。2.如权利要求1所述的高光谱图像压缩方法,其特征在于,在所述通过训练集对卷积神经网络进行训练的步骤之前,还包括:将样本高光谱图像在空间维切分成若干固定大小的立方块;按预设比例将所述若干固定大小的立方块划分为训练集和测试集。3.如权利要求2所述的高光谱图像压缩方法,其特征在于,非线性变换模块对高光谱图像的空间和光谱维进行正向非线性变换,得到潜变量;量化模块通过添加均匀噪声的方式对潜变量进行量化;熵模型用于得到潜变量的概率分布,以供在熵编码时基于所述概率分布确定潜变量中每个元素所分配的码字。4.如权利要求3所述的高光谱图像压缩方法,其特征在于,基于率失真准则对卷积神经网络训练过程进行约束,用来确定非线性变换模块以及熵模型中的参数值。5.如权利要求4所述的高光谱图像压缩方法,其特征在于,所述非线性变换包括正向变换:Y=g
a
(W
a
X+b
a
),反向变换:其中,表示输入的高光谱图像,表示重构图像,H,W,B分别对应高光谱图像的行、列和波段数,表示潜变量,h,w,N分别对应潜变量的行、列和滤波器的个数,和表示正变换网络参数,示正变换网络参数...

【专利技术属性】
技术研发人员:种衍文郭圆圆潘少明
申请(专利权)人:武汉大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1