当前位置: 首页 > 专利查询>武汉大学专利>正文

一种基于深度学习的高光谱图像压缩方法及装置制造方法及图纸

技术编号:22330774 阅读:34 留言:0更新日期:2019-10-19 12:24
本发明专利技术公开了一种基于深度学习的高光谱图像压缩方法,首先,选取训练图像,将训练图像的尺寸大小随机裁剪为32×32大小作为训练集,然后将训练集输入到搭建好的压缩网络模型中进行训练,得到包含编码网络、量化网络和解码网络的压缩模型。通过将待压缩的图像输入到编码网络中,根据编码网络的计算结果得到编码后的特征图,然后将得到的特征图输入到量化网络中进行量化计算,得到码流,最后将量化后的结果输入到解码网络,通过解码网络模型的计算得到重建后的图像。本发明专利技术可以实现对高光谱图像的压缩,并提升压缩效果。

A method and device of hyperspectral image compression based on deep learning

【技术实现步骤摘要】
一种基于深度学习的高光谱图像压缩方法及装置
本专利技术涉及高光谱图像压缩
,具体涉及一种基于深度学习的高光谱图像压缩方法及装置。
技术介绍
相较于自然图像,高光谱图像包含了二维空间信息和一维光谱信息。其中,每个光谱波段分别对应一幅二维图像,且不同波段相同位置的像素构成一条光谱曲线。利用不同地物所具有的光谱曲线差异,高光谱图像被广泛应用于国民经济的各个领域。随着高分遥感成像技术的应用普及,如何有效的压缩由于遥感图像光谱和空间分辨率显著提升所带来的传输和存储数据量激增等挑战是高光谱图像应用过程中亟待解决的问题。新兴的图像处理方法深度学习(DeepLearning)通过从大量训练样本中学习目标的特征来完成特定的任务。目前深度学习已经在图像分类、目标检测、行人再识别等多个图像处理的领域取得了重大成就。目前,现有的深度学习技术多用于普通可见光图像的压缩,而基于深度学习的高光谱图像压缩技术还是比较少的。Toderici等提出了基于长短时记忆网络的、可变比率的图像压缩算法。算法将一张32×32大小的图像输入到网络中,通过减少图像的尺度和调节特征图的个数,实现对图像的压缩,然后通过解码网络实现图像信息的还原。Balle等使用卷积神经网络来实现图像的压缩。网络包含分析变换结构,量化结构和合成变换结构三个部分,这些结构主要由卷积层、图像降采样层、GDN归一化层等组成。Li等提出了基于图像内容加权的图像压缩技术,此方法针对不同的图像内容使用不同的比特率编码,它在传统自编码器结构的基础上,加入了重要性图概念,通过重要性图来实现不同图像内容的码率控制。本申请专利技术人在实施本专利技术的过程中,发现现有技术的方法,至少存在如下技术问题:但是现有技术中采用的上述方法都是针对可见光图像的压缩,而不是针对高光谱图像的压缩,普通图像一般只有3个波段,而高光谱图像的波段数拥有几十个到上百个,甚至更多,现有的方法无法实现对高光谱图像的压缩或者压缩效果较差。
技术实现思路
有鉴于此,本专利技术提供了一种基于深度学习的高光谱图像压缩方法及装置,用以解决或者至少部分解决现有的方法无法实现对高光谱图像的压缩或者压缩效果较差的技术问题。本专利技术提供了一种基于深度学习的高光谱图像压缩方法,包括:步骤S1:选取预设数量的图像作为训练图像,将训练图像的尺寸大小随机裁剪为32×32大小作为训练集,其中,训练图像包括普通图像和高光谱图像;步骤S2:将训练集输入到预先搭建的压缩网络模型中,对压缩网络模型进行训练,获得训练后的压缩网络模型,其中,训练后的压缩网络模型包括编码网络、量化网络以及和解码网络;步骤S3:将待压缩图像输入训练后的压缩网络模型,通过编码网络提取待压缩图像的特征后得到编码后的特征图,通过量化网络对编码后的特征图进行量化计算,得到量化结果,将其作为压缩后的图像,且通过解码网络对量化结果的解码计算对压缩后的图像进行恢复。在一种实施方式中,步骤S2中训练过程采用的损失函数为:其中,N表示图像中像素点的个数,X为原始图像的像素点数值,Y为恢复图像的像素点数值。在一种实施方式中,编码网络包括输入层input、卷积层Conv2D、激活层PRelu、残差单元ResUnit、归一化层BatchNorm,步骤S3中通过编码网络提取待压缩图像的特征后得到编码后的特征图,包括:将待压缩的图像输入input层后,通过步长为2的Conv2D层将待压缩图像的尺寸变为原来的二分之一,得到第一特征图,然后进入PRelu层和ResUnit;第一特征图再次经过一个步长为2的Conv2D层,得到第二特征图,第二特征图的尺寸变为第一特征图的二分之一,再经过BatchNorm层和PRelu层;以此类推,经过三个Conv2D层之后,得到第三特征图的尺寸为待压缩图像的八分之一,最后通过一个Conv2D层调整特征图的数量,将第三特征图作为编码后的特征图。在一种实施方式中,量化网络包括一个卷积层、一个激活层Tanh和一个量化层,步骤S3中通过量化网络对编码后的特征图进行量化计算,得到量化结果,具体包括:将编码后的特征图输入到量化网络的卷积层,调整特征图的输出数量,然后进入Tanh层,将数据映射到(-1,1)的区间内,然后进入量化层进行量化计算,将小于或等于0的数据变为-1,把大于0的数据变为1,得到量化结果。在一种实施方式中,量化计算的量化公式为:其中,X表示图像特征图元素的值,Q(X)为量化后的结果。在一种实施方式中,解码网络包括上分支和下分支,步骤S3中解码网络对量化结果的解码计算对压缩后的图像进行恢复,具体包括:通过上分支对量化结果进行解码计算,得到第一解码结果;通过下分支对量化结果进行解码计算,得到第二解码结果;将第一解码结果和第二解码结果相加,得到恢复图像。基于同样的专利技术构思,本专利技术第二方面提供了一种基于深度学习的高光谱图像压缩装置,包括:预处理模块,用于选取预设数量的图像作为训练图像,将训练图像的尺寸大小随机裁剪为32×32大小作为训练集,其中,训练图像包括普通图像和高光谱图像;模型训练模块,用于将训练集输入到预先搭建的压缩网络模型中,对压缩网络模型进行训练,获得训练后的压缩网络模型,其中,训练后的压缩网络模型包括编码网络、量化网络以及和解码网络;图像压缩模块,用于将待压缩图像输入训练后的压缩网络模型,通过编码网络提取待压缩图像的特征后得到编码后的特征图,通过量化网络对编码后的特征图进行量化计算,得到量化结果,将其作为压缩后的图像,且通过解码网络对量化结果的解码计算对压缩后的图像进行恢复。本申请实施例中的上述一个或多个技术方案,至少具有如下一种或多种技术效果:本专利技术提供的一种基于深度学习的高光谱图像压缩方法,首先选取训练图像,将训练图像的尺寸大小随机裁剪为32×32大小作为训练集,然后把训练集输入到搭建好的的压缩网络模型中,开始网络模型的训练,训练完成后的压缩网络模型包括三个网络,分别为编码网络、量化网络和解码网络。得到压缩后网络模型后,就可以进行图像的压缩、量化和重建了。将待压缩的图像输入到编码模型中,根据编码模型的计算结果得到编码后的特征图,然后将编码后的特征图输入到量化网络模型中进行量化计算,得到码流即量化结果,也就是压缩后的图像,从而完成图像的压缩。并且,将量化后的结果输入到解码网络,通过解码网络的计算可以得到重建后的图像,即可以对压缩后的图像进行恢复。由于本专利技术的方法在选取训练图像时,将高光谱图像做了预处理,使得高光谱图像可以和普通图像一起作为模型的训练集,从而进行训练,使得本专利技术中的模型可以对高光谱图像进行处理,并且,通过设置包含三个网络的压缩模型,通过编码网络的编码后可以提取图像特征,将图像进行压缩,进一步地,通过量化网络的量化的作用,可以将浮点型数据变为整型数据,减少数据占用的比特数,从而可以进一步提升压缩效果。解决了现有技术中无法实现对高光谱图像的压缩或者压缩效果较差的技术问题。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术提供的一种基于深度学本文档来自技高网
...

【技术保护点】
1.一种基于深度学习的高光谱图像压缩方法,其特征在于,包括:步骤S1:选取预设数量的图像作为训练图像,将训练图像的尺寸大小随机裁剪为32×32大小作为训练集,其中,训练图像包括普通图像和高光谱图像;步骤S2:将训练集输入到预先搭建的压缩网络模型中,对压缩网络模型进行训练,获得训练后的压缩网络模型,其中,训练后的压缩网络模型包括编码网络、量化网络以及和解码网络;步骤S3:将待压缩图像输入训练后的压缩网络模型,通过编码网络提取待压缩图像的特征后得到编码后的特征图,通过量化网络对编码后的特征图进行量化计算,得到量化结果,将其作为压缩后的图像,且通过解码网络对量化结果的解码计算对压缩后的图像进行恢复。

【技术特征摘要】
1.一种基于深度学习的高光谱图像压缩方法,其特征在于,包括:步骤S1:选取预设数量的图像作为训练图像,将训练图像的尺寸大小随机裁剪为32×32大小作为训练集,其中,训练图像包括普通图像和高光谱图像;步骤S2:将训练集输入到预先搭建的压缩网络模型中,对压缩网络模型进行训练,获得训练后的压缩网络模型,其中,训练后的压缩网络模型包括编码网络、量化网络以及和解码网络;步骤S3:将待压缩图像输入训练后的压缩网络模型,通过编码网络提取待压缩图像的特征后得到编码后的特征图,通过量化网络对编码后的特征图进行量化计算,得到量化结果,将其作为压缩后的图像,且通过解码网络对量化结果的解码计算对压缩后的图像进行恢复。2.如权利要求1所述的方法,其特征在于,步骤S2中训练过程采用的损失函数为:其中,N表示图像中像素点的个数,X为原始图像的像素点数值,Y为恢复图像的像素点数值。3.如权利要求1所述的方法,其特征在于,编码网络包括输入层input、卷积层Conv2D、激活层PRelu、残差单元ResUnit、归一化层BatchNorm,步骤S3中通过编码网络提取待压缩图像的特征后得到编码后的特征图,包括:将待压缩的图像输入input层后,通过步长为2的Conv2D层将待压缩图像的尺寸变为原来的二分之一,得到第一特征图,然后进入PRelu层和ResUnit;第一特征图再次经过一个步长为2的Conv2D层,得到第二特征图,第二特征图的尺寸变为第一特征图的二分之一,再经过BatchNorm层和PRelu层;以此类推,经过三个Conv2D层之后,得到第三特征图的尺寸为待压缩图像的八分之一,最后通过一个Conv2D层调整特征图的数量,将第三特征图作...

【专利技术属性】
技术研发人员:种衍文李浩南潘少明
申请(专利权)人:武汉大学
类型:发明
国别省市:湖北,42

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1