当前位置: 首页 > 专利查询>河海大学专利>正文

基于多尺度空洞卷积注意力网络的高光谱影像分类方法技术

技术编号:32016326 阅读:19 留言:0更新日期:2022-01-22 18:34
本发明专利技术公开了一种基于多尺度空洞卷积注意力网络的高光谱影像分类方法,可以高效提取高光谱影像的特征,显著提高地物分类的精度。且分类性能较传统的2D

【技术实现步骤摘要】
基于多尺度空洞卷积注意力网络的高光谱影像分类方法


[0001]本专利技术涉及高光谱遥感影像分类领域,特别是涉及基于多尺度空洞卷积注意力网络的遥感影像分割算法。

技术介绍

[0002]近年来,深度学习研究受到了众多学者的重视。深度学习是机器学习的一个领域,随着计算机计算能力的提高、相对更加优化的算法提出与可用数据量的增加,深度学习领域内多种方法的性能得到了很大的提升,在很多领域得到了广泛应用。同时,深度学习在图像分类、图像分割等计算机视觉任务中表现出更高的有效性和更强的鲁棒性,在高光谱遥感图像分类领域也引起研究浪潮。堆叠式自动编码器(SAEs),深度信念网络(DBNs),卷积神经网络(CNNs),递归神经网络(RNNs),andGANs逐渐应用于HSIC领域。
[0003]卷积神经网络(CNNs)可以利用空间像素点及其邻域的信息,能有效地从原始数据中提取特征并进行高级抽象以实现优良的分类结果,因此多个基于2D

CNN的高光谱分类算法被提出用来处理HSIC任务,这些算法通过提高HSI空间信息利用率使分类性能得到提高。然而当2D

CNN网络深度增加时,网络面临退化问题,这对分类结果造成了一定的影响。因此结构更加优化更深层的卷积神经网络模型ResNet、DenseNets被提出,这些网络可以有效缓解过拟合现象引起图像分类领域的广泛关注,成为目前HSI分类领域研究应用较为广泛的几个模型。Song等人研究了基于残差学习的2D

CNN特征融合,为高光谱数据分类任务建立了一个更具鉴别能力的网络。然而,2D

CNN网络在完成高光谱遥感影像分类任务问题上存在丢失有效光谱信息的问题,这甚至可能在某些复杂场景下影响分类性能,因此研究者试图将3D

CNN网络应用于HSIC任务中。Zilong Zhong等人提出的SSRN算法将残差网络与3

D CNN结合,对HSI图像不做任何预处理直接输入SSRN中同时提取空

光谱特征进行分类任务,可以达到了很好的分类效果,但该方法设计的网络不仅计算量大,而且其对于HSI图像的光谱特征信息进行了一致的处理。Mou等人提出了一种基于残差学习的完全conv

deconv网络,旨在实现端到端的无监督光谱空间特征学习。除过拟合问题之外,HSIC还面临标记样本不足的问题。无论是2D

CNN还是3D

CNN,基本的CNN模型在探索光谱

空间域的HSI时往往直接找到模式的内在表征,而卷积层处理的特征可能包含许多无用或干扰的信息,如果这些无用的特征不经过任何处理直接发送到下一层,随着网络的不断深入,网络的学习效率会降低,最终会影响分类性能。因此,如何对卷积层后的特征图进行处理,并将注意力集中在那些包含大量有用信息的特征上,是HSI分类任务的另一个关键。

技术实现思路

[0004]专利技术目的:本专利技术的目的是提供一种能够解决现有技术中存在的缺陷的基于多尺度空洞卷积注意力网络的高光谱影像分类方法。
[0005]技术方案:本专利技术所述的基于多尺度空洞卷积注意力网络的高光谱影像分类方法,包括以下步骤:
[0006]S1:采用PCA技术对高光谱影像的光谱维进行降维处理,将实验中的原始数据集的光谱维使用PCA方法压缩至3维,在保留有效光谱信息的基础上大大减少数据量,从而达到减少训练时间的目的。之后将已降维数据进行标准差归一化处理。如公式(1)所示
[0007][0008]其中x

为进行标准差归一化后输出值,x为降维后的输入数据值,μ为数据集样本均值,σ为标准差。
[0009]S2:将上述标准差归一化后的数据作为待分类像元,而后以待分类像元为中心,提取出相应尺寸的待分类图像块(Patch)。这些图像块将会被输送到多尺度空洞卷积注意力网络模型中,此模型在传统多尺度CNN模型基础上进行了改进。它包含近远程特征提取模块及通道注意力模块。具体模型架构如图1所示。近

远程特征提取模块包含浅层特征预提取模块和多尺度特征提取模块,如图2所示。其中浅层特征提取模块为卷积核大小为1
×
1,3
×
3,5
×
5的集合,且每个卷积层都配置了批量归一化层(BN,Batch Normalization)和激活函数ReLU做加速训练和非线性化处理。在兼顾运算量与分类精度的前提下,多尺度特征提取模块选取堆叠4个尺寸不同滤波器来获得图像丰富的深层特征信息。其中图像的近程特征信息通过卷积核大小为1
×
1和3
×
3的普通卷积捕获,图像的远程特征信息由卷积核大小为5
×
5(空洞率为2)和7
×
7(空洞率为3)获取,最后通过特征融合的方式来获得图像丰富的特征信息。近

远程特征提取模块充分利用了各级卷积层提取的特征图,最大程度上避免有效信息的丢失,加入空洞卷积降低了训练参数,使得整体模型更加轻量化。本方法将3个近

远程特征提取模块的卷积核数目依次设置为为32,64,128,借鉴DenseNet中transition layer的思想,在相邻特征图之间加入1
×
1卷积层进行特征提取层之间的连接,在保证特征信息完整传输的同时大大减少了网络的运算量。1
×
1卷积层之后添加卷积核尺寸为2
×
2的平均池化层抑制过拟合现象,并维持较低的训练参数。最后将最后一个近远程特征提取模块得到的特征图输入到通道注意力模块中来重构特征信息,使特征图中每个像素点的特征信息更具判别力。
[0010]S3:进行模型的训练,将训练样本输入到上述模型中。本方法训练过程中使用dropout方法随机隐藏全连接层中的部分神经元(隐藏概率为0.5),该方法可以有效地抑制过拟合现象,一定程度上实现了正则化,增加了对激活函数输出数据的掌控力。
[0011]S4:待多尺度空洞卷积注意力网络经过样本训练之后,将测试样本输入到网络中进行测试样本的分类。本方法中每个卷积层之后均添加BN层和Relu激活函数,并通过Softmax分类器产生最终标签。模型选用交叉熵作为损失函数,使用SGD with momentum优化算法,确保损失迅速收敛至全局最小。
[0012]有益效果:
[0013]有效地降低特征维数,通过自适应地增强对分类任务提供有用特征信息的作用,提取到丰富且有效的特征信息,在小样本情况下分类性能更为出色,且就模型的分类能力和分类精度较传统的2D

CNN、3D

CNN模型相比,有明显优势。
附图说明
[0014]图1为多尺度空洞卷积注意力网络(PMACNN)架构;
[0015]图2为近

远程特征提取模块示意图;
[0016]本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.基于多尺度空洞卷积注意力网络的高光谱影像分类方法,其特征在于:包括以下步骤:S1:采用PCA技术对高光谱影像的光谱维进行降维处理,将实验中的原始数据集的光谱维使用PCA方法压缩至3维,在保留有效光谱信息的基础上大大减少数据量,从而达到减少训练时间的目的,之后将已降维数据进行标准差归一化处理,如公式(1)所示其中x

为进行标准差归一化后输出值,x为降维后的输入数据值,μ为数据集样本均值,σ为标准差;S2:将上述标准差归一化后的数据作为待分类像元,而后以待分类像元为中心,提取出相应尺寸的待分类图像块(Patch),这些图像块将会被输送到多尺度空洞卷积注意力网络模型中,此模型在传统多尺度CNN模型基础上进行了改进,它包含近远程特征提取模块及通道注意力模块,具体模型架构如图1所示,近

远程特征提取模块包含浅层特征预提取模块和多尺度特征提取模块,如图2所示,其中浅层特征提取模块为卷积核大小为1
×
1,3
×
3,5
×
5的集合,且每个卷积层都配置了批量归一化层(BN,BatchNormalization)和激活函数ReLU做加速训练和非线性化处理,在兼顾运算量与分类精度的前提下,多尺度特征提取模块选取堆叠4个尺寸不同滤波器来获得图像丰富的深层特征信息,其中图像的近程特征信息通过卷积核大小为1
×
1和3
×
3的普通卷积捕获,图像的远程特征信息由卷积核大小为5
×
5(...

【专利技术属性】
技术研发人员:杨琪
申请(专利权)人:河海大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利