本发明专利技术涉及一种基于自适应L
【技术实现步骤摘要】
基于自适应L
‑
BFGS算法的高光谱图像分类方法
[0001]本专利技术涉及高光谱图像处理
,尤其是指一种基于自适应 L
‑
BFGS算法的高光谱图像分类方法。
技术介绍
[0002]高光谱图像(HSI)分类是通过为每个像元分配单个标签来区分不同的地物,在森林勘察、城市检测和土地覆盖制图等领域得到了广泛应用。高光谱图像是典型的三维立方体数据,其具有两个空间维度和一个光谱维度,前者描述地物目标的空间位置信息,后者描述地物目标在不同波长下光谱反射率的变化曲线。因此,高光谱图像包含丰富的空间特征和光谱特征。但由于高光谱图像中各波段之间相关性过强,导致波段间冗余信息较多,这阻碍了重要信息的挖掘与表达。
[0003]目前主流方式是通过特征提取将像元映射到特定子空间中,通过这种映射减少波段之间的强关联性,得到蕴含丰富判别信息的嵌入特征,提升像元的可识别能力。考虑到高光谱图像具有“图谱合一”的优势,即像元的空间信息与光谱信息具有一致性,现有技术中高光谱图像分类方法一般可分为光谱特征分类方法和空谱特征分类方法。
[0004]光谱特征分类方法通过设计符合高光谱像元结构的深度网络模型来挖掘光谱曲线内存在的重要判别信息,在这类方法中均不考虑像元的空间信息。经典的高光谱图像特征分类网络模型包括自动编码器(Auto
‑
encoder, AE)、变分自动编码器(Variational Auto
‑
encoder,VAE)、长短期记忆网络(Long Short
‑
term Memory,LSTM)、生成对抗网络(Generative AdversarialNetwork,GAN)等等。这类模型所提取到的特征较为单一,无法充分发挥高光谱图像的优势。
[0005]随着计算机处理与分析能力的提升,训练空谱特征分类网络模型的速度也大幅度提高,因此目前主流方法是空谱特征分类方法。高光谱图像中的空间特征描述像元的具体空间位置,光谱信息描述了高光谱图像中像元在各波长下光谱反射率组成的连续光谱曲线。空谱特征分类方法一般采用多个映射网络来得到空间特征与光谱特征,并利用特征融合模块来实现不同模态特征间的联合表达。采用空谱特征联合的方式提升像元信息的完整程度,通过构造多流深度网络模型实现多传感器数据融合的目的。比较常用的深度网络模型是卷积神经网络,通过对像元的局部邻域信息进行卷积操作可以实现从局部到全局的优化。这类方法往往需要处理大量的高光谱像元,且随着空间信息选择范围的增加,信息量逐渐增大,常规的网络优化算法难以快速收敛到稳定结果。
[0006]现有研究中为提升高光谱图像特征分类结果的性能,对网络优化算法进行改进。目前,人们主要利用一阶优化算法对网络参数进行优化,但一阶优化算法收敛速度较慢,且容易陷入局部最优点,将其应用到高光谱图像特征分类网络模型的训练中难以发挥高光谱图像的数据优势。而常用的二阶优化算法虽然收敛速度较快且精度较高,但所消耗的内存资源是巨大的。中国专利技术专利CN113705724A中公开了一种自适应的L
‑
BFGS算法,利用二阶优化算法的批量学习方法,大大减小了存储量,收敛速度和准确率明显提升,适于处理高光
谱图像特征。
技术实现思路
[0007]为此,本专利技术所要解决的技术问题在于克服现有技术中在高光谱图像分类场景下网络模型收敛速度慢、易陷入局部最优点等缺点,提出一种针对高光谱图像的分类方法,用于快速且准确地提取高光谱图像的空间特征和光谱特征,该方法通过空谱特征映射来挖掘重要判别信息,通过特征融合模块实现空谱联合的目的,并采用改进二阶优化算法快速准确地达到收敛状态。
[0008]为解决上述技术问题,本专利技术提供了基于自适应L
‑
BFGS算法的高光谱图像分类方法,其特征在于,包括如下步骤:
[0009]S10:数据预处理:
[0010]获取高光谱图像的像元数据及对应的空间数据形成输入样本二和输入样本一;
[0011]将输入样本一和输入样本二分别打乱,从每个输入样本中抽取部分形成训练样本一和训练样本二;
[0012]S20:构建深度网络模型:
[0013]深度网络模型包括空间特征提取模块一、空间特征提取模块二、光谱特征提取模块和分类模块,利用卷积层和长短期记忆网络层分别对空间特征提取模块一、空间特征提取模块二处理得到第一输出和第二输出,利用全连接层对光谱特征提取模块处理得到第三输出,对输出结果进行融合;
[0014]将融合结果输入分类模块,得到第四输出;
[0015]S30:训练网络模型:
[0016]每次从训练样本一和训练样本二中选取小批量训练样本一和小批量训练样本二,将小批量训练样本一作为空间特征提取模块一、将小批量训练样本一进行变换作为空间特征提取模块二、将小批量训练样本二作为光谱特征提取模块输入到步骤S20的深度网络模型中,得到全部输出,并根据上述输出计算损失函数L;
[0017]利用L
‑
BFGS算法,对网络参数进行训练,直至网络收敛;训练过程中,自适应选择K
*
个记忆尺度,其中K
*
=argmin
1≤K≤M
{Q
K
},
[0018][0019]S40:生成分类结果:
[0020]基于训练好的深度网络模型,将输入样本一和输入样本二进行输入,得到所有高光谱像元的类别标签。
[0021]在本专利技术的一个实施例中,训练过程中,根据K
*
个记忆尺度,计算出K
*
个方向并以混合方向作为搜索方向。
[0022]在本专利技术的一个实施例中,训练过程中,深度网络模型中的参数根据下式进行更新:
[0023]x
t+1
=x
t
+μ
t
⊙
d
t
[0024]其中,μ
t
为步长即学习率,且β是衰减率,η是初始步长,ε是常数。
[0025]在本专利技术的一个实施例中,对步骤S10中的高光谱图像进行归一化预处理,且归一化预处理中取值范围在
‑
1到1之间,归一化公式如下:
[0026][0027]其中x
min
表示高光谱像元数据中最小值,x
max
表示高光谱像元数据中最大值。
[0028]在本专利技术的一个实施例中,分类模块中网络层个数为n,网络中分类模块最后一层的激活函数为Sigmoid激活函数,其他网络层使用的激活函数均为 Tanh激活函数。
[0029]在本专利技术的一个实施例中,Sigmoid激活函数计算公式为:Tanh激活函数计算公式为:
[0030]在本专利技术的一个实施例中,损失函数的计算公式为:
[0031]L=L
cls
+L
KL1
+L
KL2
...
【技术保护点】
【技术特征摘要】
1.基于自适应L
‑
BFGS算法的高光谱图像分类方法,其特征在于,包括如下步骤:S10:数据预处理:获取高光谱图像的像元数据及对应的空间数据形成输入样本二和输入样本一;将输入样本一和输入样本二分别打乱,从每个输入样本中抽取部分形成训练样本一和训练样本二;S20:构建深度网络模型:深度网络模型包括空间特征提取模块一、空间特征提取模块二、光谱特征提取模块和分类模块,利用卷积层和长短期记忆网络层分别对空间特征提取模块一、空间特征提取模块二处理得到第一输出和第二输出,利用全连接层对光谱特征提取模块处理得到第三输出,对输出结果进行融合;将融合结果输入分类模块,得到第四输出;S30:训练网络模型:每次从训练样本一和训练样本二中选取小批量训练样本一和小批量训练样本二,将小批量训练样本一作为空间特征提取模块一、将小批量训练样本一进行变换作为空间特征提取模块二、将小批量训练样本二作为光谱特征提取模块输入到步骤S20的深度网络模型中,得到全部输出,并根据上述输出计算损失函数L;利用L
‑
BFGS算法,对网络参数进行训练,直至网络收敛;训练过程中,自适应选择K
*
个记忆尺度,其中K
*
=argmin
1≤K≤M
{Q
K
},S40:生成分类结果:基于训练好的深度网络模型,将输入样本一和输入样本二进行输入,得到所有高光谱像元的类别标签。2.根据权利要求1所述的基于自适应L
‑
BFGS算法的高光谱图像分类方法,其特征在于:训练过程中,根据K
*
个记忆尺度,计算出K
*
个方向并以混合方向作为搜索方向。3.根据权利要求2所述的基于自适应L
‑
BFGS算法的高光谱图像分类方法,其特征在于:训练过程中,深度网络模型中的参数根据下式进行更新:x
t+1
=x
t
+μ
t
⊙
d
t
其中,μ
t
为步长即学习率,且β是衰减率,η是初始步长,ε是常数。4.根据权利要求1所述的基于自适应L
‑
BFGS算法的高光谱图像分类方法,其特征在于:对步骤S10中的高光谱图像进行归一化预处理,且归一化预处理中取值范围在
‑
1到1之间,归一化公式如下:
其中x
min
表示高光谱像元数据中最小值,x
max
表示高光...
【专利技术属性】
技术研发人员:黄鹤,于文博,王俊,
申请(专利权)人:苏州大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。