【技术实现步骤摘要】
一种嵌入注意力机制的迭代聚合神经网络高分遥感场景分类方法
本专利技术属于图像处理领域,尤其涉及一种嵌入注意力机制的迭代聚合神经网络高分遥感场景分类方法。
技术介绍
高分辨率遥感图像场景分类是根据遥感图像的内容,用一组语义类别对其进行标注。近年来,高分辨率遥感图像的场景分类因其在自然灾害探测、土地覆盖与土地利用分类、地理空间目标检测、地理图像检索、城市规划、环境监测等领域的广泛应用而变得越来越重要。在早期的工作中,手工制作的特征在这项工作中应用最为广泛,并得到了深入的研究,如颜色直方图、尺度不变特征变换(SIFT)和方向梯度直方图(HOG)。这些方法严重依赖专业技能和领域专业知识来设计各种特征,使得它们的适应性和表达能力不够强。同时,这些方法通常需要中间层的编码器作为辅助,如著名的视觉单词包(BoVW)、fisher矢量(FV)编码和空间金字塔匹配(SPM)。但是,随着这项工作的难度越来越大,上述方法已经不能满足需求。在深度神经网络强大的特征学习能力的推动下,由深度学习驱动的遥感图像场景分类引起了人们的极大关注,并取得了重大突破。鉴于这一领域的迅速发展,基于深度学习的高分辨率遥感图像场景分类方法主要有:(1)基于自动编码器的场景分类方法;(2)基于卷积神经网络的场景分类方法;(3)基于生成对抗网络的场景分类方法。公开号CN108399366A一种遥感图像场景的分类系统,包括采集步骤、灰度处理器、拟合步骤、边缘检测步骤、遥感图像像素分类步骤及神经网络训练器;通过对原始遥感图像进行采集作为样本并传输
【技术保护点】
1.一种嵌入注意力机制的迭代聚合神经网络高分遥感场景分类方法,其特征在于:该方法包括以下步骤:/n(1)构建遥感场景图像样本数据集,并制作相应的样本类别标签集合,将遥感场景图像样本数据集分为训练集Train和测试集Test;/n(2)构建带注意力机制的迭代聚合网络,将遥感图像作为网络的输入,得到图像的特征图以及特征向量,通过平均池化得到降维后的特征图,使用基于softmax激活函数的全连接层作为分类器,输出分类结果;/n(3)设定训练次数,构建损失函数,使用训练集对所构建的迭代聚合网络进行训练,更新网络参数,直到参数取值收敛;收敛条件为损失函数值不再减小;/n(4)将测试集输入到训练好的网络中得到测试集的分类识别结果。/n
【技术特征摘要】
1.一种嵌入注意力机制的迭代聚合神经网络高分遥感场景分类方法,其特征在于:该方法包括以下步骤:
(1)构建遥感场景图像样本数据集,并制作相应的样本类别标签集合,将遥感场景图像样本数据集分为训练集Train和测试集Test;
(2)构建带注意力机制的迭代聚合网络,将遥感图像作为网络的输入,得到图像的特征图以及特征向量,通过平均池化得到降维后的特征图,使用基于softmax激活函数的全连接层作为分类器,输出分类结果;
(3)设定训练次数,构建损失函数,使用训练集对所构建的迭代聚合网络进行训练,更新网络参数,直到参数取值收敛;收敛条件为损失函数值不再减小;
(4)将测试集输入到训练好的网络中得到测试集的分类识别结果。
2.根据权利要求1所述的嵌入注意力机制的迭代聚合神经网络高分遥感场景分类方法,其特征在于:所述步骤(1),构建样本集合和集合分类方法如下:
(1.1)构建遥感场景图像样本数据集Image=[Image1,…,Imagei,…,ImageN],并制作相应的样本标签Label=[Label1,…,Labeli,…,LabelN],其中N表示N类遥感场景图像,Imagei表示第i类遥感场景图像的集合,Labeli表示第i类遥感场景图像的标签;
(1.2)将数据集分为训练集Train和测试集Test,针对数据集中每类遥感影像,设其样本总数为n,从中随机抽取m张图像构建训练集,其余n-m张图像构建测试集;则有:Train=[Train1,…,Traini,…,TrainN],Test=[Test1,…,Testi,…,TestN];其中Traini为第i类遥感影像的训练集合,包含m张图像,Testi为第i类遥感影像的测试集合,包含n-m张图像。
3.根据权利要求1或2所述的嵌入注意力机制的迭代聚合神经网络高分遥感场景分类方法,其特征在于:所述步骤(2),带注意力机制的迭代聚合网络结构如下:
(2.1)在输入层中,将每一个遥感场景图像归一化为256×256大小;
(2.2)第一个迭代聚合模块包括卷积1-1、卷积1-2、卷积1-3、卷积2-1、卷积2-2、卷积3-1这六个卷积层,均定义32个尺寸为3×3的卷积核,设定步长为1,填充模式设置为SAME,激活函数设置为Relu;其中,各卷积层连接结构如下:
卷积1-1的输出同时送到卷积1-2和卷积2-1,送到卷积1-2的特征不经过SE模块处理,送到卷积2-1的特征要经过SE模块处理;卷积1-2的输出同时送到卷积1-3和卷积2-2,送到卷积1-3的特征不经过SE模块处理,送到卷积2-2的特征要经过SE模块处理;
卷积2-1接收来自卷积1-1通过SE模块处理后的结果和卷积1-2通过SE模块处理后的结果,并通过合并的方式将两个输入的特征映射堆叠在一起,经过SE模块处理后送到卷积3-1;卷积2-2接收来自卷积1-2通过SE模块处理后的结果和卷积1-3通过SE模块处理后的结果,并通过合并的...
【专利技术属性】
技术研发人员:王鑫,段林,吕国芳,严勤,石爱业,
申请(专利权)人:河海大学,
类型:发明
国别省市:江苏;32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。