遥感图像识别方法、装置、计算机设备和存储介质制造方法及图纸

技术编号：37400857 阅读：17 留言：0更新日期：2023-04-30 09:28

本申请涉及图像识别技术领域的一种遥感图像识别方法、装置、计算机设备和存储介质。该方法包括获取遥感图像，并对其进行标注，得到训练样本，构建遥感图像识别模型，该模型包括：卷积分块器模块、特征提取网络以分类网络，特征提取网络包括4个stage，第一个stage采用sandglass

全部详细技术资料下载

【技术实现步骤摘要】
遥感图像识别方法、装置、计算机设备和存储介质

[0001]本申请涉及图像识别
，特别是涉及一种遥感图像识别方法、装置、计算机设备和存储介质。

技术介绍

[0002]在遥感图像的解译中，最重要的是图像信息的识别。遥感图像记录了丰富的影像信息、复杂的场景构成和地物要素细节的特点。近几年来，基于Transformer结构的模型(例如ViT(Vision Transformer))在很多场景中的性能已经超过了之前的卷积网络，但与此同时也引入了很大的参数量，因此不适用于进行遥感图像的分类。
[0003]MobileNeXt是一个轻量级的卷积神经网络模型，它提出了沙漏块，将深度卷积和shortcut建立在高维度上这样能学习到更多样的高维度特征，有效地提高了网络性能，但其与基于Transformer的模型相比仍有一定差距；Conv
‑
Mixer的作者提出ViT架构带来强大性能不仅仅是源自Transfomer的自注意力机制，还某种程度上是由于使用patch作为输入来实现的，但他在整个网络中图像的大小和分辨率没有改变，造成计算复杂度和内存消耗很大；Yu等人提出将Transformer中的注意力模块替换为池化等其他操作，效果依然达到了Transformer的97％，因此采用token Mixer和channel MLP作为通用架构，就可以得到不错的结果，但该网络缺少对token Mixer模块设计的探索；ConvMLP是一个用于视觉识别的轻量级、阶段性、具备卷积层和MLP的联合网络，但其对深层信息的提取不...

【技术保护点】

【技术特征摘要】
1.一种遥感图像识别方法，其特征在于，所述方法包括：获取遥感图像，并对所述遥感图像进行标注，得到训练样本；构建遥感图像识别模型，所述遥感图像识别模型包括：卷积分块器模块、特征提取网络以分类网络；卷积分块器模块用于采用卷积模块将训练样本划分为多个图像小块，所述特征提取网络包括：4个stage，第一个stage采用sandglass
‑
CA模块增加空间连接，提取多个图像小块的空间坐标特征；第二个stage采用DWformer模块中的卷积核大小为3的深度卷积和通道多层感知机分别学习所述空间坐标特征的空间信息和通道维度的信息；第三个stage采用DWformer模块学习第二stage输出特征的空间信息和通道维度信息；所述第四个stage采用LKDWFormer模块中的卷积核大小为9的深度卷积和通道多层感知机学习第三stage输出特征的空间信息和通道维度信息，得到图像特征；所述分类网络用于根据所述图像特征进行遥感图像分类，得到分类预测结果；根据将所述训练样本输入到所述遥感图像识别模型中得到的分类预测结果，以及训练样本的标注对所述遥感图像识别模型进行训练，得到训练好的遥感图像识别模型；将获取的待测遥感图像输入到训练好的遥感图像识别模型，得到待测遥感图像的分类结果。2.根据权利要求1所述的方法，其特征在于，所述卷积分块器模块包括：3个依次连接的卷积模块，第一个和第二个卷积模块包括3
×
3卷积层、批标准化层和ReLU激活函数；第三个卷积模块包括3
×
3卷积层、批标准化层、ReLU激活函数和最大池化层；根据将所述训练样本输入到所述遥感图像识别模型中得到的分类预测结果，以及训练样本的标注对所述遥感图像识别模型进行训练，得到训练好的遥感图像识别模型，包括：将所述训练样本输入到所述卷积分块器模块中，采用三个卷积模块将所述训练样本划分为多个图像小块；将多个所述图像小块输入到所述特征提取网络中，得到图像特征；将所述图像特征输入到所述分类网络中，得到分类预测结果；根据所述分类预测结果和训练样本的标注对所述遥感图像识别模型进行反向训练，得到训练好的遥感图像识别模型。3.根据权利要求2所述的方法，其特征在于，所述特征提取网络还包括：3个卷积下采样层；将多个所述图像小块输入到所述特征提取网络中，得到图像特征，包括：将所述图像小块输入到第一个stage中，并将得到的特征输入到第一个卷积下采样层中，得到空间坐标特征；将所述空间坐标特征输入到第二个stage中，并将得到的输出特征输入到第二个卷积下采样层中，得到第二stage输出特征；将所述第二stage输出特征输入到第三个stage中，并将得到的输出特征输入到第三个卷积下采样层中，得到第三stage输出特征；将所述第三stage输出特征输入到第四个stage中，得到图像特征。4.根据权利要求3所述的方法，其特征在于，第一个stage包括：2个sandglass
‑
CA模块；其中，sandglass
‑
CA模块由sandglass模块和坐标注意力模块构成；所述sandglass模块包括：第一深度卷积层、第一点卷积层、第二点卷积层以及第二深度卷积层；
将所述图像小块输入到第一个stage中，并将得到的特征输入到第一个卷积下采样层中，得到空间坐标特征，包括：将所述图像小块输入到第一个sandglass
‑
CA模块的sandglass模块中，经过第一深度卷积层后采用ReLU6函数激活，得到空间信息特征；将所述空间信息特征输入到第一个sandglass
‑
CA模块的坐标注意力模块中，输出空间坐标注意力特征；将所述空间信息特征和所述空间坐标注意力特征在空间维度上进行拼接，得到第一中间特征；将所述第一中间特征经过第一个sandglass
‑
CA模块的sandglass模块的第一点卷积层、第二点卷积层处理后，并将得到的结果经过第一个sandglass
‑
CA模块的sandglass模块的第二深度卷积层进行处理，得到第二中间特...

【专利技术属性】
技术研发人员：王威，孙钰洁，王新，李骥，
申请(专利权)人：长沙理工大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人