基于多尺度注意力和双编码器的遥感图像语义分割方法技术

技术编号：40306170 阅读：7 留言：0更新日期：2024-02-07 20:51

本发明专利技术涉及基于多尺度注意力和双编码器的遥感图像语义分割方法，属于遥感图像语义分割技术领域。将Swin Transformer嵌入到基于CNN的残差网络中，形成并行的双编码器。关系聚合模块作为桥梁传递信息，利用全局特征引导主编码器获得更多的判别特征。通过具有高效通道注意力模块的多尺度跳跃连接，以利用多尺度特征并获得通道间的关系。位置注意力模块，获取任意两个位置特征图之间的空间依赖性，提高类内相关性和语义一致性。搭建基于多尺度注意力和双编码器的遥感图像语义分割网络模型。本发明专利技术有效的改善了语义分割中类内差异大，类间差异小等问题，显著得提高了语义分割模型的性能。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术属于遥感图像语义分割，涉及基于多尺度注意力和双编码器的遥感图像语义分割方法。

技术介绍

1、随着现代遥感技术的发展，人们获取到了大量的高质量的，高分辨率的遥感图像。这些高分辨率的遥感图像包含了大量的信息，包括大量的空间细节信息，可以为提取与识别提供数据支持。遥感图像语义分割是将图像中的每一个像素点归结到特定类别中的一项基本任务。高分辨率的遥感图像使得地物信息的提取和识别更加互联。基于遥感图像的地物提取和识别已经广泛应用于城市建设、城市规划、数字城市等领域。

2、随着遥感图像技术的不断发展，针对遥感图像的处理变得越来越重要，图像分割是其重要的研究方向之一。不管是自然图像还是遥感图像，图像分割都是在像素级别上进行分类，为每个像素分配一个标签。由此，遥感图像具有分辨率高、内容复杂度和像素误差增大，由于其图像内容复杂度高，从而在实际应用时对分割精度要求更高。全局上下文信息对于遥感图像的语义分割是必不可少的。然而，现有的大多数方法依赖于卷积神经网络(cnn)，由于卷积运算的局部性，直接获得全局上下文是具有挑战性的。

技术实现思路

1、有鉴于此，本专利技术的目的在于提供基于多尺度注意力和双编码器的遥感图像语义分割方法。为达到上述目的，本专利技术提供如下技术方案：

2、基于多尺度注意力和双编码器的遥感图像语义分割方法，该方法包括以下步骤：

3、s1：收集高分辨率遥感影像的原始数据集，并将其划分为训练样本与测试样本；

4、s2：对上述高分辨

5、所述预处理为遥感影像数据增强；

6、s3：搭建基于多尺度注意力和双编码器的遥感图像语义分割网络模型，包括将辅助编码器嵌入到主编码器中；构成一种新型的并行的双编码器结构，通过关系聚合模块建立两个编码器之间的联系，通过跳跃连接实现多尺度语义信息的融合；

7、s4：利用训练数据集对所描述的多尺度注意力和双编码器的遥感图像语义分割网络模型进行监督训练，获得相应语义分割模型；

8、s5：利用s4所获得的语义分割模型对测试样本集中的遥感影像进行推理预测，得到最后的分割结果。

9、可选的，所述s3中，多尺度语义分割采用并行的编码范式结构，具体搭建流程为：

10、s3.1.1：搭建双编码器：构建基于cnn的的残差网络和swin transformer组成的双编码器；设计位置注意力模块和特征压缩模块来提高swin transformer的性能，设计一个关系聚合模块建立两个编码器之间的连接，引入两种规则窗口配置w-msa和移位窗口配置sw-msa，在连续的swin transformer中交替执行w-msa和sw-msa，以增强跨窗口的信息连接，以下将采用两个块简写w-trans和sw-trans的方式，

11、

12、

13、

14、

15、其中sl表示w-trans块的输出特征，sl+1表示sw-trans块的输出特征，mlp为多层感知器，ln为层归一化；

16、s3.1.2：搭建特征解码器：每一级解码器都可以融合不同尺度的语义信息，通过具有高效通道注意力的跳跃连接来捕获多尺度的语义信息，既提取了细粒度的细节信息，又提取了粗粒度的语义信息；

17、s3.1.3：高效通道注意力模块：每一个解码器获得五个相同大小和分辨率的特征图，减少通道数，引入高效通道注意力机制，在全局平均池化之后，通过考虑每个通道及其k个邻居来捕获局部跨通道交互；高效通道注意力模块通过大小为k的快速一维卷积实现；其中内核大小k表示局部跨通道交互的覆盖范围，即有多少邻居参与一个通道的注意力预测；为避免通过交叉验证手动调整k，引入自适应确定k的方法，其中交互的覆盖范围与通道维度成正比，交互的覆盖范围为内核大小k；该模块以有效的方式捕获跨通道交互，其中|t|odd表示t最接近的奇数，c为给定的通道维度，γ和b是设置的常数；通过映射ψ，使用非线性映射，高维通道具有较长的相互作用距离，而低维通道具有较短的相互作用范围。

18、可选的，所述并行的编码器通过关系聚合模块作为桥梁传输信息，利用全局特征引导主编码器获得更多的判别特征；通过跳跃连接捕获不同尺度的特征，以处理不同尺度和语境的数据。

19、可选的，所述s4具体为：

20、s4.1：将制作的训练数据集输入到多尺度注意力和双编码器的遥感图像语义分割模型，通过自动化特征提取与模型预测，得到相应的多尺度语义分割预测结果；

21、s4.2：根据语义分割模型的预测结果与制作标签真值进行对比，利用损失函数进行计算；本专利技术采用的是交叉熵损失与dice损失结合，所述损失函数为：l＝lce+ldice；

22、s4.3：采用adam优化算法，最小化s4.2中的损失函数，通过反向传播实现模型参数迭代更新；

23、s4.4：重复s4.1～4.3，直至模型收敛，获得最终语义分割模型。

24、可选的，所述s4.3具体为：

25、s4.3.1：计算迭代次数t下的梯度：其中θ表示模型参数，表示梯度算子符号；

26、s4.3.2：计算梯度的一阶矩估计vt与二阶矩估计nt：vt＝β1vt-1+β1-β1)gt，其中β1与β2分别为一阶矩和二阶矩的指数衰减率；

27、s4.3.3：对vt与nt进行偏差修正，得到与

28、s4.3.4：参数更新：其中η为学习率，ε是为维持数值稳定而添加的常数。

29、可选的，所述s5具体为：

30、s5.1：对测试样本待语义分割图像进行处理；

31、s5.2：利用s4所获得的语义分割模型对s5.1处理后的遥感影像进行处理，得到最终的语义分割结果

32、本专利技术的有益效果在于：构建了一种新型的并行的双编码器结构，通过关系聚合模块建立两个编码器之间的联系，利用全局特征引导主编码器获得更多的判别特征。通过具有高效通道注意力的跳跃连接融合不同尺度的语义信息，使得模型更好地融合语义信息，提高语义分割的精度。

33、本专利技术的其他优点、目标和特征在某种程度上将在随后的说明书中进行阐述，并且在某种程度上，基于对下文的考察研究对本领域技术人员而言将是显而易见的，或者可以从本专利技术的实践中得到教导。本专利技术的目标和其他优点可以通过下面的说明书来实现和获得。

本文档来自技高网...

【技术保护点】

1.基于多尺度注意力和双编码器的遥感图像语义分割方法，其特征在于：该方法包括以下步骤：

2.根据权利要求1所述的基于多尺度注意力和双编码器的遥感图像语义分割方法，其特征在于：所述S3中，多尺度语义分割采用并行的编码范式结构，具体搭建流程为：

3.根据权利要求2所述的基于多尺度注意力和双编码器的遥感图像语义分割方法，其特征在于：所述并行的编码器通过关系聚合模块作为桥梁传输信息，利用全局特征引导主编码器获得更多的判别特征；通过跳跃连接捕获不同尺度的特征，以处理不同尺度和语境的数据。

4.根据权利要求2所述的基于多尺度注意力和双编码器的遥感图像语义分割方法，其特征在于：所述S4具体为：

5.根据权利要求4所述的基于多尺度注意力和双编码器的遥感图像语义分割方法，其特征在于：所述S4.3具体为：

6.根据权利要求1所述的基于多尺度注意力和双编码器的遥感图像语义分割方法，其特征在于：所述S5具体为：

【技术特征摘要】

1.基于多尺度注意力和双编码器的遥感图像语义分割方法，其特征在于：该方法包括以下步骤：

2.根据权利要求1所述的基于多尺度注意力和双编码器的遥感图像语义分割方法，其特征在于：所述s3中，多尺度语义分割采用并行的编码范式结构，具体搭建流程为：

3.根据权利要求2所述的基于多尺度注意力和双编码器的遥感图像语义分割方法，其特征在于：所述并行的编码器通过关系聚合模块作为桥梁传输信息，利用全局特征引导主编码器获得...

【专利技术属性】
技术研发人员：袁正午，邵文，唐培贤，张凡，杨智威，
申请(专利权)人：重庆邮电大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人