一种基于CNN和ViT混合结构神经网络的遥感图像语义分割方法技术

技术编号:43817029 阅读:62 留言:0更新日期:2024-12-27 13:30
本发明专利技术涉及遥感图像技术领域,提出了一种基于CNN和ViT混合结构神经网络的遥感图像语义分割方法,提出了一种全新的CTLG‑Net。CTLG‑Net采用新的CNN‑Transformer混合结构,通过卷积操作利用土地利用和土地覆被的空间信息,解决ViT网络不能处理大尺度信息的问题,更好地进行土地利用和土地覆被的细节和全局语义特征提取。同时,设计了一种MACVF模块,以增强有效特征交互和信息融合,有效提高了土地利用和土地覆被信息的提取精度。此外,通过改进解码器结构,采用跳跃连接和本文提出的ViT to Feature结构进行上采样操作恢复特征图的空间细节。相比一般的ViT网络,CTLG‑Net能够有效提高土地利用和土地覆被局部信息和全局信息的提取能力。

【技术实现步骤摘要】

本专利技术涉及遥感图像,尤其涉及一种基于cnn和vit混合结构神经网络的遥感图像语义分割方法。


技术介绍

1、相较于传统的cnn模型,视觉vit模型采用自注意力机制和多头注意力机制处理全局依赖关系,能捕捉到图像中不同像素之间的远程依赖关系,有助于提高模型对复杂场景地物的表示能力,使得每个像素能够感知和聚焦于图像中的重要信息,提高了模型的解释性和可视化能力。研究人员将semantic segmentation transformer(setr),利用vit作为编码器直接应用到图像语义分割中,随后swin transformer引入了层次化的transformer结构,通过使用局部窗口内的自注意力机制,有效地减少了计算复杂度。同时保持了对全局信息的捕捉能力,随着遥感相关研究的不断深入,研究学者将改进和优化的vit应用到遥感影像中的土地利用和土地覆被信息提取中,这些创新的方法均取得了较好的结果。

2、然而,vit在进行遥感影像土地利用和土地覆被信息提取时,也面临着一系列亟待解决的问题。特别是对于大尺度的遥感影像,由于transformer自身结构固定本文档来自技高网...

【技术保护点】

1.一种基于CNN和ViT混合结构神经网络的遥感图像语义分割方法,其特征在于:包括如下操作步骤:

2.根据权利要求1所述的一种基于CNN和ViT混合结构神经网络的遥感图像语义分割方法,其特征在于:Step1中CTLG-Net编码结构主要用于遥感影像特征提取,将输入的特征图Xi-1通过3×3卷积操作,批归一化和ReLU激活函数激活,得到新的特征图Xi,逐渐较少特征图的尺寸,扩大感受野,获取不同类型尺度的特征信息,CTLG-Net的特征提取过程如下公式所示:

3.根据权利要求2所述的一种基于CNN和ViT混合结构神经网络的遥感图像语义分割方法,其特征在于:Step3中...

【技术特征摘要】

1.一种基于cnn和vit混合结构神经网络的遥感图像语义分割方法,其特征在于:包括如下操作步骤:

2.根据权利要求1所述的一种基于cnn和vit混合结构神经网络的遥感图像语义分割方法,其特征在于:step1中ctlg-net编码结构主要用于遥感影像特征提取,将输入的特征图xi-1通过3×3卷积操作,批归一化和relu激活函数激活,得到新的特征图xi,逐渐较少特征图的尺寸,扩大感受野,获取不同类型尺度的特征信息,ctlg-net的特征提取过程如下公式所示:

3.根据权利要求2所述的一种基于cnn和vit混合结构神经网络的遥感图像语义分割方法,其特征在于:step3中对在ctlg-net编码阶段获取的3种中级和高级特征...

【专利技术属性】
技术研发人员:丁雪彭双云汪炤岍王金亮邵馨邓瑞芳江永松
申请(专利权)人:云南师范大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1