一种基于双分支融合网络的遥感图像云和云影分割方法技术

技术编号：34689532 阅读：7 留言：0更新日期：2022-08-27 16:23

本发明专利技术公开了一种基于双分支融合网络的遥感图像云和云影分割方法，该方法以Convolutional vision Transformer中的Transformer模块和条状卷积作为骨干网络，将两者有效结合，使得两个分支能够相互补充，从而更加高效地提取图像中的特征信息。在特征融合方面，使用了相互引导模块使得Transformer分支和条状卷积分支能够相互引导对方进行特征挖掘、提取多尺度上下文信息，提高了不同尺度的云和云影的分割能力。在解码阶段，充分利用两分支提取到的不同层级的特征进行融合上采样，有效融合高级语义信息和空间位置信息，使得云和云影的定位更加准确，分割边界更加详细；同时本方法还是通用的。同时本方法还是通用的。同时本方法还是通用的。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于双分支融合网络的遥感图像云和云影分割方法

[0001]本专利技术涉及图像分割
，具体为一种基于双分支融合网络的遥感图像云和云影分割方法。

技术介绍

[0002]云和云影检测是遥感图像处理中至关重要的问题。一方面，云是重要的气象元素，通过观察云的变化能够分析出气候变化，对灾害天气的预测和研究有着重要的意义。另一方面，许多基于遥感技术的应用，如土地覆盖分类、变化检测、水域分割等，受到云层遮挡的影响，经常会出现漏检、误检等问题。因此，对云和云影进行准确识别十分必要。
[0003]传统的云检测方法使用单组或多组阈值进行云检测，虽然一定程度上提升了检测精度，但漏判和误判时有发生。而且光谱和阈值的选择严重依赖于先验知识，且易受很多因素的干扰。近年来，深度卷积神经网络(Deep Convolutional Neural Networks，DCNNs)在计算机视觉领域获得巨大成功。然而，经典的DCNNs是为图像分类任务设计的，云和云影分割是一个像素级的分类任务，经典方法并不适用。然而，经典的DCNNs是为图像分类任务设计的，云和云影分割是一个像素级的分类任务，经典方法并不适用。为了实现端到端的像素级分类即语义分割，Long等人在2015年提出了全卷积神经网络(Fully Convolutional Networks，FCNs)，该方法用卷积层替代全连接层，对语义分割任务十分有效。Ronneberger等人提出了U
‑
Net来获取上下文的信息和位置信息。Chen等人提出的DeepLab采用空洞卷...

【技术保护点】

【技术特征摘要】
1.一种基于双分支融合网络的遥感图像云和云影分割方法，其特征在于，包括如下步骤：S1、获取数据集，所述数据集包括训练集和验证集；S2、建立Transformer分支和卷积分支网络模型，并将图像数据输入模型中，通过多次下采样获得遥感图像的不同尺度的特征信息，为特征融合做准备；S3、利用双向引导模块引导Transformer分支和卷积分支进行特征提取；S4、在解码阶段，通过解码模块修复像素定位，充分利用两分支提取到的不同层级的特征进行融合上采样；S5、不断迭代训练模型，进行精准度测试，直至模型达到预想效果。2.根据权利要求1所述的一种基于双分支融合网络的遥感图像云和云影分割方法，其特征在于，所述步骤S1具体包括如下步骤：S1.1、从Landsat
‑
8号卫星和Sentinel
‑
2号卫星上获取高清遥感图像；S1.2、对遥感图像进行裁剪；S1.3、对裁剪完成的图像进行标注，使用Labelme对裁剪完成的图片进行人工掩膜标注，标注类型为三类：云、云影和背景；S1.4、划分数据集，将上述得到的图片按4∶1进行划分，即将80％作为训练集，20％作为验证集。3.根据权利要求1所述的一种基于双分支融合网络的遥感图像云和云影分割方法，其特征在于，所述步骤S2的网络模型为双分支融合网络模型，由编码阶段和解码阶段两部分组成；在编码阶段，使用Transformer和卷积网络相互引导的双支路结构去提取不同层级的特征，融合全局特征和局部特征；在解码阶段，利用Transformer分支和条状卷积分支提取到的不同层级的语义信息和空间信息进行上采样，融合高级语义信息和空间位置信息，实现云和云影的精准定位和精细分割。4.根据权利要求3所述的一种基于双分支融合网络的遥感图像云和云影分割方法，其特征在于，Transformer分支的表达式如下：T1＝Conv
embed
(d
i
)T2＝MHA{Flatten[Conv
proj
(T1)+d
i
]}其中，d
i
表示Transformer分支第i层的输入矩阵(i＝0,1,2,3,4)，x0表示输入到模型的矩阵，和分别表示表示Transformer分支的第i层和第i+1层的输出矩阵，表示卷积分支的第i层输出经过多级池化后的特征图，Conv
embed
(
·
)表示卷积嵌入层，Conv
proj
(
·
)表示卷积投影层，Flatten(
·
)表示将二维数据展开成一维数据，MHA(
·
)表示多头注意力层，Norm(
·
)表示层归一化，MLP(
·
...

【专利技术属性】
技术研发人员：翁理国，鲁晨，夏旻，胡凯，
申请(专利权)人：南京信息工程大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人