一种基于视觉基础模型优化的U-Net++遥感语义分割方法技术

技术编号：44974797 阅读：22 留言：0更新日期：2025-04-12 01:50

本发明专利技术公开了一种基于视觉基础模型优化的U‑Net++遥感语义分割方法，包括：遥感影像通过视觉基础编码模块后得到视觉特征图X<subgt;0</subgt;；遥感影像通过U‑Net++编码模块依次得到遥感影像特征图X<subgt;0,0</subgt;、X<subgt;1</subgt;,<subgt;0</subgt;、X<subgt;2</subgt;,<subgt;0</subgt;、X<subgt;3</subgt;,<subgt;0</subgt;、X<subgt;4</subgt;,<subgt;0</subgt;；特征融合增强模块将视觉特征图X<subgt;0</subgt;与遥感影像特征图X<subgt;4</subgt;,<subgt;0</subgt;进行连接，然后通过通道注意力机制对连接的特征图进行特征融合增强，经过重投影整合恢复原始特征图尺度得到特征图X<subgt;1</subgt;；解码模块通过U‑Net++解码器的上采样与特征连接进行特征图解码，得到输入遥感影像的预测结果X。本发明专利技术能提高预测精度，充分发挥视觉基础模型强大的先验知识，并建立全局语义相互作用和上下文长距离关联。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及遥感图像处理，尤其涉及一种基于视觉基础模型优化的u-net++遥感语义分割方法。

技术介绍

1、遥感影像语义分割技术是指将遥感影像中的每个像素按照其最可能的地物类别进行分类标注，从而将影像划分为不同语义区域的过程。传统的深度学习遥感语义分割以卷积神经网络（cnn）为主，其中u-net++因其优秀的网络结构，且在空间位置方面表示优异而被广泛应用，但由于卷积运算的局部性，u-net++很难建立全局语义相互作用和上下文长距离关联的能力。transformer的提出不仅使得深度学习能够更多的关注输入数据的全局信息，还能通过计算输入数据向量之间的映射关系，去除无效信息并加强有效信息，但由于其完全基于自注意力机制，会存在一定的位置信息丢失，因此语义分割方法仍以cnn架构为主。直到视觉基础模型发布，语义分割方法从cnn开始向transformer演变，sam作为一种视觉基础大模型，因其强大的通用分割能力而广受关注，但由于sam的训练对象为自然图像，缺乏遥感影像的先验知识，难以深度挖掘遥感影像特征信息，因此如何有效结合transform与...

【技术保护点】

1.一种基于视觉基础模型优化的U-Net++遥感语义分割方法，其特征在于包括以下步骤：

2.如权利要求1所述的一种基于视觉基础模型优化的U-Net++遥感语义分割方法，其特征在于：步骤S1所述的块嵌入模块的操作步骤为：

3.如权利要求1所述的一种基于视觉基础模型优化的U-Net++遥感语义分割方法，其特征在于：步骤S3所述的通道注意力机制包括全局信息嵌入、自适应重新校正和重新加权，全局信息嵌入将每个通道上的空间特征编码压缩为一个全局特征，采用全局平均池化来实现，输出维度为1×1×C的向量；自适应重新校正在得到1×1×C全局特征后，加入一个全连接层，并且对每个通道的...

【技术特征摘要】

1.一种基于视觉基础模型优化的u-net++遥感语义分割方法，其特征在于包括以下步骤：

2.如权利要求1所述的一种基于视觉基础模型优化的u-net++遥感语义分割方法，其特征在于：步骤s1所述的块嵌入模块的操作步骤为：

3.如权利要求1所述的一种基于视觉基础模型优化的u-net++遥感语义分割方法，其特征在于：步骤s3所述的通道注意力机制包括全局信息嵌入、自适应重新校正和重新...

【专利技术属性】
技术研发人员：李龙强，谭登澳，冯靖宜，陈忠超，孙俊英，杨宛莹，成其换，国娴，袁方芳，王光文，张永富，张波，杜少君，李大言，吴荣凯，
申请(专利权)人：贵州省第二测绘院，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人