一种基于多尺度注意力的遥感影像建筑物并行提取方法技术

技术编号：38662290 阅读：16 留言：0更新日期：2023-09-02 22:45

本发明专利技术公开了一种基于多尺度注意力的遥感影像建筑物并行提取方法，本发明专利技术设计并实现了一种结合注意力机制的建筑物提取网络MGAR。本发明专利技术利用多头注意力对高等级语义信息进行分层加权处理，以提取出表征效果较为完善的最优特征组合；而后使用门控结构将每维特征图与对应编码端的低级语义信息相融合，来弥补局部建筑物细节信息的丢失问题。建筑物细节信息的丢失问题。建筑物细节信息的丢失问题。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于多尺度注意力的遥感影像建筑物并行提取方法

[0001]本专利技术涉及遥感影像
，具体涉及一种基于多尺度注意力的遥感影像建筑物并行提取方法。

技术介绍

[0002]在遥感大数据时代背景下，不断涌现的高分辨率、高光谱等高质量遥感影像为地球科学研究提供了丰富的数据支持，并有效促进了空间信息技术的发展。遥感影像建筑物提取是遥感数据挖掘中最为重要的研究领域之一，在城市规划、生态环境建设、土地利用分析、军事勘测等众多方面具有着重要的实际应用价值。然而，建筑物形状、结构、尺寸、纹理等方面差异明显，遥感影像背景信息复杂、地物干扰较多，这些因素导致提取结果容易出现混淆、漏测、噪声点密集等问题，因此如何从遥感影像中快速且准确地提取出轮廓清晰且结构完整的建筑物目标仍是当前需要克服的难题。
[0003]随着深度学习技术的快速发展，基于深度卷积神经网络(Deep convolution neural network，DCNN)的语义分割模型被广泛应用于遥感影像建筑物提取任务当中。其中，基于全卷积神经网络(Fully Convolutional Networks，FCN)的建筑物分割方法最为流行，相较于传统的卷积神经网络(Convolution Neural Network，CNN)，FCN采用反卷积替代全连接层，有效解决了模型计算复杂度较高的问题。研究人员将FCN及其改进版本如UNet、SegNet、PSPNet等应用于建筑物提取任务中，并取得了大量研究成果。张翠军等基于Unet网络提出非对称卷积块代替常规卷积操作，增强...

【技术保护点】

【技术特征摘要】
1.一种基于多尺度注意力的遥感影像建筑物并行提取方法，其特征在于：包括以下步骤：步骤S1、建立建筑物提取网络MGAR架构，以改善基于深度学习的遥感影像建筑物提取方法中的目标捡漏与噪声密集问题；利用多头注意力对高等级语义信息进行分层加权处理，以提取出表征效果较为完善的最优特征组合；而后使用门控结构将每维特征图与对应编码端的低级语义信息相融合，来弥补局部建筑物细节信息的丢失问题；步骤S2、在Massachusetts Building、WHU Building公开数据集上进行实验，以验证步骤1提出建筑物提取网络MGAR架构的有效性。2.根据权利要求1所述的基于多尺度注意力的遥感影像建筑物并行提取方法，其特征在于：所述步骤S1的具体操作步骤如下：步骤S1.1多尺度特征解译，在解码端提出一种多尺度特征解译模块MGA，并进一步细化为注意力模块与门控单元，以提取出表征效果较为完善的最优特征组合；步骤S1.2基于多头注意力机制的特征解译，多头注意力机制通过对特征序列中每一个分量赋予不同权重方式，从大量干扰因素中筛选出其中的重要信息，并采用多个独立的Attention头进行并行计算，在提升计算效率的同时可有效防止模型过拟合问题；首先通过Flatten操作将[H,W,C]的特征图转化为[H
×
W,C]的特征序列，而后对特征序列的每一分量进行位置编码列的每一分量进行位置编码其中pos为像素点在序列中的位置，i为输入特征的第i个通道，d
model
为序列维度；位置编码利用正余弦函数为每一个像素点分配一个唯一的标识，用以记录正样本像素的位置信息，并使特征序列上任一位置的像素点能被其他位置信息线性表示；最后使用Softmax函数对注意力得分进行归一化处理，将权重向量与V相乘以完成单一维度特征图的加权计算，维度特征图的加权计算，在式(3)中，W
iQ
、W
iK
、W
iV
分别为第i(i∈{1，...，h})个线性变换下Q、K、V对应初始参数的转移矩阵，head
i
为i个注意力头的输出结果，对应于特征图的4种尺度...

【专利技术属性】
技术研发人员：赫晓慧，李盼乐，程淅杰，乔梦佳，原晨桥，高亚军，田智慧，刘飞，
申请(专利权)人：郑州大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人