System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于注意力机制的城市水体提取方法和系统技术方案_技高网
当前位置: 首页 > 专利查询>武汉大学专利>正文

一种基于注意力机制的城市水体提取方法和系统技术方案

技术编号:40228829 阅读:5 留言:0更新日期:2024-02-02 22:31
高精度地提取城市遥感影像中的水体对于辅助制定河湖管理政策、保证城市水资源可持续发展具有重大意义。然而,城市高分辨率遥感影像蕴含复杂的空间信息和语义信息,导致依赖局部信息提取出的水体特征容易与全局信息产生偏差,进而影响城市水体语义分割的准确率。针对此问题,本发明专利技术公开了一种基于注意力机制的城市水体提取方法和系统,本发明专利技术提出了一种基于注意力机制的编码器‑解码器结构神经网络,在该网络中,带有空洞卷积的主干网络可以多尺度获取城市遥感影像的低层特征和高层特征,基于注意力机制的编码器‑解码器结构可以分别在空间域和通道域提取全局特征,再将两种全局特征结合,得到城市水体语义分割结果。

【技术实现步骤摘要】

本专利技术涉及遥感影像智能解译,特别涉及一种基于注意力机制的城市水体提取方法和系统


技术介绍

1、水是生命之源,对地球上所有已知的生命形式都至关重要,影响着气候、生物多样性和人类福祉。其中,城市水资源作为地球水资源的一部分,对维持城市生态平衡、保证城市经济健康发展具有重要作用。然而,受气候变化、人类活动等多方面的影响,城市水体的分布极度不均。为了更好地辅助政府制定河湖管理政策、保证城市水资源可持续发展,高精度地获取城市水体分布情况具有重要意义。

2、遥感具有大范围、长时序、高效率、节省人力物力等显著优势,在水体提取工作中发挥着越来越重要的作用。遥感影像主要利用水体在不同波段上与其他地物之间的光谱差异来进行水体提取,过往研究已经提出了多种遥感影像水体提取方法。传统的光学影像水体提取方法中,较为常用的是水体指数法,即通过遥感影像多个波段间的计算得到某个反映水体特征的指数,再通过对该指数进行阈值分割,将影像分为水体和非水体。多年以来,众多学者提出了归一化差异水体指数(normalized difference water index,简称ndwi)、改进的归一化差异水体指数(modified ndwi,简称mndwi)、加权归一化差异水体指数(weighted ndwi,简称wndwi)等多种水体指数。水体指数法的一大难题是阈值的确定,阈值选取不当可能会极大影响水体提取结果。另外,由于城市遥感影像具有高度复杂的空间结构,运用水体指数提取城市水体时,道路、建筑物和建筑物阴影都很可能被错分为水体。

3、经典机器学习方法也可被应用于水体提取任务中,如支持向量机(supportvector machine,简称svm),决策树(decision tree,简称dt),随机森林(random forest,简称rf)等等。这些算法通过人工设置光谱、纹理等特征对遥感图像进行分类,可以较好地解决水体错分问题,具有较高的准确率。然而,机器学习中的特征对水体提取的结果影响很大,因此在人工设计特征时需要相当多的专业知识。另外,构建特征向量会耗费大量时间,这使得基于机器学习的水体提取效率较低。与经典机器学习方法相比,深度学习方法能够通过多个卷积层直接从原始图像中捕获特征,因而可以省去复杂的特征构建过程,在效率上具有明显的优势。其中,基于卷积神经网络(convolution neural networks,简称cnns)的语义分割模型可以提取图像中的语义特征并将其与类别标签联系起来。近年来,众多学者在全卷积神经网络(fully convolutional network,简称fcn),u-net,deeplab等语义分割模型的基础上做出改进,并将他们的应用到水体提取任务中,得到了较高的准确率。上述语义分割模型只能以一定大小的感受野提取水体特征,或者以多个不同大小的感受野提取多尺度水体特征。然而,城市高分辨率遥感影像所蕴含的复杂语义使得依赖局部信息提取出的水体特征容易与全局信息产生偏差,进而影响城市水体语义分割的准确率。

4、注意力机制可以依据全局特征计算权重分布,并将权重施加于特征上,进而有侧重地进一步提取全局特征,近年来成为一大研究热点。其中,non-local neural networks首先提出了一种非局部操作算子,该算子可以直接计算所有位置之间的关系以获取长距离依赖。senet通过简单的“挤压”和“激励”操作获取了通道维度的权重,证明了不同通道间的依赖关系对特征提取同样重要。cbam(convolutional block attention module)将注意力过程分为通道维度和空间维度,并设计了串行的两个独立模块,以实现对特征图进行从通道到空间的注意力提取。danet(dual attention network)同样设计了一种兼顾通道维度和空间维度的注意力模块,但采用并行的方式获取两种维度的注意力权重,同样取得了很好的表现。基于注意力机制的卷积神经网络通常用主干网络(backbone)提取具有较多语义信息的高层特征,再对这些高层特征应用注意力机制。这种网络相对来说参数较少、效率较高,但忽视了低层特征中蕴含的空间信息,这会影响到水体提取的准确率。


技术实现思路

1、基于城市水体语义分割中存在的问题,本专利技术公开了一种基于注意力机制的城市水体提取方法。该方法的主要创新之处在于,引入空洞卷积和双重注意力机制进行来解决水体对象的多尺度和多特征问题,首先基于空洞卷积提取多尺度特征,之后基于双重注意力机制强化全局通道特征和空间特征的学习,实现了城市水体的精确提取。

2、本专利技术针对现有城市水体提取方法的不足,提供了一种基于注意力机制的城市水体提取方法。该方法可以多尺度获取城市遥感影像的低层特征和高层特征,并分别在空间域和通道域提取全局特征,再将两种特征结合用于水体提取。另外,考虑到语义分割任务中交并比(iou)对于精度评价的重要性,以及城市水体分布极度不均导致的样本数据正负类不平衡的问题,本专利技术针对城市水体语义分割提出了一种联合损失函数,获得了更高的水体提取准确率。

3、本专利技术的技术方案为一种基于注意力机制的城市水体提取方法,包含以下步骤:

4、步骤1,构建城市水体提取模型,包括编码器和解码器,其中编码器包括带有空洞卷积的主干网络,用于在不同尺度下提取水体的低层特征和高层特征,以及通道注意力模块,用于计算高层特征之间全局的通道依赖关系;解码器包括空间注意力模块、特征融合模块和后处理模块,空间注意力模块用于计算低层特征之间全局的空间依赖关系,特征融合模块用于将通道注意力模块和空间注意力模块的输出进行融合,后处理模块用于调整融合后的特征图尺度,得到尺寸与输入图像相同的城市水体提取结果;

5、步骤2,通过一种结合加权交叉熵损失函数和lovász hinge的联合损失函数训练城市水体提取模型,进一步提高了水体提取精度;

6、步骤3,利用训练好的城市水体提取模型实现城市水体提取。

7、进一步的,步骤1中,将应用空洞卷积的resnet-101作为模型的主干网络,并改进最后3个残差块,将前三个残差块的输出作为低层特征,所有残差块的输出作为高层特征,改进后的残差块特征提取的具体流程为:

8、步骤111,经过1×1卷积层,用于降低特征图的通道数;

9、步骤112,分别在三个残差块中应用卷积核大小为3×3、膨胀率不同的空洞卷积层,捕获三种不同尺度的特征依赖,其中一维空洞卷积的计算公式为:

10、

11、其中x(i)为输出信号,y(i)为输出信号,ω指大小为k的滤波器,r为膨胀率;

12、步骤113,使用1×1卷积,将特征图通道数恢复到原始通道大小;

13、步骤114,将步骤113中处理后的特征与处理前的特征逐像素相加,输出残差块的特征提取结果。

14、进一步的,步骤1中空间注意力模块的具体处理流程为:

15、步骤121,对于主干网络输出的通道数、高、宽为c×本文档来自技高网...

【技术保护点】

1.一种基于注意力机制的城市水体提取方法,其特征在于,包含以下步骤:

2.根据权利要求1所述的一种基于注意力机制的城市水体提取方法,其特征在于:步骤1中,将应用空洞卷积的ResNet-101作为模型的主干网络,并改进最后3个残差块,将前三个残差块的输出作为低层特征,所有残差块的输出作为高层特征,改进后的残差块特征提取的具体流程为:

3.根据权利要求1所述的一种基于注意力机制的城市水体提取方法,其特征在于:步骤1中空间注意力模块的具体处理流程为:

4.根据权利要求1所述的一种基于注意力机制的城市水体提取方法,其特征在于:步骤1中通道注意力模块的具体处理流程为:

5.根据权利要求1所述的一种基于注意力机制的城市水体提取方法,其特征在于:步骤1中,融合之前,先在编码器中通过依次设置1×1卷积运算和4倍上采样,使空间注意力机制的输出尺寸与低层特征相同。

6.根据权利要求1所述的一种基于注意力机制的城市水体提取方法,其特征在于:后处理模块包括3×3卷积,用于完成低层特征和高层特征的融合,以及1×1卷积和4倍上采样,最终得到尺寸与输入图像相同的城市水体提取结果。

7.根据权利要求1所述的一种基于注意力机制的城市水体提取方法,其特征在于:步骤2中Lovász hinge损失函数的计算方式如下;

8.根据权利要求1所述的一种基于注意力机制的城市水体提取方法,其特征在于:步骤2中加权交叉熵损失函数的公式为:

9.根据权利要求1所述的一种基于注意力机制的城市水体提取方法,其特征在于:步骤2中将加权交叉熵损失函数和Lovász hinge结合得到适用于城市水体提取的联合损失函数Loss,公式为:

10.一种基于注意力机制的城市水体提取系统,其特征在于,包含以下模块:

...

【技术特征摘要】

1.一种基于注意力机制的城市水体提取方法,其特征在于,包含以下步骤:

2.根据权利要求1所述的一种基于注意力机制的城市水体提取方法,其特征在于:步骤1中,将应用空洞卷积的resnet-101作为模型的主干网络,并改进最后3个残差块,将前三个残差块的输出作为低层特征,所有残差块的输出作为高层特征,改进后的残差块特征提取的具体流程为:

3.根据权利要求1所述的一种基于注意力机制的城市水体提取方法,其特征在于:步骤1中空间注意力模块的具体处理流程为:

4.根据权利要求1所述的一种基于注意力机制的城市水体提取方法,其特征在于:步骤1中通道注意力模块的具体处理流程为:

5.根据权利要求1所述的一种基于注意力机制的城市水体提取方法,其特征在于:步骤1中,融合之前,先在编码器中通过依次设置1×1卷积运算和4倍上采样,使空间注意力机制的输出尺寸与...

【专利技术属性】
技术研发人员:张文宋縯蛟陶崇鑫李俊杰王喆张镇罗杰王熙
申请(专利权)人:武汉大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1