一种基于深度学习的高分辨率遥感影像建筑物提取方法技术

技术编号:34774241 阅读:16 留言:0更新日期:2022-08-31 19:42
一种基于深度学习的高分辨率遥感影像建筑物提取方法,属于图像提取方法领域。目前用于建筑物提取的深度学习方法中存在着缺少端到端模型设计、提取精度需要进一步提高等问题。一种基于深度学习的高分辨率遥感影像建筑物提取方法,基于基础网络结构U

【技术实现步骤摘要】
一种基于深度学习的高分辨率遥感影像建筑物提取方法


[0001]本专利技术涉及一种基于深度学习的高分辨率遥感影像建筑物提取方法。

技术介绍

[0002]提取建筑物的传统方法有很多,在影像处理中,一般认为灰度发生急剧变化的点即为边缘,边缘检测的过程就是找出影像中灰度剧烈变化的位置。针对建筑物的提取,首先需要根据遥感影像中不同地物目标边界的灰度值变化,通过使用边缘检测的算法来获取建筑物的边缘信息,然后通过空间关系对线段进行分组,再结合人的先验知识去完成建筑物的轮廓以及空间结构,进而实现对建筑物的提取。目前,基于区域分割的提取方法主要分为三种:一是基于区域生长的思想,其基于单个像素逐个进行合并,最终形成目标对象;二是以四叉树为代表的由整幅影像逐次向下分裂为小对象的分裂算法;三是以分水岭算法为代表,将标记后的区域的纹理特征作为合并准则,以局部区域同质性为分割基础的分割算法。这三种方法中,最常用的就是基于分水岭算法的区域分割方法,一些学者对该算法进行了一定的研究。近年来,随着计算机运算能力的提升以及深度学习的不断发展,越来越多的研究学者将深度学习应用到遥感领域中来,其中,卷积神经网络在深度学习中崭露头角,在遥感应用中广受欢迎,基于深度学习的建筑物提取方法开启了遥感影像信息提取的新纪元。
[0003]目前,有一种基于图像块的学习网络来实现对遥感影像的自动分割方法,其利用马萨诸塞州的道路数据集以及马萨诸塞州的建筑物数据集进行了实验,分别对三种模型即基础的神经网络模型、加了条件随机场的网络模型以及加了后处理的神经网络模型进行了对比研究,其中,提取建筑物的最高精度可达92.03%。之后,Saito等人改进了提取的卷积神经网络结构,同时创建了一个新的损失函数CIS,提高了提取精度。刘文涛等人使用全卷积神经网络实现了建筑物屋顶的自动提取,设计的网络结构通过加入空洞卷积增大了神经元的感受野,使用该神经网络提取建筑物屋顶取得了较好的效果。Xu等人基于ResNet网络提出了一个名叫Res

U

Net的卷积神经网络模型,由于卷积网络会模糊化物体边界导致结果可视化降低,故引入了向导性滤波器作为后处理来微调建筑物的提取结果。虽然使用该神经网络模型取得了较好的建筑物提取效果,有效降低了椒盐噪声的影响,但仍然存在一些不足:比如对于一些被树覆盖的建筑物,其形状不能被精确检测以及一些模糊的、不规则的建筑物边界几乎不能被分类。为了对处于稠密城区环境的建筑物屋顶进行有效的语义分割,Qin等人使用中国范围GF2遥感影像数据,基于深度卷积神经网络对建筑物的屋顶进行了有效提取,其建立了基于VHR卫星影像的能够逐像素标记的DCNN网络模型,利用条件随机场来优化建筑物提取结果,但是该后处理并没有很好的改变分割的结果。Ye等人基于超高分辨率航空影像使用联合注意力深度神经网络方法对建筑物进行了自动提取。通过提出的卷积神经网络RFA

UNet进行网络训练,取得了较好结果。针对高分辨率遥感图像中建筑物的精确分割问题,王宇等人提出了一种以Encoder

Decoder为框架、ResNet为基础网络,并结合全连接条件随机场的深度神经网络分割算法ResNetCRF,该算法可精确提取建筑物的边缘信息,但该方法仍然存在一些缺点:ResNetCRF无法识别较小的建筑物,且对于颜色信
息与背景相似、边缘信息不明显的建筑物存在漏分现象。针对传统的建筑物提取方法精度较低且建筑物边界不完整等问题,范荣双等人基于高分辨率遥感影像,提出了一种自适应池化模型,并将其置于卷积神经网络框架中,取得了较高的建筑物提取精度,但该方法中使用的激活函数无法激活所有的神经元,网络结构比较单一。卷积神经网络中重复的池化操作容易减小特征分辨率导致详细信息的丢失,为了解决这一问题,Liu等人提出了一个light

weight深度学习模型,将空间金字塔池化(spatial pyramid pooling)加入至模型中,其中,金字塔池化模型可以捕捉和聚合多尺度上下文信息,杨嘉树等人提出了一种基于局部特征的卷积神经网络的建筑物提取方法,它将建筑物从图像中分离出来,接着输入分离出的建筑物块进行识别,降低了模型的复杂度,但该模型十分依赖分离得到的图像。上述基于深度学习的建筑物提取方法虽然取得了不错的效果,但是还是存在以下不足:
[0004](1)一些网络结构比较复杂,存在对尺度较小的建筑物无法识别的情况;
[0005](2)对形状不规则的建筑物提取不完整或无法分类,提取结果对后处理比较依赖,端到端的网络模型较少;
[0006](3)一些网络方法在影像训练的过程中容易造成大量细节特征的丢失,从而影响建筑物信息提取的精度。
[0007]综上,目前的信息提取方法难以全面获取并利用高空间分辨率遥感影像中建筑物的相关特征,因此,高空间分辨率遥感影像建筑物信息提取工作难以在较好的效率、精度状态下获得突破性进展。

技术实现思路

[0008]本专利技术的目的是为了解决目前的信息提取方法难以全面获取并利用高空间分辨率遥感影像中建筑物的相关特征的问题,而提出一种基于深度学习的高分辨率遥感影像建筑物提取方法。
[0009]一种基于深度学习的高分辨率遥感影像建筑物提取方法,所述方法通过以下步骤实现:
[0010]基于基础网络结构U

Net网络模型加入特征增强结构,构成编码器

特征增强

解码器的网络结构模型;之后,对加入了特征增强结构的网络结构模型的激活函数进行改进:将激活函数ReLU替换为ELU;
[0011]设计与混合空洞卷积相结合的U

Net++网络模型,进行建筑物提取;即:U

Net++网络和扩张卷积相结合,并引入残差网络,获取联系上下文的特征信息;进行遥感影像建筑物提取的过程,包括训练阶段与测试阶段;
[0012]训练阶段:利用反向传播与随机梯度下降算法对改进后的模型进行训练,之后,对训练后的模型进行验证与精度评价,根据验证结果反向传播,调整模型参数;之后,重复训练与调整参数,直至模型趋于稳定;
[0013]测试阶段:使用测试集遥感影像数据对训练完毕的模型行进行测试;将它们依次输入到模型中进行建筑物提取,得到预测结果,根据地面真值数据对提取结果进行精度评价。
[0014]优选地,所述的基于基础网络结构U

Net网络模型加入特征增强结构,构成编码器

特征增强

解码器的网络结构模型的步骤中,
[0015](1)所述的U

Net网络由编码器、解码器和跳跃连接组成,编码器下采样经过两次卷积后再次下采样,解码器上采样中使用反卷积并与对应大小的下采样特征跳跃连接,然后经过两次卷积后再反卷积;
[0016](2)所述的基于基础网络结构U

Net网络模型加入特征增强结构的步骤中,编码器<本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于深度学习的高分辨率遥感影像建筑物提取方法,其特征在于:所述方法通过以下步骤实现:基于基础网络结构U

Net网络模型加入特征增强结构,构成编码器

特征增强

解码器的网络结构模型;之后,对加入了特征增强结构的网络结构模型的激活函数进行改进:将激活函数ReLU替换为ELU;设计与混合空洞卷积相结合的U

Net++网络模型,进行建筑物提取;即:U

Net++网络和扩张卷积相结合,并引入残差网络,获取联系上下文的特征信息;进行遥感影像建筑物提取的过程,包括训练阶段与测试阶段;训练阶段:利用反向传播与随机梯度下降算法对改进后的模型进行训练,之后,对训练后的模型进行验证与精度评价,根据验证结果反向传播,调整模型参数;之后,重复训练与调整参数,直至模型趋于稳定;测试阶段:使用测试集遥感影像数据对训练完毕的模型行进行测试;将它们依次输入到模型中进行建筑物提取,得到预测结果,根据地面真值数据对提取结果进行精度评价。2.根据权利要求1所述的一种基于深度学习的高分辨率遥感影像建筑物提取方法,其特征在于:所述的基于基础网络结构U

Net网络模型加入特征增强结构,构成编码器

特征增强

解码器的网络结构模型的步骤中,(1)所述的U

Net网络由编码器、解码器和跳跃连接组成,编码器下采样经过两次卷积后再次下采样,解码器上采样中使用反卷积并与对应大小的下采样特征跳跃连接,然后经过两次卷积后再反卷积;(2)所述的基于基础网络结构U

Net网络模型加入特征增强结构的步骤中,编码器

特征增强

解码器结构主要包括:编码器部分、特征增强部分、解码器部分;该网络是一个端到端的网络模型,使用的激活函数为ReLU,该网络模型在训练过程中,从输入端输入影像数据,在输出端输出预测结果,中间部分的所有操作都位于神经网络内部,不将其分成多个模块进行处理;其中,编码器

特征增强

解码器网络结构模型在基础网络模型编码器

解码器结构的基础上加入了特征增强结构,所述的特征增强结构具体如下:在网络结构的中间部分添加了空洞卷积以代替池化操作;以空洞卷积为基础,在网络结构的中间部分添加了特征增强结构,特征增强结构是一个串联与并联共存的网络结构,它将经过空洞率不一样的空洞卷积运算所得到的特征图使用串联和并联的方式连接;强部分的特征图,其通道数和尺寸大小取决于编码器中的运算,该结构中一共有四种空洞卷积运算,空洞率的大小分别为1、2、4、8,在大小为3
×
3的标准卷积上进行扩张后可分别得到大小为3
×
3、5
×
5、9
×
9、17
×
17的空洞卷积,对应每个特征图的感受野将分别是3、7、15、31,特征增强中最后输出特征图在第一个中间特征图上感受野大小为31
×
31;由空洞卷积操作获得的特征图,不会降低分辨率,由于具有不同空洞率的空洞卷积,因此通过该结构获得多尺度的特征信息,通过跳跃连接的方式将多尺度特征进行相加合并,从而实现了特征信息的增强。3.根据权利要求1或2所述的一种基于深度学习的高分辨率遥感影像建筑物提取方法,其特征在于:所述的对加入了特征增强结构的网络结构模型的激活函数进行改进的步骤为,在编码器

特征增强

解码器网络结构的基础上,对网...

【专利技术属性】
技术研发人员:陆相竹孟上九王淼孙义强
申请(专利权)人:哈尔滨理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1