基于SegFormer的单体面状建筑物检测方法技术

技术编号:38331316 阅读:15 留言:0更新日期:2023-07-29 09:14
本发明专利技术提供一种基于SegFormer的单体面状建筑物检测方法。该方法包括步骤1:构建基于改进SegFormer的建筑物提取网络,包括编码器和解码器;所述编码器中由浅层至深层包括依次连接的4个Transformer块;所述解码器中由浅层至深层包括依次连接的第一1

【技术实现步骤摘要】
基于SegFormer的单体面状建筑物检测方法


[0001]本专利技术涉及建筑物检测
,尤其涉及一种基于SegFormer的单体面状建筑物检测方法。

技术介绍

[0002]建筑物作为重要的人工地物目标,是人类从事生产和生活活动的中心场所。可以为城市规划、灾害监测、交通管理和生态环境的科学规划提供重要参考。与传统自然影像不同,遥感影像上的建筑区多为房子、植被、道路以及土质空地等地物类型交互错杂而构成的混合聚落,由于地物的材质构造形式等方面的差异性,导致建筑物在遥感影像上会产生不同的差异性。地物分布情况复杂时,大量非房屋信息混淆到检测网络中,分类检测效果较差。传统影像处理以手工选取设计特征,耗时耗力,难以满足实时更新要求和大范围场景应用,且现阶段智能判绘技术研究与实际应用存在较大差距。
[0003]近年来,基于卷积神经网络的高分遥感分类方法在房屋信息提取方面也开展了研究。相关研究综述了神经网络在路网提取、房屋检测及作物分类等方面的语义表征能力。FCN网络提出特征提取模块,常被用于建筑物语义分割。UNet网络以编码

解码器为基础提出跳跃连接思想,将深浅特征进行融合以提升语义分割精度,相比于FCN网络,提取更加完整的特征。Hrnet网络通过级联多尺度分辨率特征,有效减少特征信息损失,使提取的多尺度特征更加丰富,实现了房屋信息像素级提取。PSPNet网络通过金字塔池化模块和金字塔场景解析模块聚合不同区域多尺度特征,建筑物边缘完整性得到一定提升。Deeplab系列网络通过引入深度可分离卷积,聚合多尺度信息特征,获得了更好的边缘感知效果。SegFormer网络通过剪除位置编码、使用MLP(Multilayer Perception)多层感知机进行特征提取,一定程度上改善了非房屋特征无效提取的情况。尽管上述特征提取网络都具备了较高的检测精度,但是信息缺失问题没有得到有效的改善,检测网络中未重点提取房屋特征、抑制非房屋信息的提取,在复杂环境下的房屋提取效果有待进一步提升。
[0004]现有研究表明基于深度学习的高分遥感建筑物提取方法在大量样本支持下,具有明显优势,但仍存在一些问题:一方面,现有研究多数将卷积神经网络模型直接应用于遥感领域,专门针对遥感影像建筑物检测或者房屋对象分类而构建的网络模型相对缺乏;另一方面,遥感影像上建筑物受传感器数据获取方式、不同比例尺、成像条件、复杂地形、房屋阴影、房屋倾斜等因素影响,需要探究更高效获取建筑物语义信息和细节特征的方式。

技术实现思路

[0005]针对现有卷积神经网络模型在遥感影像的建筑物提取中适用性不强以及建筑物特征提取能力较差的问题,本专利技术提供一种基于SegFormer的单体面状建筑物检测方法。
[0006]本专利技术提供的基于SegFormer的单体面状建筑物检测方法,包括:
[0007]步骤1:构建基于改进SegFormer的建筑物提取网络,包括编码器和解码器;所述编码器中由浅层至深层包括依次连接的4个Transformer块;所述解码器中由浅层至深层包括
依次连接的第一1
×
1卷积层、ASPP模块和语义融合模块;其中,将遥感影像输入至第一个Transformer块,第一个Transformer块的输出作为语义融合模块的其中一个输入,第四个Transformer块的输出作为第一1
×
1卷积层的输入,ASPP模块的输出作为语义融合模块的另一个输入;语义融合模块的输出即为检测结果;
[0008]步骤2:对所述基于改进SegFormer的建筑物提取网络进行训练,得到建筑物提取网络模型;
[0009]步骤3:使用训练好的建筑物提取网络模型对输入的遥感影像进行建筑物提取,得到检测结果。
[0010]进一步地,所述语义融合模块包括第二1
×
1卷积层、上采样层、网络级联层、转置卷积采样模块和第三1
×
1卷积层;
[0011]第一个Transformer块的输出作为第二1
×
1卷积层的输入,ASPP模块的输出作为上采样层的输入;
[0012]第二1
×
1卷积层的输出和上采样层的输出经网络级联层处理后,再依次输入至转置卷积采样模块和第三1
×
1卷积层,第三1
×
1卷积层的输出为检测结果。
[0013]进一步地,所述转置卷积采样模块由浅层至深层包括依次连接的两个3
×
3二维卷积层、两个4
×
4二维转置卷积层和一个1
×
1二维卷积层。
[0014]进一步地,针对所述转置卷积采样模块的前4层,在每层卷积运算之后依次内插一个二维的归一化层和一个Relu激活层。
[0015]进一步地,所述ASPP模块的数据处理过程为:
[0016]将输入特征F增广成i组,记为ASPP
i
,i=1,2,3,4;分组特征ASPP
i
分别各自经过膨胀率为1,3,11,17的空洞卷积层处理,得到处理后的分组特征ASPP
i
';
[0017]将输入特征F进行池化再上采样并行运算后与所有的分组特征ASPP
i
'拼接融合,拼接融合后的特征再依次输入至1
×
1卷积层和上采样模块,上采样模块的输出为ASPP模块的最终输出。
[0018]进一步地,步骤2中,采用迁移学习策略,使用在ImageNet

1K数据集的预训练权重对基于改进SegFormer的建筑物提取网络进行训练。
[0019]本专利技术的有益效果:
[0020](1)针对现有SegFormer模型在遥感影像的建筑物提取中适用性不强的问题,本专利技术通过对传统的SegFormer网络进行改进,优化检测网络结构,加强针对建筑物语义和细节特征采样。
[0021](2)利用语义融合模块将编码器从输入的遥感影像中提取的底层特征信息与所提取的高层特征信息进行融合,级联层间感受野,从而削弱空间异质性、复杂地物背景的影响,加强对建筑物特征的检测。
[0022](3)针对遥感影像房屋特征提取中干扰多、建筑物语义和细节特征信息缺失、漏检误检等问题,本专利技术对网络模型解码输出部分进行优化,采用ASPP模块,该模块通过在输入特征图上应用多采样率空洞卷积、多接收野卷积,探索多尺度上下文信息;在不同分辨率上以池化操作捕获丰富的上下文信息,逐渐恢复空间信息来捕捉清晰的目标边界;
[0023](4)通过将ASPP模块与语义融合模块结合,聚合浅层粗略信息和深层精细信息,通过混洗实现不同层特征信息交互,克服局部建筑物细节信息丢失和远距离信息缺少相关性
的问题,有效缓解因数据源冗杂造成图像分辨率差异化而导致的特征信息缺失情况,从而解决建筑物提取中多尺度房屋边缘细节缺失,微小房屋漏分误分的问题。
附图说明
[0024]图1为本专利技术实施例提供的基本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.基于SegFormer的单体面状建筑物检测方法,其特征在于,包括:步骤1:构建基于改进SegFormer的建筑物提取网络,包括编码器和解码器;所述编码器中由浅层至深层包括依次连接的4个Transformer块;所述解码器中由浅层至深层包括依次连接的第一1
×
1卷积层、ASPP模块和语义融合模块;其中,将遥感影像输入至第一个Transformer块,第一个Transformer块的输出作为语义融合模块的其中一个输入,第四个Transformer块的输出作为第一1
×
1卷积层的输入,ASPP模块的输出作为语义融合模块的另一个输入;语义融合模块的输出即为检测结果;步骤2:对所述基于改进SegFormer的建筑物提取网络进行训练,得到建筑物提取网络模型;步骤3:使用训练好的建筑物提取网络模型对输入的遥感影像进行建筑物提取,得到检测结果。2.根据权利要求1所述的基于SegFormer的单体面状建筑物检测方法,其特征在于,所述语义融合模块包括第二1
×
1卷积层、上采样层、网络级联层、转置卷积采样模块和第三1
×
1卷积层;第一个Transformer块的输出作为第二1
×
1卷积层的输入,ASPP模块的输出作为上采样层的输入;第二1
×
1卷积层的输出和上采样层的输出经网络级联层处理后,再依次输入至转置卷积采样模块和第三1
×
1卷积层,第三1
×
1卷积层的输...

【专利技术属性】
技术研发人员:芮杰李美霖刘智杨松坤金飞王淑香林雨准任丽秋陈双军
申请(专利权)人:中国人民解放军战略支援部队信息工程大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1