融合目标检测和视觉注意机制的大范围遥感影像农村街区式居民地提取方法及系统技术方案

技术编号:38335713 阅读:9 留言:0更新日期:2023-08-02 09:16
本发明专利技术属于居民地提取技术领域,公开一种融合目标检测和视觉注意机制的大范围遥感影像农村街区式居民地提取方法及系统,该方法包括:通过YOLOv7模型检测生成大范围遥感影像上居民地候选区检测框;使用PgNet模型基于候选区检测框进行居民地的精确提取,得到大范围遥感影像上的农村居民地。本发明专利技术通过目标检测技术的候选机制和视觉注意机制方法相结合,粗略的剔除植被及地形有利于对农村居民地及其建筑物的快速自动提取,提升检索效率。获得候选框后,利用PgNet高效提取机制,从而实现在不同尺寸遥感影像中快速自动提取农村街区式居民地。地。地。

【技术实现步骤摘要】
融合目标检测和视觉注意机制的大范围遥感影像农村街区式居民地提取方法及系统


[0001]本专利技术涉及居民地提取
,尤其涉及一种融合目标检测和视觉注意机制的大范围遥感影像农村街区式居民地提取方法及系统。

技术介绍

[0002]农村街区式居民地是农村地区最重要的人工地物目标之一,街区式居民地是农村居民地一个重要的组成部分。快速准确地提取和测绘农村居民地,对农村发展和规划、农村土地管理与监测,农村人口估计和农村现代化进程等各个领域都具有重要意义。遥感影像上的农村居民地多为房子、植被、道路以及土质空地等地物类型交互错杂而构成的混合聚落,由于地物的材质构造形式等方面的差异性,导致农村居民地的建筑物在遥感影像上产生不同的差异性。且不同尺寸、不同分辨率影像中居民地的细节特征存在差异,地物分布情况复杂时,大量干扰信息混淆到检测网络中,提取效果较差。传统的居民地提取方法如人工目视解译既费时又费力,耗费的人力物力较多。
[0003]人类的视觉系统具有从复杂场景中快速、准确地定位感兴趣物体或区域的能力,称为视觉注意力机制。显著物体检测(Salient Object Detection,SOD)是对该机制的一种模拟,旨在分割给定图像中最具视觉吸引力的物体或区域,近年来,基于视觉注意力机制的方法被应用于遥感影像居民地检测(以下举好多个例子)。相关研究综述了显著性检测方法在路网提取、房屋检测及作物分类等方面的强大提取能力。PicaNet网络通过识别相关的上下文区域并为每个像素构建信息性上下文特征,在像素级别上实现了更好的提取效果。BasNet网络提出边缘损失注意力模块,提升了对建筑边缘的感知能力。CtdNet设计了互补的三边解码网络以提升特征挖掘能力,促进结构性特征信息的强化。F3Net网络提出交叉特征模块(CFM)和通过最小化新的像素位置感知损失,从而能够实现区域分割和提取精确的局部细节。ScfNet提出空间上下文特征(SCF)模块重点解决大规模点云中自适应特征学习的问题。PgNet提出错层嫁接结构,使用Transformer和CNN骨干网络从不同分辨率图像中独立地提取特征,从而解决网络的采样深度和感受野范围之间的矛盾。
[0004]现有研究表明,广泛应用的深度学习技术为遥感影像居民地提取提供了新的方向与可能,但仍存在一些问题。一是对居民地提取的研究主要集中在城市地区,对农村地区的研究相对较少,与城市街区不同,农村街区式居民地相对来说,面积较小,且为分散聚落,与植被和农田交错分布,因此直接使用城市建筑区的提取方法,应用于农村居民地的特征提取针对性不强,适用性较弱,其效果仍有待提升。二是基于视觉注意机制的居民地提取方法在小尺度图像上获得了较好的效果,但在大尺度图像上,干扰因素过多,其结果不甚理想。因此仍需进一步探究适用于农村街区式居民地的高效提取方法。三是基于深度学习的居民地识别算法在进行小范围影像上的居民地提取时检测效果和算法性能都相对不错,但也引入了复杂的模型结构和庞大的参数数量,在大尺度影像上对街区进行检测时,尤其是在大范围遥感影像上进行街区提取时,在检测速度和单一街区的精确提取效果上都有待提升,
算法的处理效率和便捷部署能力仍有待进一步优化。

技术实现思路

[0005]针对多尺度遥感影像农村街区提取适应性差、精度效果不佳的问题,本专利技术提出了一种融合目标检测和视觉注意机制的大范围遥感影像农村街区式居民地提取方法及系统。该方法采取两步走策略粗略定位和精细提取。首先通过深度学习方法中的YOLOv7模型检测生成大范围遥感影像上居民地候选区检测框,之后使用PgNet模型基于候选区检测框进行居民地的精确提取,得到大范围遥感影像上的农村居民地。通过目标检测技术的候选机制和视觉注意机制方法相结合,粗略的剔除植被及地形有利于对农村居民地及其建筑物的快速自动提取,提升检索效率。获得候选框后,利用PgNet高效提取机制,从而实现在不同尺寸遥感影像中快速自动提取农村街区式居民地。
[0006]为了实现上述目的,本专利技术采用以下技术方案:
[0007]本专利技术一方面提出一种融合目标检测和视觉注意机制的大范围遥感影像农村街区式居民地提取方法,包括:
[0008]通过YOLOv7模型检测生成大范围遥感影像上居民地候选区检测框;
[0009]使用PgNet模型基于候选区检测框进行居民地的精确提取,得到大范围遥感影像上的农村居民地。
[0010]进一步地,所述通过YOLOv7模型检测生成大范围遥感影像上居民地候选区检测框包括:
[0011]使用开源数据集CBDV1.0预训练YOLOv7模型参数权重;
[0012]使用预训练后的YOLOv7模型对测试区域进行检测,从而获得大范围遥感影像上候选居民地边界框的粗略定位,同时记录其为街区的可能性,影像中除街区外的其他部分为非街区背景;
[0013]通过粗略定位,切片候选框区域,剔除植被及非居民地信息。
[0014]进一步地,所述使用PgNet模型基于候选区检测框进行居民地的精确提取,得到大范围遥感影像上的农村居民地包括:
[0015]采用PgNet对生成候选检测区域进行检测;
[0016]经PgNet检测后生成结果为显著图,通过最佳阈值分割显著图得到其对应的二值图;
[0017]结合原始输入图像,基于上述的二值图进行二值掩膜处理,得到最终的农村街区居民地区域。
[0018]本专利技术另一方面提出一种融合目标检测和视觉注意机制的大范围遥感影像农村街区式居民地提取系统,包括:
[0019]粗提取单元,用于通过YOLOv7模型检测生成大范围遥感影像上居民地候选区检测框;
[0020]精提取单元,用于使用PgNet模型基于候选区检测框进行居民地的精确提取,得到大范围遥感影像上的农村居民地。
[0021]进一步地,所述粗提取单元具体用于:
[0022]使用开源数据集CBDV1.0预训练YOLOv7模型参数权重;
[0023]使用预训练后的YOLOv7模型对测试区域进行检测,从而获得大范围遥感影像上候选居民地边界框的粗略定位,同时记录其为街区的可能性,影像中除街区外的其他部分为非街区背景;
[0024]通过粗略定位,切片候选框区域,剔除植被及非居民地信息。
[0025]进一步地,所述精提取单元具体用于:
[0026]采用PgNet对生成候选检测区域进行检测;
[0027]经PgNet检测后生成结果为显著图,通过最佳阈值分割显著图得到其对应的二值图;
[0028]结合原始输入图像,基于上述的二值图进行二值掩膜处理,得到最终的农村街区居民地区域。
[0029]与现有技术相比,本专利技术具有的有益效果:
[0030]本专利技术将视觉注意机制算法PgNet与目标检测算法YOLOv7相结合,提出了一种融合目标检测和视觉注意机制的大范围遥感影像农村街区式居民地提取方法及系统。使用YOLOv7作为农村街区粗略定位的检测器,通过预检索机制解决了居民地定位的痛点;使用本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种融合目标检测和视觉注意机制的大范围遥感影像农村街区式居民地提取方法,其特征在于,包括:通过YOLOv7模型检测生成大范围遥感影像上居民地候选区检测框;使用PgNet模型基于候选区检测框进行居民地的精确提取,得到大范围遥感影像上的农村居民地。2.根据权利要求1所述的融合目标检测和视觉注意机制的大范围遥感影像农村街区式居民地提取方法,其特征在于,所述通过YOLOv7模型检测生成大范围遥感影像上居民地候选区检测框包括:使用开源数据集CBDV1.0预训练YOLOv7模型参数权重;使用预训练后的YOLOv7模型对测试区域进行检测,从而获得大范围遥感影像上候选居民地边界框的粗略定位,同时记录其为街区的可能性,影像中除街区外的其他部分为非街区背景;通过粗略定位,切片候选框区域,剔除植被及非居民地信息。3.根据权利要求1所述的融合目标检测和视觉注意机制的大范围遥感影像农村街区式居民地提取方法,其特征在于,所述使用PgNet模型基于候选区检测框进行居民地的精确提取,得到大范围遥感影像上的农村居民地包括:采用PgNet对生成候选检测区域进行检测;经PgNet检测后生成结果为显著图,通过最佳阈值分割显著图得到其对应的二值图;结合原始输入图像,基于上述的二值图进行二值掩...

【专利技术属性】
技术研发人员:芮杰李美霖刘智杨松坤金飞王淑香林雨准左溪冰霍爱梅
申请(专利权)人:中国人民解放军战略支援部队信息工程大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1