一种大规模遥感图片数据集标注的自动生成方法技术

技术编号:38993437 阅读:14 留言:0更新日期:2023-10-07 10:24
本发明专利技术公开了一种大规模遥感图片数据集标注的自动生成方法。本方法中,提出了一个双阶段的半监督方法,用于为遥感数据集生成定位注释。对于一个特定的目标,如机场,只需要包含特定目标和不包含特定目标的两部分样本图像,就能用本系统的方法来生成像素级的定位注释,同时提出了一种新的方法来更准确地定位遥感图像中的目标。一个包含正样本图片(包含特定的目标)和负样本图片(不包含特定的目标)的数据集经过一个三分类器网络得到初步定位区域,本发明专利技术用一个三分类器取代中双分类器,提高准确度和生成速度。确度和生成速度。确度和生成速度。

【技术实现步骤摘要】
一种大规模遥感图片数据集标注的自动生成方法


[0001]本专利技术属于遥感图片标注
,具体为一种大规模遥感图片数据集标注的自动生成方法。

技术介绍

[0002]随着深度学习的广泛使用,对训练模型的大规模图像数据集的需求越来越大。遥感图像通常包含机场和车站等目标,这些目标的像素级定位在许多应用中都非常重要。
[0003]但是为训练定位模型生成准确注释的大规模图像数据集并不是一件容易的事,因为人工注释是费时费力的。因此,我们选择利用自动注释的方法。

技术实现思路

[0004]本专利技术的目的在于:为了解决上述提出的问题,提供一种大规模遥感图片数据集标注的自动生成方法。
[0005]本专利技术采用的技术方案如下:一种大规模遥感图片数据集标注的自动生成方法,所述大规模遥感图片数据集标注的自动生成方法包括以下步骤:
[0006]S1:需要建立一个包括两类图像的数据集,即有特定目标和无特定目标的图像。然后,本系统采用两阶段的策略来生成像素级的定位注释。如图5所示,准备好的数据集首先被送入一个三分类模型,以获得那些有特定目标的图像的初步像素级注释(阶段1),然后应用一个基于transformer的模型,通过完善上述注释获得更准确的注释(阶段2)
[0007]S2:在第一阶段,输入的图像首先通过backbone,backbone是在准备好的两类数据集上训练的,用于特征提取,然后通过三个平行分类器进行目标定位。在第二阶段,基于移动窗口的transformer结构被用来进一步细化结果
[0008]S3:用分类模型得到初步标签;用分类模型对语义感兴趣的对象进行定位被证明是一种有效的方法。在本系统的解决方案中也采用了类似的方法,但本系统进一步构建了一个三重分类器模型,以捕捉因背景杂乱和目标多样而导致的更准确的区域。根据实验,这个三重分类模型可以达到比中使用的模型更准确的结果
[0009]S4:用基于transformer的网络来细化结果,在第二阶段中的基于transformer的显著性模型里,引入了一个基于移动窗口的注意力计算机制,以便捕获更多的全局信息;
[0010]S5:转换器由Lc个基本transformer层组成。编码器的输出T3通过该层,得到输出D3。最后,D3被解码器处理,以RT2T结构为backbone,得到最终的精炼区域,之后结束整个生成过程。
[0011]在一优选的实施方式中,所述步骤S4中,首先,图像被分为标记序列T1,并以T2T

ViT为backbone送入编码器。然后经过两个T2T过程,本系统分别得到T2和T3。此外,本系统还在这些T2T过程中采用了移动窗口机制来提高性能。
[0012]在一优选的实施方式中,所述步骤S4中,用基于移动窗口的注意力模块取代基于窗口的注意力模块。对于高分辨率的遥感图像,标记之间的注意力全局计算将导致相对较
大的成本。为了减少成本,本系统引入了移动窗口的划分策略。
[0013]在一优选的实施方式中,所述步骤S3中,包含正样本图片(包含特定的目标)和负样本图片(不包含特定的目标)的数据集经过一个三分类器网络得到初步定位区域。
[0014]在一优选的实施方式中,所述步骤S4中,基于transformer的显著性模型里,模型分为三个部分:编码器、转换器和解码器。
[0015]在一优选的实施方式中,所述步骤S5中,与T2T类似,RT2T结构引入了基于移动窗口的注意力计算方法,以提高最终的定位精度和准确性。基于D3,经过两个RT2T过程,本系统分别得到T2D和T1D。最后,本系统将T1D还原为最终输出。
[0016]综上所述,由于采用了上述技术方案,本专利技术的有益效果是:
[0017]本专利技术中,提出了一个双阶段的半监督方法,用于为遥感数据集生成定位注释。对于一个特定的目标,如机场,只需要包含特定目标和不包含特定目标的两部分样本图像,就能用本系统的方法来生成像素级的定位注释,同时提出了一种新的方法来更准确地定位遥感图像中的目标。一个包含正样本图片(包含特定的目标)和负样本图片(不包含特定的目标)的数据集经过一个三分类器网络得到初步定位区域,本专利技术用一个三分类器取代中双分类器,提高准确度和生成速度。
附图说明
[0018]图1为本专利技术的方法流程图;
[0019]图2为本专利技术中总体结构框图;
[0020]图3为本专利技术中第一阶段描述图;
[0021]图4为本专利技术中第二阶段描述图;
[0022]图5为本专利技术中结果证明图。
具体实施方式
[0023]为了使本专利技术的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本专利技术进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本专利技术,并不用于限定本专利技术。
[0024]参照图1

5,
[0025]实施例:
[0026]一种大规模遥感图片数据集标注的自动生成方法,所述大规模遥感图片数据集标注的自动生成方法包括以下步骤:
[0027]S1:需要建立一个包括两类图像的数据集,即有特定目标和无特定目标的图像。然后,本系统采用两阶段的策略来生成像素级的定位注释。如图1所示,准备好的数据集首先被送入一个三分类模型,以获得那些有特定目标的图像的初步像素级注释(阶段1),然后应用一个基于transformer的模型,通过完善上述注释获得更准确的注释(阶段2)
[0028]S2:在第一阶段,输入的图像首先通过backbone,backbone是在准备好的两类数据集上训练的,用于特征提取,然后通过三个平行分类器进行目标定位。在第二阶段,基于移动窗口的transformer结构被用来进一步细化结果
[0029]S3:用分类模型得到初步标签;用分类模型对语义感兴趣的对象进行定位被证明
是一种有效的方法。在本系统的解决方案中也采用了类似的方法,但本系统进一步构建了一个三重分类器模型,以捕捉因背景杂乱和目标多样而导致的更准确的区域。三重分类器模型包含三个并行的分类器结构。每个分类器结构都包含一些卷积层、GAP和一个softmax层。第一个分类器得到的特征图识别区域剔除之后传入第二个分类器作为输入,第二个分类器得到的特征图识别区域剔除之后传入第三个分类器作为输入。最后将保存的三个特征图进行融合,得到最终的特征图,经阈值转换之后即为最终结果。根据实验,这个三重分类模型可以达到比中使用的模型更准确的结果
[0030]S4:用基于transformer的网络来细化结果,在第二阶段中的基于transformer的显著性模型里,引入了一个基于移动窗口的注意力计算机制,以便捕获更多的全局信息;
[0031]S5:转换器由Lc个基本transformer层组成。编码器的输出T3通过该层,得到输出D3。最后,D3被解码器处理,以RT2T结构为backbone,得到最终的精炼区域,之后结束整个生成过程。
[0032]所述步骤本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种大规模遥感图片数据集标注的自动生成方法,其特征在于:所述大规模遥感图片数据集标注的自动生成方法包括以下步骤:S1:建立一个包括两类图像的数据集,即有特定目标和无特定目标的图像,采用两阶段的策略来生成像素级的定位注释;准备好的数据集首先被送入一个三分类模型,以获得那些有特定目标的图像的初步像素级注释,然后应用一个基于transformer的模型,通过完善注释获得更准确的注释;S2:在第一阶段,输入的图像首先通过backbone,backbone是在准备好的两类数据集上训练的,用于特征提取,然后通过三个平行分类器进行目标定位,在第二阶段,基于移动窗口的transformer结构被用来进一步细化结果;S3:用分类模型得到初步标签;用分类模型对语义感兴趣的对象进行定位,进一步构建一个三重分类器模型,以捕捉因背景杂乱和目标多样而导致的更准确的区域;三重分类器模型包含三个并行的分类器结构;每个分类器结构都包含一些卷积层、GAP和一个softmax层;第一个分类器得到的特征图识别区域剔除之后传入第二个分类器作为输入,第二个分类器得到的特征图识别区域剔除之后传入第三个分类器作为输入;最后将保存的三个特征图进行融合,得到最终的特征图,经阈值转换之后即为最终结果;S4:用基于transformer的网络来细化结果,在第二阶段中的基于transformer的显著性模型里,引入了一个基于移动窗口的注意力计算机制,以便捕获更多的全局信息;S5:转换器由Lc个基本transformer层组成;编码器的输出T3通过该层,得到输出D3;最后,D3被解码器处理,以RT2T结构为backbone,得到最终的精炼区域,之后结束整个生成过程。2.如权利要求1所述的一种大规模遥感图片数据集标注的自动生成方法,其特征在于:所述步骤S4中,图像被分为标记序列T1,并以T2T

ViT为backbone送入编码器;然后经过两个T2T过程,分别得到T2和T3;在T2T过程中采用移动窗口机制来提高性能。3.如权利...

【专利技术属性】
技术研发人员:胡岩峰刘国龙任岩顾爽陶昊然潘月浩徐夏胡伟张帆
申请(专利权)人:北京化工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1