一种大规模遥感图片数据集标注的自动生成方法技术

技术编号：38993437 阅读：14 留言：0更新日期：2023-10-07 10:24

本发明专利技术公开了一种大规模遥感图片数据集标注的自动生成方法。本方法中，提出了一个双阶段的半监督方法，用于为遥感数据集生成定位注释。对于一个特定的目标，如机场，只需要包含特定目标和不包含特定目标的两部分样本图像，就能用本系统的方法来生成像素级的定位注释，同时提出了一种新的方法来更准确地定位遥感图像中的目标。一个包含正样本图片(包含特定的目标)和负样本图片(不包含特定的目标)的数据集经过一个三分类器网络得到初步定位区域，本发明专利技术用一个三分类器取代中双分类器，提高准确度和生成速度。确度和生成速度。确度和生成速度。

全部详细技术资料下载

【技术实现步骤摘要】
一种大规模遥感图片数据集标注的自动生成方法

[0001]本专利技术属于遥感图片标注
，具体为一种大规模遥感图片数据集标注的自动生成方法。

技术介绍

[0002]随着深度学习的广泛使用，对训练模型的大规模图像数据集的需求越来越大。遥感图像通常包含机场和车站等目标，这些目标的像素级定位在许多应用中都非常重要。
[0003]但是为训练定位模型生成准确注释的大规模图像数据集并不是一件容易的事，因为人工注释是费时费力的。因此，我们选择利用自动注释的方法。

技术实现思路

[0004]本专利技术的目的在于：为了解决上述提出的问题，提供一种大规模遥感图片数据集标注的自动生成方法。
[0005]本专利技术采用的技术方案如下：一种大规模遥感图片数据集标注的自动生成方法，所述大规模遥感图片数据集标注的自动生成方法包括以下步骤：
[0006]S1:需要建立一个包括两类图像的数据集，即有特定目标和无特定目标的图像。然后，本系统采用两阶段的策略来生成像素级的定位注释。如图5所示，准备好的数据集首先被送入一个三分类模型，以获得那些有特定目标的图像的初步像素级注释(阶段1)，然后应用一个基于transformer的模型，通过完善上述注释获得更准确的注释(阶段2)
[0007]S2:在第一阶段，输入的图像首先通过backbone，backbone是在准备好的两类数据集上训练的，用于特征提取，然后通过三个平行分类器进行目标定位。在第二阶段，基于移动窗口的transformer结构被用来进一步细化结果...

【技术保护点】

【技术特征摘要】
1.一种大规模遥感图片数据集标注的自动生成方法，其特征在于：所述大规模遥感图片数据集标注的自动生成方法包括以下步骤：S1:建立一个包括两类图像的数据集，即有特定目标和无特定目标的图像，采用两阶段的策略来生成像素级的定位注释；准备好的数据集首先被送入一个三分类模型，以获得那些有特定目标的图像的初步像素级注释，然后应用一个基于transformer的模型，通过完善注释获得更准确的注释；S2:在第一阶段，输入的图像首先通过backbone，backbone是在准备好的两类数据集上训练的，用于特征提取，然后通过三个平行分类器进行目标定位，在第二阶段，基于移动窗口的transformer结构被用来进一步细化结果；S3:用分类模型得到初步标签；用分类模型对语义感兴趣的对象进行定位，进一步构建一个三重分类器模型，以捕捉因背景杂乱和目标多样而导致的更准确的区域；三重分类器模型包含三个并行的分类器结构；每个分类器结构都包含一些卷积层、GAP和一个softmax层；第一个分类器得到的特征图识别区域剔除之后传入第二个分类器作为输入，第二个分类器得到的特征图识别区域剔除之后传入第三个分类器作为输入；最后将保存的三个特征图进行融合，得到最终的特征图，经阈值转换之后即为最终结果；S4:用基于transformer的网络来细化结果，在第二阶段中的基于transformer的显著性模型里，引入了一个基于移动窗口的注意力计算机制，以便捕获更多的全局信息；S5:转换器由Lc个基本transformer层组成；编码器的输出T3通过该层，得到输出D3；最后，D3被解码器处理，以RT2T结构为backbone，得到最终的精炼区域，之后结束整个生成过程。2.如权利要求1所述的一种大规模遥感图片数据集标注的自动生成方法，其特征在于：所述步骤S4中，图像被分为标记序列T1，并以T2T
‑
ViT为backbone送入编码器；然后经过两个T2T过程，分别得到T2和T3；在T2T过程中采用移动窗口机制来提高性能。3.如权利...

【专利技术属性】
技术研发人员：胡岩峰，刘国龙，任岩，顾爽，陶昊然，潘月浩，徐夏，胡伟，张帆，
申请(专利权)人：北京化工大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人