一种遥感影像样本数据清洗方法技术

技术编号:37196636 阅读:10 留言:0更新日期:2023-04-20 22:55
本发明专利技术公开了一种遥感影像样本数据清洗方法,属于遥感和计算机视觉领域;现有技术中,数据清洗非常耗费人力成本和时间成本,本发明专利技术提供的方法包括以下步骤:(1)基于数字线划图(DLG)的地物对象抽取,(2)标注影像生成,(3)标注影像切割与样本生成,(4)构建数据清洗神经网络模型,(5)模型训练与权重迭代,(6)确定数据清洗阈值;该方法避免了大量人工标注的过程,减少了人力、物力。物力。物力。

【技术实现步骤摘要】
一种遥感影像样本数据清洗方法
[0001]一种遥感影像样本数据清洗方法


[0002]专利技术属于遥感和计算机视觉领域,特别是涉及一种遥感影像样本数据清洗方法。

技术介绍

[0003]近年来,深度学习已成为遥感影像分类的主要方法,而深度学习方法需要海量样本作为训练数据。通过人工勾勒地物的方式进行遥感影像样本制作需要耗费大量人力、物力,因此许多研究者通过历史地形图(DLG,Digital Line Graphic)数据来自动生成遥感影像样本。
[0004]地形图的生产时间与用于样本制作的遥感影像的拍摄时间未必一致,由于地表场景、地物的变化(例如拆迁、新建建筑、退耕还林等),过去的地形图标注的地物类型会发生部分变化,进而导致基于地形图的样本自动标记出现错误,影响网络模型训练的精度。
[0005]在网络模型训练之前,对遥感影响样本数据的清洗很重要,需要在输入模型之前删除无效、错误的数据。目前的数据清洗一般需要人工参与进行检查,由于地形图数据量非常庞大,非常耗费人力成本和时间成本。本专利技术提出一种自动化的遥感影像样本数据清洗方法,自动化的删除无效、错误数据,降低人力和时间成本。

技术实现思路

[0006]针对现有技术的以上缺陷或改进需求中的一种或者多种,本专利技术提供了一种遥感影像样本数据清洗方法,其特征在于:所述方法包括以下步骤:
[0007]步骤S1:首先获取历史数字线划图,对所述数字线划图进行地物对象的抽取以获得所述地物对象的类别的图层,为不同的类别添加一个整数属性,记为Value,且用整数为不同类别进行编码;
[0008]步骤S2:创建一个跟真正影像大小和空间都一致的空影像,为所述空影像的所有像素赋值为0;之后对所述地物对象逐个进行判断,对于平面空间位置在所述地物对象内部的像素赋值为该所述地物对象的整数属性Value的值,生成的栅格影像即为标注影像;
[0009]步骤S3:将所述标注影像按照空间一致性进行固定大小的矩形切片,切片影像大小为D
×
D;
[0010]步骤S4:使用语义分割深度神经网络作为数据清洗网络模型,所述网络模型的损失计算公式为:
[0011]其中,第i幅影像的权重记为W
i
,损失记为L
i
,N为影像的数量;
[0012]步骤S5:对所述数据清洗网络模型进行训练,然后对所有切片影像进行权重迭代;
[0013]步骤S6:为权重设定一个阈值T,将权重小于阈值T的样本剔除,得到高精度的遥感影像样本集。
[0014]优选地,抽取的所述地物对象的类别与所述数字线划图的比例尺有关,可以用于生成所述标注影像的所述地物对象的类别必须在所述数字线划图上有明确的边界。
[0015]优选地,在步骤S3中,按照横向纵向都是W个像素间隔对影像进行切片,其中W小于D以保证切片影像之间相互重叠。
[0016]优选地,在步骤S5中,具体包括以下步骤:
[0017]步骤S51:令每一副影像的权重为1,并开始网络模型训练;
[0018]步骤S52:根据训练好的模型结果计算每一副影像的权重,每一副影像的预测精度的计算公式如下:
[0019]其中D为样本影像的边长,P
j
为该像素被预测正确的概率,
[0020]将第i幅影像的权重更新为A
i
,即:w
i
=A
i

[0021]步骤S53:在所有影像的权重更新后,重新进行训练,此时根据所述损失计算公式计算的损失进行模型参数的改正;
[0022]步骤S54:重复进行步骤S52和步骤S53,将不断地重新训练更新权重,并利用更新的权重重新训练,直至得到精度稳定的训练模型。
[0023]优选地,在步骤S6中,阈值T的确定方法可以由人工进行判定,或者默认删除一定比例的样本。
[0024]总体而言,通过本专利技术所构思的以上技术方案与现有技术相比,具有的有益效果包括:
[0025](1)利用历史DLG和TDOM进行标注影像的生成,避免了大量人工标注的过程,减少了人力、物力;
[0026](2)基于地形图的样本自动标记会出现错误,影响网络模型训练的精度,针对这个问题,提出了一种自动化的遥感影像样本数据清洗方法,构建了顾及样本权重的数据清洗网络模型,并通过权重迭代的模型训练方法计算每个样本的准确性,最终得到高精度的样本集。
附图说明
[0027]图1是本专利技术遥感影像样本数据清洗方法的流程图。
具体实施方式
[0028]为了使本专利技术的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本专利技术进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本专利技术,并不用于限定本专利技术。此外,下面所描述的本专利技术各个实施方式中所涉及到的技术特征只要彼此之间未构成冲突就可以相互组合。
[0029]实施例:
[0030](1)基于数字线划图(DLG)的地物对象抽取
[0031]首先获取历史DLG,从DLG中提取指定地物类别的图层,例如建筑、道路、水体等。然后,分图层处理的矢量要素,对于部分类别如建筑、湖泊等直接进行矢量闭合并转为面状元素;对于如道路、河流等类别需要人工进行矢量闭合并转换为面状元素。最后,为不同类别的矢量添加一个整数属性,记为Value,且用整数为不同类别进行编码,每个类别矢量的整数属性Value的值为对应的整数编码。
[0032]其中,提取的地物类别与DLG的比例尺有关,可以用于生成标注影像的地物类别必须在DLG上有明确的边界,在高比例尺的DLG上有更多地物的精确边界,而底比例尺上只会用示意的方式进行表达。因此需要实际情况,选择合适比例尺的DLG。
[0033](2)标注影像生成
[0034]获取真正射影像(TDOM),通过坐标转换保证历史DLG和TDOM的坐标系统一致,以实现DLG和TDOM的空间一致性。
[0035]对DLG进行矢量栅格化。首先创建一个跟TDOM大小和空间都一致的空影像,为所有影像像素赋值为0;之后逐个矢量进行判断,对于平面空间位置在矢量内部的像素赋值为该矢量的整数属性Value的值。最后生成的栅格影像即为标注影像,标注影像上像素值代表地物类别,并且与遥感影像空间一致。
[0036](3)标注影像切割与样本生成
[0037]将遥感影像和标注影像按照空间一致性进行固定大小的矩形切片,切片影像大小为D
×
D。按照横向纵向都是W个像素间隔对影像进行切片,W通常小于D以保证切片影像之间相互重叠。
[0038]优选的,D通常设为2的整数次方。由于深度神经网络模型的卷积和池化操作会导致边缘信息失真,因此影像边缘的语义分割精度会低于影像中心部分。针对这个问题,按照横向纵向都是W个像素间隔对影像进行切片,若W=D/4保证切片影像之间相互重叠,原始遥感影像的像素至少会出现在一个切片影像的中心部分。注意本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种遥感影像样本数据清洗方法,其特征在于:所述方法包括以下步骤:步骤S1:首先获取历史数字线划图,对所述数字线划图进行地物对象的抽取以获得所述地物对象的类别的图层,为不同的类别添加一个整数属性,记为Value,且用整数为不同类别进行编码;步骤S2:创建一个跟真正影像大小和空间都一致的空影像,为所述空影像的所有像素赋值为0;之后对所述地物对象逐个进行判断,对于平面空间位置在所述地物对象内部的像素赋值为该所述地物对象的整数属性Value的值,生成的栅格影像即为标注影像;步骤S3:将所述标注影像按照空间一致性进行固定大小的矩形切片,切片影像大小为D
×
D;步骤S4:使用语义分割深度神经网络作为数据清洗网络模型,所述网络模型的损失计算公式为:其中,第i幅影像的权重记为W
i
,损失记为L
i
,N为影像的数量;步骤S5:对所述数据清洗网络模型进行训练,然后对所有切片影像进行权重迭代;步骤S6:为权重设定一个阈值T,将权重小于阈值T的样本剔除,得到高精度的遥感影像样本集。2.根据权利要求1所述的方法,其特征在于:在步骤S1中,抽取的所述地物对象的类别与所...

【专利技术属性】
技术研发人员:夏旺曹成度费亮李海亮许诗旋李昭熹马龙童思奇王波
申请(专利权)人:中铁第四勘察设计院集团有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1