一种基于自学习的遥感多光谱数据半监督标注方法技术

技术编号:32878628 阅读:13 留言:0更新日期:2022-04-02 12:11
一种基于自学习的遥感多光谱数据半监督标注方法,涉及数据标注领域,包括:获取研究区域内的遥感多光谱影像数据,确定待分类目标的类别信息,将遥感多光谱影像数据进行图像融合;在研究区域内选择样地,记录样地内待分类目标的类别信息,结合融合遥感多光谱影像数据确定样地内待分类目标与融合遥感多光谱影像数据的像素对应关系,获取融合遥感多光谱影像数据的像素类别信息;将种子点数据作为初始带标签数据,利用主成分分析方法去除波段之间的多余信息;利用处理后的带标签数据采用随机森林算法构建分类模型;对无标签数据进行分类,剔除异常点,多次迭代后获得自标注数据集。本发明专利技术对手动标注数据量要求低,精度高,分类速度快,抗噪能力强。抗噪能力强。抗噪能力强。

【技术实现步骤摘要】
一种基于自学习的遥感多光谱数据半监督标注方法


[0001]本专利技术涉及数据标注
,具体涉及一种基于自学习的遥感多光谱数据半监督标注方法。

技术介绍

[0002]传统地理学、环境科学、地球科学研究所需的数据都是由地面监测站或者实地考察获取的,存在周期长、耗时长、耗费高等问题。而遥感技术极大的改善了以上几点,具有较短周期的海洋卫星可以在几个小时内获取全球影像,而陆地资源卫星在10+天内即可获取全球地表信息。遥感技术的应用大大缩短了数据采集的时间,降低了数据采集的费用,同时所采集的多时相的数据对于演变的研究具有重要意义。
[0003]随着一系列技术上的突破,人工智能在世界科技领域已经渐渐的驶进了高速车道。人工智能的发展离不开数据标注,数据标注在人工智能的高速路上,作为基石,已成为了众多重要环节之中的重中之重。遥感影像目标检测是遥感图像处理领域中的研究热点,在军事和民用等领域应用广泛,遥感数据具有分辨率高、数据量增长快的特点,遥感数据的标注是遥感数据管理、理解的关键,为后续遥感自动解译算法的开发提供基础,保证算法释放AI和机器学习的全部潜力,帮助机器学习程序带来最大的价值。
[0004]数据标注在当前阶段仍属于劳动密集型产业,人工在整个流程中扮演着举足轻重的角色。遥感数据分辨率高,人工标注工作量大,地面真实情况的收集是一项非常繁琐和耗时的工作,有时也非常昂贵,特别是在通常依靠野外调查来收集地面真实情况的遥感领域,因此,人工标注方式较难实现大区域的数据标注。因此。想要提高数据标注的效率与质量,就需要减少人力在其中的工作量,这就需要依靠高效率与高质量的数据标注工具。公开号为CN113111716A的中国专利公开了“一种基于深度学习的遥感影像半自动标注方法和装置”,提出了一种半自动标注方法,该方法基于公开的遥感数据集训练全卷积神经网络,利用该网络进行数据的自动标注,根据标注的不确定行度量值确认是否需要人工干预,完成整个半自动标注流程。该方法受限于待标注数据需要与公开数据集波段一致,无法在波段不一致的数据上实现半自动标注,不具有普遍适用性。并且大多的标注方法仅是针对可见光的三波段数据进行标注,而针对多光谱数据进行标注的方法较少。公开号为CN111079847A的中国专利公开了“一种基于深度学习的遥感影像自动标注方法”,该方法将电子地图与遥感影像配准,再将从电子地图提取建筑物和道路的矢量数据映射到遥感影像上,基于映射的数据训练多任务深度学习模型,通过深度神经网络对测试集进行遥感影像分类完成数据集的自动标注。该方法基于电子地图提取目标,只适用于人工建筑、道路等城市目标,例如:道路、房屋、车辆、飞机等目标,而自然环境的目标种类较少,自动标注的类别受限。

技术实现思路

[0005]为了解决现有遥感数据标注方法存在的人工标注工作量大且难实现大区域的数
据标注、目标种类受限、波段受限的问题,本专利技术提供一种基于自学习的遥感多光谱数据半监督标注方法。
[0006]本专利技术为解决技术问题所采用的技术方案如下:
[0007]本专利技术的一种基于自学习的遥感多光谱数据半监督标注方法,主要包括以下步骤:
[0008]步骤一、数据获取及融合
[0009]获取研究区域内的遥感多光谱影像数据,确定待分类目标的类别信息,将遥感多光谱影像数据进行图像融合,获得融合遥感多光谱影像数据;
[0010]步骤二、种子点获取
[0011]在研究区域内选择样地,记录样地内待分类目标的类别信息,结合融合遥感多光谱影像数据确定样地内待分类目标与融合遥感多光谱影像数据的像素对应关系,获取融合遥感多光谱影像数据的像素类别信息,完成种子点获取;
[0012]步骤三、带标签数据预处理
[0013]将步骤二生成的种子点数据作为初始带标签数据,融合遥感多光谱影像数据的每个像素点均包含多个波段的光谱信息,不同波段存在较高的相关性,利用主成分分析方法去除波段之间的多余信息;
[0014]步骤四、构建分类模型
[0015]利用步骤三中预处理后的带标签数据采用随机森林算法构建分类模型;
[0016]步骤五、异常点去除
[0017]利用步骤四构建的分类模型对无标签数据进行分类,同时获取分类类别的置信度,置信度小于设定值的被认为是异常点,剔除异常点后的数据作为新的带标签数据集进行下一轮迭代,重复步骤三至步骤五获取最终的自标注数据集。
[0018]进一步的,步骤二中,每块样地面积均为50*50平方米。
[0019]进一步的,步骤二中,所述样地覆盖所有感兴趣的类别。
[0020]进一步的,步骤二中,每块样地的位置均采用全球定位系统GPS进行测量,测量精度在1m以内。
[0021]进一步的,步骤三的具体操作流程如下:
[0022]1)利用带标签数据构建矩阵X=(X1,X2,...,X
p
),X是一个n*p的矩阵,n为遥感多光谱影像数据谱段的数量,p为带标签数据的数量,X
j
是一个n*1的列向量,表示第j个种子点的多光谱信息,1≤j≤p;
[0023]2)将X的每一行分别进行零均值化;
[0024]3)求出协方差矩阵表示零均值化后的矩阵,T表示矩阵转置,表示矩阵的转置;
[0025]4)求解协方差矩阵的特征值及对应的特征向量;
[0026]5)将特征向量对应的特征值从大到小排序,取前k个特征值及特征向量,使得k为满足的最小值,λ
i
为排序后的特征值;
[0027]6)降维后的数据为Q为k个特征值对应的特征向量,维度为k*n;该数据Y即为去除了波段之间多余信息的带标签数据。
[0028]更进一步的,步骤三的2)中,X的每一行均表示一个遥感多光谱影像数据谱段。
[0029]进一步的,步骤四中,所述随机森林算法中,随机森林中每棵树的生成规则为:
[0030]1)如果步骤三获取的带标签数据集大小为p,对于每棵树,采用有放回抽样方式随机抽取p个训练样本,作为该棵树的训练集;
[0031]2)每个训练样本的特征维度为k,利用袋外错误率确定常数m,随机地从k个特征值中选择m个特征子集,每次树分裂时,从这m个特征子集中选择最优的特征;
[0032]3)每棵树尽最大可能生长,不进行剪枝。
[0033]更进一步的,步骤四的2)中,m的确定步骤为:
[0034]a)对每个训练样本,计算作为袋外样本的分类结果;
[0035]b)利用投票方式简单确认该训练样本的分类类别;
[0036]c)用误分样本数量占训练样本总数的比例作为袋外错误率。
[0037]进一步的,步骤五中,所述置信度的设定值为0.4。
[0038]本专利技术的有益效果是:
[0039]本专利技术的一种基于自学习的遥感多光谱数据半监督标注方法,通过手动方式为每个待分类类别标注一些种子点,基于种子点及自学习算法实现数据集自动分类,再对分类后的数据进行清洗以获取本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于自学习的遥感多光谱数据半监督标注方法,其特征在于,包括以下步骤:步骤一、数据获取及融合获取研究区域内的遥感多光谱影像数据,确定待分类目标的类别信息,将遥感多光谱影像数据进行图像融合,获得融合遥感多光谱影像数据;步骤二、种子点获取在研究区域内选择样地,记录样地内待分类目标的类别信息,结合融合遥感多光谱影像数据确定样地内待分类目标与融合遥感多光谱影像数据的像素对应关系,获取融合遥感多光谱影像数据的像素类别信息,完成种子点获取;步骤三、带标签数据预处理将步骤二生成的种子点数据作为初始带标签数据,融合遥感多光谱影像数据的每个像素点均包含多个波段的光谱信息,不同波段存在较高的相关性,利用主成分分析方法去除波段之间的多余信息;步骤四、构建分类模型利用步骤三中预处理后的带标签数据采用随机森林算法构建分类模型;步骤五、异常点去除利用步骤四构建的分类模型对无标签数据进行分类,同时获取分类类别的置信度,置信度小于设定值的被认为是异常点,剔除异常点后的数据作为新的带标签数据集进行下一轮迭代,重复步骤三至步骤五获取最终的自标注数据集。2.根据权利要求1所述的一种基于自学习的遥感多光谱数据半监督标注方法,其特征在于,步骤二中,每块样地面积均为50*50平方米。3.根据权利要求1所述的一种基于自学习的遥感多光谱数据半监督标注方法,其特征在于,步骤二中,所述样地覆盖所有感兴趣的类别。4.根据权利要求1所述的一种基于自学习的遥感多光谱数据半监督标注方法,其特征在于,步骤二中,每块样地的位置均采用全球定位系统GPS进行测量,测量精度在1m以内。5.根据权利要求1所述的一种基于自学习的遥感多光谱数据半监督标注方法,其特征在于,步骤三的具体操作流程如下:1)利用带标签数据构建矩阵X=(X1,X2,...,X
p
),X是一个n*p的矩阵...

【专利技术属性】
技术研发人员:曹禹黄艳金王生杰蔡宇
申请(专利权)人:中林信达北京科技信息有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1