一种训练样本自动扩增与迁移方法技术

技术编号：39970049 阅读：12 留言：0更新日期：2024-01-09 00:43

本发明专利技术涉及遥感土地覆被分类训练样本迁移领域，并公开了一种训练样本自动扩增与迁移方法，步骤一、多源参考数据收集及预处理；步骤二、构建先验局部空间单元；步骤三、构建初始伪样本集；步骤四、遥感影像收集及预处理；步骤五、时‑空分类特征向量提取；步骤六、伪样本集优化与迁移度，本发明专利技术提出了一种基于多源参考数据与多维时空特征的训练样本自动扩增与迁移方法，与已有的训练样本迁移方法相比，本方法主要有以下优势：能够充分利用多源参考数据，有效的提取参考数据中的有用信息作为先验知识，提升了训练样本扩增与迁移的准确性；充分挖掘了时间序列遥感影像中的时空特征信息，能够更好的反映各土地覆被类型在空间和时间上的特征。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及遥感土地覆被分类训练样本迁移，更具体的说，涉及一种训练样本自动扩增与迁移方法。

技术介绍

1、在过去的几十年，土地覆被分类在数据、策略、模型、计算能力、应用等方面取得了重大的进展。从传统的人工解译到现代的自动化分类方法，地表覆盖分类的技术手段不断更新和完善。特别是随着机器学习技术的发展，有监督的机器学习方法已成为地表覆盖分类制图的重要技术手段，如随机森林、支持向量机、深度学习等。然而，这些方法通常需要依赖于足够数量、可靠的训练样本数据才能获得理想的土地覆被分类结果，而训练样本采集的过程通常会耗费大量的经费、人力和时间，严重制约着使用机器学习方法进行更大范围的土地覆被分类研究。尤其是进行大尺度(国家、大洲)、高频次的(如逐年、逐季度)的土地覆被分类研究时，收集足够数量、可靠的训练样本是极大的挑战。

2、近年来，鉴于迁移学习方法在降低标记样本收集成本所展现处的特殊优势，不断有研究人员将迁移学习的思想应用到地表覆盖分类制图中训练样本的采集过程中，并取得了一系列具有借鉴意义的成果。样本迁移作为常用的思路，通过已有的高质量产品提取样本，将样本的分类知识转移到待分类的遥感影像中，从而利用原有地表覆盖产品知识进行分类制图，节省了外业调查的时间。常用的样本迁移方法中，基于距离、密度指标(如欧式距离、马氏距离、光谱角距离等)，通过比较给定样本与目标样本在不同特征空间上的距离或密度的差异来进行样本标签的迁移。这种方法通常需要依赖于大量的经验阈值，会为大尺度土地覆被分类研究带来极大的不确定性。不变特征选择法、数据分布适应法、

3、因此，当前仍迫切需要一种高效、稳定的方法，在大范围区域自动的实现训练样本的扩增与迁移，以实现大尺度的、多时相的土地覆被分类。

技术实现思路

1、本专利技术的目的为：针对土地覆被分类研究对于训练样本的数量和质量的需求，开发一种能够充分利用多源参考数据与遥感影像的时空特征，在大范围区域自动生成足量的、高质量训练样本数据的方法。解决现有训练样本迁移方法依赖于大量的经验性阈值与高质量的参考样本，无法在大范围区域自动生成高质量训练样本的技术问题。

2、本专利技术的上述技术目的是通过以下技术方案得以实现的：一种训练样本自动扩增与迁移方法，包括以下步骤：

3、步骤一、多源参考数据收集及预处理；

4、步骤二、构建先验局部空间单元；

5、步骤三、构建初始伪样本集；

6、步骤四、遥感影像收集及预处理；

7、步骤五、时-空分类特征向量提取；

8、步骤六、伪样本集优化与迁移。

9、更进一步的，所述多源参考数据收集及预处理，包括根据具体的研究目标，在确定研究区的目标土地覆被分类系统之后，收集涉及到整个研究区的各地物类型的空间数据，基于arcmap平台对收集而来的参考数据进行预处理，将不同格式的数据转换为面状矢量(shapefile)数据，将具有不同坐标系统及投影方式的数据转换为相同的坐标系统。

10、更进一步的，所述步骤二包括，根据步骤一获得的经过预处理的面状矢量数据，采用空间叠置分析的方法，获取同一类型地物的所有参考数据的公共区域(所有面状矢量数据的交集)，将获得的公共区域作为该地物类型在后续样本扩增过程中的先验局部空间单元，并以此获取所有目标土地覆被类型的先验局部空间单元。

11、更进一步的，所述步骤三包括，根据步骤二获取的先验局部空间单元，按照空间单元的范围大小成比例的构建随机点，并赋予相应的类别标签，生成各类地物初始伪样本，随机点的数量可依照具体的研究目标进行设置，并以此获取各目标土地覆被类型的伪样本点数据，最终构建研究区的初始伪样本集。

12、更进一步的，所述步骤四包括，根据具体的研究目标，获取指定年份的时间序列遥感影像，构建时间序列影像集合，并将时间序列影像集合中的每一幅影像均使用其质量控制波段将受到云及云阴影干扰的像元进行掩膜处理。

13、更进一步的，所述步骤五包括，基于步骤四获得的研究区的时间序列影像集合，提取其时空特征信息作为分类特征。

14、更进一步的，所述失控特征包括空间特征和时间特征，所述空间特征包括：光谱波段、各种光谱指数(ndvi、evi、dvi、ndwi、mndwi、awei、ndbi、ndsi)、缨帽变换主分量(brightness、greenness、wetness)、纹理特征(asm、entropy、homogeneity、contrast)，

15、所述时间特征包括：时间序列拟合曲线(ndvi、evi、ndwi、mndwi)的最大值、最小值、均值、中值、标准差、幅度、相位等参数；水体/植被覆盖频率。

16、更进一步的，所述步骤六包括，基于步骤五获得的时空分类特征向量，对具有同一类别标签的初始伪样本数据，采用孤立森林算法(isolation forest)进行孤立值筛选，将前后5％概率空间的样本点判定为孤立值进行删除，依照此方法，对各类型的伪样本进行优化与迁移，最终构建各地物类型的训练样本集所述稳定样本需要收集在一年中没有发生过土地覆被类型变化的样本，即为稳定样本。

17、根据上述方案，

18、相比于现有技术的有益效果如下：

19、本专利技术提出了一种基于多源参考数据与多维时空特征的训练样本自动扩增与迁移方法，与已有的训练样本迁移方法相比，本方法主要有以下优势：(1)能够充分利用多源参考数据，有效的提取参考数据中的有用信息作为先验知识，提升了训练样本扩增与迁移的准确性；(2)充分挖掘了时间序列遥感影像中的时空特征信息，能够更好的反映各土地覆被类型在空间和时间上的特征，提升了样本迁移的准确性；(3)自动化程度高，训练样本扩增与迁移过程中不依赖与经验性阈值与真实的训练样本作为参考，可用于在大范围区域实现自动的样本扩增与迁移；(4)可生成研究区任意给定年份的训练样本，构建研究区的时间序列训练样本集。

本文档来自技高网...

【技术保护点】

1.一种训练样本自动扩增与迁移方法，其特征在于，包括以下步骤：

2.根据权利要求1所述的一种训练样本自动扩增与迁移方法，其特征在于，所述多源参考数据收集及预处理，包括根据具体的研究目标，在确定研究区的目标土地覆被分类系统之后，收集涉及到整个研究区的各地物类型的空间数据，基于Arcmap平台对收集而来的参考数据进行预处理，将不同格式的数据转换为面状矢量(Shapefile)数据，将具有不同坐标系统及投影方式的数据转换为相同的坐标系统。

3.根据权利要求1所述的一种训练样本自动扩增与迁移方法，其特征在于，所述步骤二包括，根据步骤一获得的经过预处理的面状矢量数据，采用空间叠置分析的方法，获取同一类型地物的所有参考数据的公共区域(所有面状矢量数据的交集)，将获得的公共区域作为该地物类型在后续样本扩增过程中的先验局部空间单元，并以此获取所有目标土地覆被类型的先验局部空间单元。

4.根据权利要求1所述的一种训练样本自动扩增与迁移方法，其特征在于，所述步骤三包括，根据步骤二获取的先验局部空间单元，按照空间单元的范围大小成比例的构建随机点，并赋予相应的类别标签

5.根据权利要求1所述的一种训练样本自动扩增与迁移方法，其特征在于，所述步骤四包括，根据具体的研究目标，获取指定年份的时间序列遥感影像，构建时间序列影像集合，并将时间序列影像集合中的每一幅影像均使用其质量控制波段将受到云及云阴影干扰的像元进行掩膜处理。

6.根据权利要求1所述的一种训练样本自动扩增与迁移方法，其特征在于，所述步骤五包括，基于步骤四获得的研究区的时间序列影像集合，提取其时空特征信息作为分类特征。

7.根据权利要求6所述的一种训练样本自动扩增与迁移方法，其特征在于，所述失控特征包括空间特征和时间特征，所述空间特征包括：光谱波段、各种光谱指数(NDVI、EVI、DVI、NDWI、mNDWI、AWEI、NDBI、NDSI)、缨帽变换主分量(Brightness、Greenness、Wetness)、纹理特征(ASM、Entropy、Homogeneity、Contrast)，

8.根据权利要求1所述的一种训练样本自动扩增与迁移方法，其特征在于，所述步骤六包括，基于步骤五获得的时空分类特征向量，对具有同一类别标签的初始伪样本数据，采用孤立森林算法(Isolation Forest)进行孤立值筛选，将前后5％概率空间的样本点判定为孤立值进行删除，依照此方法，对各类型的伪样本进行优化与迁移，最终构建各地物类型的训练样本集所述稳定样本需要收集在一年中没有发生过土地覆被类型变化的样本，即为稳定样本。

...

【技术特征摘要】

1.一种训练样本自动扩增与迁移方法，其特征在于，包括以下步骤：

2.根据权利要求1所述的一种训练样本自动扩增与迁移方法，其特征在于，所述多源参考数据收集及预处理，包括根据具体的研究目标，在确定研究区的目标土地覆被分类系统之后，收集涉及到整个研究区的各地物类型的空间数据，基于arcmap平台对收集而来的参考数据进行预处理，将不同格式的数据转换为面状矢量(shapefile)数据，将具有不同坐标系统及投影方式的数据转换为相同的坐标系统。

4.根据权利要求1所述的一种训练样本自动扩增与迁移方法，其特征在于，所述步骤三包括，根据步骤二获取的先验局部空间单元，按照空间单元的范围大小成比例的构建随机点，并赋予相应的类别标签，生成各类地物初始伪样本，随机点的数量可依照具体的研究目标进行设置，并以此获取各目标土地覆被类型的伪样本点数据，最终构建研究区的初始伪样本集。

5.根据权利要求1所述的一种训练样本自动扩增与迁移方...

【专利技术属性】
技术研发人员：王铭，毛德华，王宗明，
申请(专利权)人：中国科学院东北地理与农业生态研究所，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人