双条件质量约束的对象级地物样本自适应生成方法及系统技术方案

技术编号:39596880 阅读:9 留言:0更新日期:2023-12-03 19:54
本发明专利技术提供了一种双条件质量约束的对象级地物样本自适应生成方法及系统,包括以下步骤:基于土地利用数据产品,获取设定时间段内地物类型未发生变化的像素,形成土地利用类型像素图;基于土地利用类型像素图,获取各地类样本的中心像素;以各类地物的中心像素作为代表样本点,结合样本尺寸以得到各类地物的样本区块,形成各类地物的样本集;基于各样本区块的多源特征,以样本可分离性和植被指数相关性值作为指标,评估样本集质量;如果不达标,重新获取各类地物的中心像素和样本区块,以生成新的样本集直至达标

【技术实现步骤摘要】
双条件质量约束的对象级地物样本自适应生成方法及系统


[0001]本专利技术属于遥感与机器学习相关
,具体涉及一种双条件质量约束的对象级地物样本自适应生成方法及系统


技术介绍

[0002]随着卫星传感器类型的增多及计算机技术的快速发展,加上计算和数据存储能力的提高,使得大量卫星数据和复杂的机器学习大框架模型用于大面积土地覆盖制图以及目标提取变为了一种常态

随着机器学习和深度学习的发展,遥感影像目标提取及分类精度得到了较为明显的提高

但往往高质量分类精度的前提条件是需要充足且高质量的训练样本数据,故训练样本数据的准备是首要任务,更是直接影响了分类结果

[0003]为此,国内外大量学者对如何高效且准确的获取地物训练样本做了大量的研究

其中,用最为广泛的一种样本选择方式便是结合遥感影像的人工目视解译方法,例如结合野外调查数据使用人工目视解译的方式得到了分类样本集,并计算了样本可分离度,结果显示样本间可分离性较好

但该方法在一定程度上具有局限性,该种方式需要人工对每一个样本数据进行判断与选择,大范围区域的样本选择不仅费时费力,同时也增加了人为主观性因素的影响


技术实现思路

[0004]本专利技术的目的就是为了解决上述
技术介绍
存在的不足,提供一种双条件质量约束的对象级地物样本自适应生成方法及系统,自动生成对象级地物样本集,较大程度上节省了计算成本,在保证样本质量的基础上提高了样本生成效

[0005]本专利技术采用的技术方案是:一种双条件质量约束的对象级地物样本自适应生成方法,包括以下步骤:基于土地利用数据产品,获取设定时间段内地物类型未发生变化的地类像素,形成土地利用类型像素图;基于土地利用类型像素图,获取各类地类样本的中心像素;以各类地物的中心像素作为其相应的代表样本点,结合样本尺寸,得到各类地物的样本区块;获取各样本区块的多源特征作为其对应的标签,形成各类地物的特征集;以样本可分离性和植被指数相关性值作为指标,评估样本集;如果不达标,重新获取各类地物的中心像素和样本区块,以生成新的样本集直至达标

[0006]上述技术方案中,获取设定时间段内未发生变化的若干地类像素的过程包括:在线调用若干年份土地利用数据产品,对其重分类至特定的分类体系;筛选出在设定年数内地物类型未发生变化像素

[0007]上述技术方案中,判定待评估样本集的样本可分离性符合设定标准后,再评估其植被指数相关性值是否达标

[0008]上述技术方案中,获取任一地类的代表样本点的过程包括:针对土地利用类型像素图,采用设定的邻域尺寸的单位核函数对其进行滤波处理;基于设定的邻域尺寸,选择邻域均为同一种地物类型的中心像素位置作为该地物类型的代表样本点

[0009]上述技术方案中,获取任一类地物样本区块的过程包括:基于设定的邻域尺寸,获取以中心像素为基准的四个斜角点像素;单向连接四个斜角点像素构成样本的边界线,形成样本区块

[0010]上述技术方案中,针对不达标的样本集,重新设定邻域尺寸,再次执行获取各类地物的中心像素

样本区块和样本集的过程

[0011]上述技术方案中,所述多源特征包括:波段特征

植被指数特征

纹理特征

极化特征和地形因子

[0012]上述技术方案中,任意两种地物类型样本集之间,在任一种特征上的样本可分离性
J

M
的计算公式如下:;上式中,
B
为待计算的两种地物类型样本之间的巴氏距离;所述巴氏距离
B
的计算公式如下所示:;上式中,
i

j
表示两种地物类型
C
i

C
j
的编号,
m
i
表示地物类型
C
i
的样本集中各样本在该特征上的平均值,
δ
i
表示地物类型
C
i
的样本集中各样本在该特征上的方差;
m
j
表示地物类型
C
j
的样本集中各样本在该特征上的平均值,
δ
j
表示地物类型
C
j
的样本集中各样本在该特征上的方差;针对每两种地物类型的样本集间在所有维度特征上的
J

M
值取均值,以得到所有地物类型的样本集在多维特征上的
J

M


[0013]上述技术方案中,任意两种地物类型的样本集,其植被指数相关性值
P
XY
的计算公式如下:;其中,
X

Y
分别指由任意两种地物类型的样本计算而构成的植被指数数据集合;
cov(X ,Y)

X

Y
的协方差;
σ
X
σ
Y

X

Y
的标准差乘积;
E(X)

E(Y)
分别是
X

Y
的数学期望;针对不同地物类型的样本集,获取每两种地物间植被指数相关性值,并进行均值处理,得到所有地物类型的样本集的植被指数相关性值

[0014]本专利技术还提供了一种双条件质量约束的对象级地物样本自适应生成系统,其特征在于:该系统用于上述技术方案所述的一种双条件质量约束的对象级地物样本自适应生成方法

[0015]本专利技术提出了双条件质量约束的对象级地物样本自适应生成方法及系统,其有益效果在于:本专利技术建立了一个根据样本质量进行自适应调整样本尺寸,进而自动生成样本集的整体框架,其可扩展性较强

对于需要大量对象级样本数据的实验场景中具有较强的应用价值,一方面该方法在现有的常用土地利用数据产品数据上
,
获取较为集中分布且长
时间未变化的不同地类块,将其作为样本提取的基础数据,有效反映地物特征

另一方面使用多源遥感数据构建特征空间,采用样本可分离度为主,地类间样本植被指数相关性指标为辅来评价样本质量,通过样本质量反馈的方式自动调整样本尺寸,以实现反复优化样本质量的目的

[0016]进一步地,本专利技术在现有土地利用数据产品基础上,采用多年份产品叠加生成地类像素图像,可有效提高各个像素的地类代表性,有利于后文高质量样本生成

[0017]进一步地,本专利技术先后采用样本可分离性以及植被指数相关性值作为指标对样本集进行评价,可有效提高指标评价过程的稳健性的同时本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种双条件质量约束的对象级地物样本自适应生成方法,其特征在于:包括以下步骤:基于土地利用数据产品,获取设定时间段内地物类型未发生变化的像素,形成土地利用类型像素图;基于土地利用类型像素图,获取各类地类样本的中心像素;以各类地物的中心像素作为其相应的代表样本点,结合样本尺寸,得到各类地物的样本区块,形成各类地物的样本集;基于各样本区块的多源特征,以样本可分离性和植被指数相关性值作为指标,评估样本集;如果不达标,重新获取各类地物的中心像素和样本区块,以生成新的样本集直至达标
。2.
根据权利要求1所述的方法,其特征在于:获取设定时间段内未发生变化的若干地类像素的过程包括:在线调用若干年份土地利用数据产品,对其重分类至特定的分类体系;筛选出在设定年数内地物类型未发生变化像素
。3.
根据权利要求1所述的方法,其特征在于:判定待评估样本集的样本可分离性符合设定标准后,再评估其植被指数相关性值是否达标
。4.
根据权利要求1所述的方法,其特征在于:获取任一地类的代表样本点的过程包括:针对土地利用类型像素图,采用设定的邻域尺寸的单位核函数对其进行滤波处理;基于设定的邻域尺寸,选择邻域均为同一种地物类型的中心像素位置作为该地物类型的代表样本点
。5.
根据权利要求4所述的方法,其特征在于:获取任一类地物样本区块的过程包括:基于设定的邻域尺寸,获取以中心像素为基准的四个斜角点像素;单向连接四个斜角点像素构成样本的边界线,形成样本区块
。6.
根据权利要求5所述的方法,其特征在于:针对不达标的样本集,重新设定邻域尺寸,再次执行获取各类地物的中心像素

样本区块和样本集的过程
。7.
根据权利要求5所述的方法,其特征在于:所述多源特征包括:波段特征

植被指数特征

纹理特征

极化特征和地形因子
。8.
根据权利要求1所述的方法,其特征在于:任意两种地物类型样本集之间,在任一种特征上的样本可分离性
J

M
的计算公式如下:;上式中,
B
为待计算的两种地物类型样本之间的巴氏距离;所述巴氏距离
B<...

【专利技术属性】
技术研发人员:姚金玺余绍淮张晟斌余顺新徐乔庄稼丰余飞罗博仁刘德强
申请(专利权)人:中交第二公路勘察设计研究院有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1