样本生成方法、装置、设备及存储介质制造方法及图纸

技术编号:38141183 阅读:15 留言:0更新日期:2023-07-08 09:55
本申请提供了一种样本生成方法、装置、设备及存储介质,其中,该方法包括:将原始样本映射到第一标签体系中,得到原始样本的样本标签,然后根据样本标签映射得到业务标签,再基于业务标签对原始样本进行分类、切片和填充,得到最终的目标样本。本申请将样本的建立与使用相互隔离,解除其耦合关系,从而克服标签不统一以及样本标签语义不准确的问题,实现了样本真正的复用。本真正的复用。本真正的复用。

【技术实现步骤摘要】
样本生成方法、装置、设备及存储介质


[0001]本申请涉及遥感样本生成
,具体而言,涉及一种样本生成方法、装置、设备及存储介质。

技术介绍

[0002]随着对地观测技术的发展,越来越多的遥感数据被用于地表信息提取、资源与生态环境变化监测等诸多领域,发挥了巨大作用。随着深度学习技术的不断发展,通过构建大量样本数据训练深度学习网络,显著提高了遥感影像特征提取的成效。
[0003]现有的遥感解译样本库建设依托于独立标签体系。以现有的标签体系为参考依据,结合影像特征与实际业务需求制定标签集,并基于标签集进行样本库的生成。
[0004]但是,目前的独立标签体系下的样本标签存在语义不准确的问题,并且不同标签体系下相同地物图像的标签也不统一,因此生成的样本在应用到模型训练中时,会存在样本难以真正达到复用、模型泛化指标难以提升的问题。

技术实现思路

[0005]本申请的目的在于,针对上述现有技术中的不足,提供一种样本生成方法、装置、设备及存储介质,以解决现有技术中独立标签体系下的样本标签存在语义不准确的问题,不同标签体系下相同地物图像的标签不统一的问题。
[0006]为实现上述目的,本申请采用的技术方案如下:
[0007]第一方面,本申请提供了一种样本生成方法,所述方法包括:
[0008]将原始样本映射到第一标签体系中,得到所述原始样本的样本标签;
[0009]根据所述样本标签、预设的业务标签组以及业务标签与样本标签之间的映射关系,确定所述原始样本的业务标签,所述业务标签组包括多个业务标签,所述多个业务标签之间为平等层级关系;
[0010]根据所述业务标签和所述样本标签确定所述原始样本的样本类型,所述样本类型包括:完全映射、非完全映射;
[0011]根据所述样本类型对所述原始样本进行切片,得到目标样本,并将所述业务标签作为所述目标样本的样本标签。
[0012]可选的,所述根据所述样本标签、预设的业务标签组以及业务标签与样本标签之间的映射关系,确定所述原始样本的业务标签,包括:
[0013]基于业务标签与样本标签之间映射关系,获取所述业务标签组中与所述样本标签具有映射关系的业务标签;
[0014]将所述与所述样本标签具有映射关系的业务标签作为所述原始样本的业务标签。
[0015]可选的,所述根据所述业务标签和所述样本标签确定所述原始样本的样本类型,包括:
[0016]比对所述原始样本的业务标签的标识与样本标签的标识,得到比对结果;
[0017]根据所述比对结果,确定所述原始样本的样本类型。
[0018]可选的,所述根据所述比对结果,确定所述原始样本的样本类型,包括:
[0019]若所述比对结果指示所述业务标签的标识与样本标签的标识相同,则确定所述原始样本的样本类型为完全映射;
[0020]若所述比对结果指示所述业务标签的标识与样本标签的标识不同,则确定所述原始样本的样本类型为非完全映射。
[0021]可选的,所述根据所述样本类型对所述原始样本进行切片,得到目标样本,包括:
[0022]若所述样本类型为完全映射,则采用滑动窗口对所述原始样本进行切片,得到所述目标样本;
[0023][0024]若所述样本类型为非完全映射,则对所述原始样本进行图斑中置切片,并根据原始样本的应用场景对所述原始样本进行背景填充,得到目标样本。
[0025]可选的,所述根据原始样本的应用场景对所述原始样本进行背景填充,得到目标样本,包括:
[0026]若所述原始样本为初始模型训练样本,则对切片后的原始样本进行掩膜填充,得到目标样本;
[0027]若所述原始样本为模型泛化训练样本,则采用生成对抗网络对切片后的原始样本进行填充,得到目标样本。
[0028]可选的,所述原始样本包括影像数据和矢量数据;
[0029]所述将原始样本映射到第一标签体系中,得到所述原始样本的样本标签,包括:
[0030]读取所述原始样本的矢量数据;
[0031]根据所述矢量数据的字段信息将原始样本映射到第一标签体系中,得到所述原始样本的样本标签。
[0032]第二方面,本申请提供了一种样本生成装置,所述装置包括:
[0033]第一映射模块,用于将原始样本映射到第一标签体系中,得到所述原始样本的样本标签;
[0034]第二映射模块,用于根据所述样本标签、预设的业务标签组以及业务标签与样本标签之间的映射关系,确定所述原始样本的业务标签,所述业务标签组包括多个业务标签,所述多个业务标签之间为平等层级关系;
[0035]确定模块,用于根据所述业务标签和所述样本标签确定所述原始样本的样本类型,所述样本类型包括:完全映射、非完全映射;
[0036]切片模块,用于根据所述样本类型对所述原始样本进行切片,得到目标样本,并将所述业务标签作为所述目标样本的样本标签。
[0037]可选的,所述第二映射模块具体用于:
[0038]基于业务标签与样本标签之间映射关系,获取所述业务标签组中与所述样本标签具有映射关系的业务标签;
[0039]将所述与所述样本标签具有映射关系的业务标签作为所述原始样本的业务标签。
[0040]可选的,所述确定模块具体用于:
[0041]比对所述原始样本的业务标签的标识与样本标签的标识,得到比对结果;
[0042]根据所述比对结果,确定所述原始样本的样本类型。
[0043]可选的,所述确定模块还具体用于:
[0044]若所述比对结果指示所述业务标签的标识与样本标签的标识相同,则确定所述原始样本的样本类型为完全映射;
[0045]若所述比对结果指示所述业务标签的标识与样本标签的标识不同,则确定所述原始样本的样本类型为非完全映射。
[0046]可选的,所述切片模块具体用于:
[0047]若所述样本类型为完全映射,则采用滑动窗口对所述原始样本进行切片,得到所述目标样本;
[0048]若所述样本类型为非完全映射,则对所述原始样本进行图斑中置切片,并根据原始样本的应用场景对所述原始样本进行背景填充,得到目标样本。
[0049]可选的,所述切片模块还具体用于:
[0050]若所述原始样本为初始模型训练样本,则对切片后的原始样本进行掩膜填充,得到目标样本;
[0051]若所述原始样本为模型泛化训练样本,则采用生成对抗网络对切片后的原始样本进行填充,得到目标样本。
[0052]可选的,所述原始样本包括影像数据和矢量数据;
[0053]所述第一映射模块还具体用于:
[0054]读取所述原始样本的矢量数据;
[0055]根据所述矢量数据的字段信息将原始样本映射到第一标签体系中,得到所述原始样本的样本标签。
[0056]第三方面,本申请提供了一种电子设备,包括:处理器、存储介质和总线,所述存储介质存储有所述处理器可本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种样本生成方法,其特征在于,包括:将原始样本映射到第一标签体系中,得到所述原始样本的样本标签;根据所述样本标签、预设的业务标签组以及业务标签与样本标签之间的映射关系,确定所述原始样本的业务标签,所述业务标签组包括多个业务标签,所述多个业务标签之间为平等层级关系;根据所述业务标签和所述样本标签确定所述原始样本的样本类型,所述样本类型包括:完全映射、非完全映射;根据所述样本类型对所述原始样本进行切片,得到目标样本,并将所述业务标签作为所述目标样本的样本标签。2.根据权利要求1所述的方法,其特征在于,所述根据所述样本标签、预设的业务标签组以及业务标签与样本标签之间的映射关系,确定所述原始样本的业务标签,包括:基于业务标签与样本标签之间映射关系,获取所述业务标签组中与所述样本标签具有映射关系的业务标签;将所述与所述样本标签具有映射关系的业务标签作为所述原始样本的业务标签。3.根据权利要求1所述的方法,其特征在于,所述根据所述业务标签和所述样本标签确定所述原始样本的样本类型,包括:比对所述原始样本的业务标签的标识与样本标签的标识,得到比对结果;根据所述比对结果,确定所述原始样本的样本类型。4.根据权利要求3所述的方法,其特征在于,所述根据所述比对结果,确定所述原始样本的样本类型,包括:若所述比对结果指示所述业务标签的标识与样本标签的标识相同,则确定所述原始样本的样本类型为完全映射;若所述比对结果指示所述业务标签的标识与样本标签的标识不同,则确定所述原始样本的样本类型为非完全映射。5.根据权利要求1所述的方法,其特征在于,所述根据所述样本类型对所述原始样本进行切片,得到目标样本,包括:若所述样本类型为完全映射,则采用滑动窗口对所述原始样本进行切片,得到所述目标样本;若所述样本类型为非完全映射,则对所述原始样本进行图斑中置切片,并根据原始样本的应用场...

【专利技术属性】
技术研发人员:梁哲恒庞亚菲王洪飞范铀宋军钟勇
申请(专利权)人:广东南方数码科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1