一种解决遥感影像多分类场景分割算法数据不均衡的方法技术

技术编号:27744288 阅读:18 留言:0更新日期:2021-03-19 13:38
本发明专利技术公开了一种解决遥感影像多分类场景分割算法数据不均衡的方法,该方法包括以下步骤:A.将遥感影像与标签按固定大小切割,输出样本数据集;B.遍历样本数据,按样本类别归类到样本数据子集中;C.从数据子集中采样得到batch数据组;D.batch数据组提供给算法训练;E.重复C、D步骤。本发明专利技术通过将遥感影像与标签按固定大小切割,输出样本数据集,然后遍历样本数据,按样本类别归类到样本数据子集中,从数据子集中采样得到batch数据组,batch数据组提供给算法训练,重复采样得到batch数据组和算法训练,解决了实际场景中样本数据不均衡导致算法失效的问题,而且提高了算法的精准度。

【技术实现步骤摘要】
一种解决遥感影像多分类场景分割算法数据不均衡的方法
本专利技术属于深度学习技术
,具体为一种解决遥感影像多分类场景分割算法数据不均衡的方法。
技术介绍
遥感影像(简称:RS,英文:RemoteSensingImage)是指记录各种地物电磁波大小的胶片或照片,主要分为航空像片和卫星相片。用计算机处理的遥感图像必须是数字图像。以摄影方式获取的模拟图像必须用图像扫描仪等进行模/数(A/D)转换;以扫描方式获取的数字数据必须转存到一般数字计算机都可以读出的CCT等通用载体上。计算机图像处理要在图像处理系统中进行。图像处理系统是由硬件(计算机、显示器、数字化仪、磁带机等等)和软件(具有数据输入,输出,校正,变换,分类等功能)构成。图像处理内容主要包括校正、变换和分类。基于深度学习技术的多分类场景分割算法近来不断完善,在很多领域得到了广泛的应用。基于深度学习的多分类场景分割算法的效果与训练数据样本的质量密不可分,通常情况下,公开数据集中样本会得到妥善的筛选处理,多类别数据样本均衡,因此一般算法并没有针对不合理的数据样本做出解决方案。在实际应用中,遥感影像多类别数据会不可避免地出现类别样本数量不均衡的状况,算法难以学习小样本类别的特征,最终的算法分割效果因此也会异常糟糕。由于样本分布的不均衡,造成算法只学习到部分样本的特征,其余类别的准确度都相对很低甚至接近于零。即由于样本数据不均衡导致算法失效。针对相关技术中的问题,目前尚未提出有效的解决方案,为此,我们提出一种解决遥感影像多分类场景分割算法数据不均衡的方法。
技术实现思路
(一)解决的技术问题针对现有技术的不足,本专利技术提供一种解决遥感影像多分类场景分割算法数据不均衡的方法,解决了
技术介绍
中提到的问题。(二)技术方案为实现上述目的,本专利技术提供如下技术方案:一种解决遥感影像多分类场景分割算法数据不均衡的方法,该方法包括以下步骤:A.将遥感影像与标签按固定大小切割,输出样本数据集;B.遍历样本数据,按样本类别归类到样本数据子集中;C.从数据子集中采样得到batch数据组;D.batch数据组提供给算法训练;E.重复C、D步骤。优选的,步骤C具体包括如下:S1统计各个子集的样本数量,并得到样本数量最多的子集的样本数量x;S2在单次训练epoch中,从样本数量最多的子集中随机取出第i个非重复样本;S3x除以i取整后分别乘以其余子集的样本数量得到其余子集的样本索引,通过样本索引获得其余子集中的样本;S4将子集采样到的样本组合作为一个batch数据提供给算法。优选的,所述batch数据组中的batch指批处理(Batch),也称为批处理脚本,顾名思义,批处理就是对某对象进行批量的处理,通常被认为是一种简化的脚本语言,它应用于DOS和Windows系统中,批处理文件的扩展名为bat,目前比较常见的批处理包含两类:DOS批处理和PS批处理,PS批处理是基于强大的图片编辑软件Photoshop的,用来批量处理图片的脚本;而DOS批处理则是基于DOS命令的,用来自动地批量地执行DOS命令以实现特定操作的脚本,更复杂的情况,需要使用if、for、goto等命令控制程式的运行过程,如同C、Basic等高级语言一样,如果需要实现更复杂的应用,利用外部程式是必要的,这包括系统本身提供的外部命令和第三方提供的工具或者软件,批处理程序虽然是在命令行环境中运行,但不仅仅能使用命令行软件,任何当前系统下可运行的程序都可以放在批处理文件中运行。优选的,所述batch数据组中的batch数据语言还包括许多软件自带的批处理语言,如MicrosoftOffice、VisualStudio、AdobePhotoshop所内置的批处理语言的功能,用户可通过它们让相应的软件执行自动化操作(例如调整某个资料夹所有PSD图档的解析度),而这类批处理语言也大多提供把一系列操作录制为批处理文件的功能,这样用户不必写程式就能得到批处理程序。(三)有益效果与现有技术相比,本专利技术提供了一种解决遥感影像多分类场景分割算法数据不均衡的方法,具备以下有益效果:本专利技术通过将遥感影像与标签按固定大小切割,输出样本数据集,然后遍历样本数据,按样本类别归类到样本数据子集中,从数据子集中采样得到batch数据组,batch数据组提供给算法训练,重复采样得到batch数据组和算法训练,解决了实际场景中样本数据不均衡导致算法失效的问题,而且提高了算法的精准度。附图说明图1为本专利技术工作流程图;图2为本专利技术采样的流程图;图3为本专利技术采样的具体成果图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。请参考图1-3所示,本专利技术提出一种解决遥感影像多分类场景分割算法数据不均衡的方法,该方法包括以下步骤:A.将遥感影像与标签按固定大小切割,输出样本数据集;B.遍历样本数据,按样本类别归类到样本数据子集中;C.从数据子集中采样得到batch数据组;D.batch数据组提供给算法训练;E.重复C、D步骤。其中,步骤C具体是:S1统计各个子集的样本数量,并得到样本数量最多的子集的样本数量x;S2在单次训练epoch中,从样本数量最多的子集中随机取出第i个非重复样本;S3x除以i取整后分别乘以其余子集的样本数量得到其余子集的样本索引,通过样本索引获得其余子集中的样本;S4将子集采样到的样本组合作为一个batch数据提供给算法。在应用本次解决遥感影像多分类场景分割算法数据不均衡的方法后,算法对于各个类别的准确度皆有提升,准确度平均指标为0.8631。。其中,所述batch数据组中的batch指批处理(Batch),也称为批处理脚本,顾名思义,批处理就是对某对象进行批量的处理,通常被认为是一种简化的脚本语言,它应用于DOS和Windows系统中,批处理文件的扩展名为bat,目前比较常见的批处理包含两类:DOS批处理和PS批处理,PS批处理是基于强大的图片编辑软件Photoshop的,用来批量处理图片的脚本;而DOS批处理则是基于DOS命令的,用来自动地批量地执行DOS命令以实现特定操作的脚本,更复杂的情况,需要使用if、for、goto等命令控制程式的运行过程,如同C、Basic等高级语言一样,如果需要实现更复杂的应用,利用外部程式是必要的,这包括系统本身提供的外部命令和第三方提供的工具或者软件,批处理程序虽然是在命令行环境中运行,但不仅仅能使用命令行软件,任何当前系统下可运行的程序都可以放在批处理文件中运行。其中,所述batch本文档来自技高网
...

【技术保护点】
1.一种解决遥感影像多分类场景分割算法数据不均衡的方法,其特征在于,该方法包括以下步骤:/nA.将遥感影像与标签按固定大小切割,输出样本数据集;/nB.遍历样本数据,按样本类别归类到样本数据子集中;/nC.从数据子集中采样得到batch数据组;/nD.batch数据组提供给算法训练;/nE.重复C、D步骤。/n

【技术特征摘要】
1.一种解决遥感影像多分类场景分割算法数据不均衡的方法,其特征在于,该方法包括以下步骤:
A.将遥感影像与标签按固定大小切割,输出样本数据集;
B.遍历样本数据,按样本类别归类到样本数据子集中;
C.从数据子集中采样得到batch数据组;
D.batch数据组提供给算法训练;
E.重复C、D步骤。


2.根据权利要求1所述的一种解决遥感影像多分类场景分割算法数据不均衡的方法,其特征在于,步骤C具体包括如下:
S1统计各个子集的样本数量,并得到样本数量最多的子集的样本数量x;
S2在单次训练epoch中,从样本数量最多的子集中随机取出第i个非重复样本;
S3x除以i取整后分别乘以其余子集的样本数量得到其余子集的样本索引,通过样本索引获得其余子集中的样本;
S4将子集采样到的样本组合作为一个batch数据提供给算法。


3.根据权利要求1所述的一种解决遥感影像多分类场景分割算法数据不均衡的方法,其特征在于,所述batch数据组中的batch指批处理(Batch),也称为批处理脚本,顾名思义,批处理就是对某对象进行批量的处理,通常被认为是一种简化的脚本语言,它应用于DOS和Wi...

【专利技术属性】
技术研发人员:冯喆王江安
申请(专利权)人:陕西土豆数据科技有限公司
类型:发明
国别省市:陕西;61

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1