场景分类模型的训练方法技术

技术编号:39511857 阅读:9 留言:0更新日期:2023-11-25 18:48
本发明专利技术提供了一种场景分类模型的训练方法

【技术实现步骤摘要】
场景分类模型的训练方法、遥感影像场景分类方法及设备


[0001]本专利技术涉及人工智能领域,具体涉及图像处理

深度学习

计算机视觉等
,尤其涉及一种场景分类模型的训练方法

遥感影像场景分类方法

电子设备及存储介质


技术介绍

[0002]遥感影像是由高空传感器对地表进行扫描和拍摄而捕获的图像数据,其包含了详细的地物构成和分布信息

但由于遥感场景构成复杂

地物目标较小

地物空间分布杂乱等因素,使得同一类遥感场景图像之间差异较大,而不同类遥感场景图像之间差异较小

另外,遥感影像中通常会包含多个类别的场景,而每个类别的场景在遥感影像中往往只占一小块区域,使得场景的分类更加困难

因此,如何提高遥感影像场景分类的准确性,仍然是一件非常具有挑战性的任务


技术实现思路

[0003]本专利技术提供一种场景分类模型的训练方法

遥感影像场景分类方法

电子设备

存储介质及计算机程序产品

[0004]根据本专利技术的一个方面,提供了一种场景分类模型的训练方法,场景分类模型包括特征提取网络

第一分类网络和第二分类网络,上述方法包括:获取第一样本影像集,第一样本影像集包括多个第一影像块和多个第一影像块各自的样本标签,样本标签用于表征相应的第一影像块中多个待分类场景所属的场景类别;利用特征提取网络对第一样本影像集中的每个第一影像块进行特征提取,得到每个第一影像块的局部特征;其中,特征提取网络是基于第二样本影像集对自动编码器进行训练而得到的;基于每个第一影像块的局部特征,生成针对每个第一影像块的视觉单词直方图;分别使用第一分类网络和第二分类网络基于视觉单词直方图,得到与各个待分类场景对应的第一分类结果和第二分类结果;根据第一分类结果

第二分类结果

样本标签和多个待分类场景之间的关联关系,确定针对第一分类结果的第一损失值和针对第二分类结果的第二损失值;以及根据第一损失值和第二损失值,分别调整第一分类网络和第二分类网络各自的参数

[0005]根据本专利技术的另一方面,提供了一种遥感影像场景分类方法,包括:基于待分类的遥感影像,获取多个第三影像块;利用场景分类模型中的特征提取网络对每个第三影像块进行特征提取,得到每个第三影像块的局部特征;基于每个第三影像块的局部特征,生成针对每个第三影像块的视觉单词直方图;利用场景分类模型中的第一分类网络和第二分类网络分别基于每个视觉单词直方图,得到各个待分类场景对应的第一分类结果和第二分类结果;以及根据各个待分类场景对应的第一分类结果和第二分类结果,得到针对待分类的遥感影像的场景分类结果;其中,场景分类模型是根据以上实施例中描述的场景分类模型的训练方法训练得到的

[0006]根据本专利技术的另一方面,提供了一种电子设备,包括:一个或多个处理器;存储器,
用于存储一个或多个程序,其中,当所述一个或多个程序被所述一个或多个处理器执行时,使得一个或多个处理器执行实现如上所述的方法

[0007]根据本专利技术的另一方面,提供了一种计算机可读存储介质,其上存储有可执行指令,该指令被处理器执行时使处理器执行实现如上所述的方法

[0008]根据本专利技术的另一方面,提供了一种计算机程序产品,包括计算机程序,该计算机程序在被处理器执行时实现如上所述的方法

附图说明
[0009]为了更清楚地说明本专利技术实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍

显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图

[0010]图1是本专利技术实施例的场景分类模型的训练方法的流程图;
[0011]图
2A
是本专利技术实施例的构建多个待分类场景之间的相关关系的示意图;
[0012]图
2B
是本专利技术实施例的多个待分类场景之间的混淆关系的示意图;
[0013]图3是本专利技术实施例的场景分类模型的训练方法的示意图;
[0014]图4是本专利技术实施例的遥感影像场景分类方法的流程图;
[0015]图5是本专利技术实施例的场景分类模型的训练装置的框图;
[0016]图6是本专利技术实施例的遥感影像场景分类装置的框图;
[0017]图7是根据本专利技术实施例的适用于实现场景分类模型的训练方法和遥感影像场景分类方法的电子设备的方框图

具体实施方式
[0018]下面将结合本专利技术实施例及实施例中的附图,对本专利技术实施例中的技术方案进行清楚

完整地描述

显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例

基于本专利技术中的实施例,本领域普通技术人员所获得的所有其他实施例,都属于本专利技术保护的范围

[0019]需要说明的是,以下方法中各个操作的序号仅作为该操作的表示以便描述,而不应被看作表示该各个操作的执行顺序

除非明确指出,否则该方法不需要完全按照所示顺序来执行

[0020]在本专利技术的技术方案中,所涉及的数据(例如包括但不限于用户个人信息)的收集

存储

使用

加工

传输

提供

公开和应用等处理,均符合相关法律法规的规定,且不违背公序良俗

[0021]在本专利技术的技术方案中,在获取或采集相关数据之前,均获取了数据归属者的授权或同意

[0022]图1是根据本专利技术实施例的场景分类模型的训练方法的流程图

[0023]请参阅图1,场景分类模型的训练方法包括操作
S110~S160。
在本专利技术实施例中,场景分类模型例如包括特征提取网络

第一分类网络和第二分类网络

[0024]在操作
S110
,获取第一样本影像集,第一样本影像集包括多个第一影像块和多个第一影像块各自的样本标签

[0025]在操作
S120
,利用特征提取网络对第一样本影像集中的每个第一影像块进行特征提取,得到每个第一影像块的局部特征

[0026]在操作
S130
,基于每个第一影像块的局部特征,生成针对每个第一影像块的视觉单词直方图

[0027]在操作
S140
,分别使用第一分类网络和第二分类网本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种场景分类模型的训练方法,所述场景分类模型包括特征提取网络

第一分类网络和第二分类网络,所述方法包括:获取第一样本影像集,所述第一样本影像集包括多个第一影像块和多个第一影像块各自的样本标签,所述样本标签用于表征相应的第一影像块中多个待分类场景所属的场景类别;利用所述特征提取网络对所述第一样本影像集中的每个第一影像块进行特征提取,得到每个第一影像块的局部特征;其中,所述特征提取网络是基于第二样本影像集对自动编码器进行训练而得到的;基于每个第一影像块的局部特征,生成针对所述每个第一影像块的视觉单词直方图;分别使用所述第一分类网络和所述第二分类网络基于所述视觉单词直方图,得到与各个待分类场景对应的第一分类结果和第二分类结果;根据所述第一分类结果

所述第二分类结果

所述样本标签和多个待分类场景之间的关联关系,确定针对所述第一分类结果的第一损失值和针对所述第二分类结果的第二损失值;以及根据所述第一损失值和所述第二损失值,分别调整所述第一分类网络和所述第二分类网络各自的参数
。2.
根据权利要求1所述的方法,其中,所述关联关系包括多个待分类场景之间的相关关系和混淆关系;所述第一分类网络包括与所述多个待分类场景各自对应的第一分类子网络;所述第二分类网络包括与所述多个待分类场景各自对应的第二分类子网络;所述根据所述第一分类结果

所述第二分类结果

所述样本标签和多个待分类场景之间的关联关系,确定针对所述第一分类结果的第一损失值和针对所述第二分类结果的第二损失值包括:根据所述样本标签和所述相关关系,生成用于训练每个第一分类子网络的第一分类标签;根据所述样本标签和所述混淆关系,生成用于训练每个第二分类子网络的第二分类标签;根据所述第一分类结果和所述第一分类标签,确定所述第一损失值;以及根据所述第二分类结果和所述第二分类标签,确定所述第二损失值
。3.
根据权利要求2所述的方法,其中,响应于所述相关关系包括与第一待分类场景具有相关性的第二待分类场景,针对任意一个第一分类子网络对应的第一待分类场景,执行以下操作中的其中之一:响应于确定所述样本标签中包括所述第一待分类场景,确定所述第一影像块中第一待分类场景对应的第一分类标签为1;响应于确定所述样本标签中不包括所述第一待分类场景,且包括所述第二待分类场景,确定所述第一影像块中第一待分类场景对应的第一分类标签为1;以及响应于确定所述样本标签中不包括所述第一待分类场景和所述第二待分类场景,确定所述第一影像块中第一待分类场景对应的第一分类标签为
0。4.
根据权利要求3所述的方法,其中,响应于所述混淆关系包括第三待分类...

【专利技术属性】
技术研发人员:鲁锦涛张丽李洁邹圣兵
申请(专利权)人:北京数慧时空信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1