未知类别图像分类方法、装置、计算机设备及存储介质制造方法及图纸

技术编号:38194173 阅读:12 留言:0更新日期:2023-07-20 21:14
本发明专利技术实施例涉及一种未知类别图像分类方法、装置、计算机设备及存储介质,包括:基于已知类别的第一图像训练初始类别标签嵌入提取模型;基于未知类别的第二图像对初始类别标签嵌入提取模型进行微调,得到微调后的第二类别标签嵌入提取模型;获取待分类的第三图像,基于第二类别标签嵌入提取模型对第三图像进行分类,得到第三图像对应的图像类别。由此,可以实现零样本学习,提升未知类别的图像分类准确率,降低人工成本。降低人工成本。降低人工成本。

【技术实现步骤摘要】
未知类别图像分类方法、装置、计算机设备及存储介质


[0001]本专利技术实施例涉及图像识别领域,尤其涉及一种未知类别图像分类方法、装置、计算机设备及存储介质。

技术介绍

[0002]目前,基于监督学习的电力图像缺陷分类模型已经得到了广泛应用,然而,这类模型需要大规模有标签图像进行模型训练来学习特征提取能力,在电力设备缺陷识别场景中,为每一个缺陷类别采集足够的图像往往是不现实的,此外还需要投入大量的人力对采集的原始图像进行标注,训练好的模型在没有图像参与训练的类别上表现效果下滑,新的缺陷类别需要重新训练,不利于电力设备缺陷的及时识别,因此需要引入零样本学习实现对未知类别的准确快速识别。
[0003]零样本学习的任务是为未知类别(训练集中不包含该类别的样本)进行图像分类,这就需要中间特征在类别标签与图像之间建立联系,目前零样本学习领域常用的中间特征有属性向量、词向量等,属性向量是人类对类别图像的直观感受,效果往往比依赖于上下文信息得到的词向量好,然而属性标注过程需要大量人力投入和专家知识,限制了零样本学习在新数据集上的拓展。此外,受限于人类的认知局限,其标注的属性无法遍历视觉空间,因而图像中一些具有辨别性的特征无法被属性捕捉,导致零样本学习效果不佳。

技术实现思路

[0004]鉴于此,为解决上述技术问题或部分技术问题,本专利技术实施例提供一种未知类别图像分类方法、装置、计算机设备及存储介质。
[0005]第一方面,本专利技术实施例提供一种未知类别图像分类方法,包括:
[0006]基于已知类别的第一图像训练初始类别标签嵌入提取模型;
[0007]基于未知类别的第二图像对所述初始类别标签嵌入提取模型进行微调,得到微调后的第二类别标签嵌入提取模型;
[0008]获取待分类的第三图像,基于所述第二类别标签嵌入提取模型对所述第三图像进行分类,得到所述第三图像对应的图像类别。
[0009]在一个可能的实施方式中,所述方法还包括:
[0010]将所述第一图像分割成多个第一图像块;
[0011]将所述多个第一图像块输入至初始模型中,得到所述第一图像对应的第一已知类别标签嵌入;
[0012]基于所述第一已知类别标签嵌入对所述第一图像进行还原,得到还原后的第一图像。
[0013]在一个可能的实施方式中,所述方法还包括:
[0014]通过第一公式计算所述第一图像和所述还原后的第一图像的重构损失,所述重构损失采用均方误差计算,所述第一公式为:
[0015][0016]其中,L
res
表示均方误差,N表示图像中像素点个数,i表示其中一个像素点,x
i
表示第一图像的一个像素点,x
i

表示还原后的第一图像的一个像素点;
[0017]基于所述均方误差通过第二公式计算训练所述初始模型的损失函数,所述第二公式为:
[0018]L
c
=αL
cls
+βL
res
+γL
s
[0019]其中,α、β、γ分别表示各部分的重要程度,为超参数,L
cls
表示类别标签嵌入分类损失,L
cls
=CE(y

x
,y
x
),y
x
为图像x的真实标签,分类标签y

x
为函数f
cls
输出并使用交叉熵计算分类损失,L
s
表示将已知类别标签嵌入映射到语义空间的映射函数f
s
的目标函数,通过第三公式计算得到,所述第三公式为:
[0020][0021]其中,wv
c
表示类别c的词向量;
[0022]在所述损失函数L
c
符合预设条件时,将所述初始模型作为所述初始类别标签嵌入提取模型。
[0023]在一个可能的实施方式中,所述方法还包括:
[0024]将所述未知类别的第二图像分割成多个第二图像块;
[0025]将所述多个第二图像块和多个随机初始化可学习的提示向量输入到所述初始类别标签嵌入提取模型,得到所述第二图像对应的类别标签嵌入;
[0026]计算所述第二图像对应的类别标签嵌入与所述第一已知类别标签嵌入的第一相似度;
[0027]计算所述第二图像对应的类别标签嵌入对应的类别词向量与所述第一已知类别标签嵌入对应的词向量的第二相似度;
[0028]基于所述第一相似度和所述第二相似度以及第二图像与还原的第二图像的重构损失对所述初始类别标签嵌入提取模型进行微调,得到微调后的第二类别标签嵌入提取模型和更新后的提示向量。
[0029]在一个可能的实施方式中,所述方法还包括:
[0030]基于第四公式计算所述第一相似度和所述第二相似度之间的距离,所述第四公式为:
[0031][0032]其中,p为第一相似度,q为第二相似度,i表示一个像素点;
[0033]将L
pt
最小值作为损失值对所述初始类别标签嵌入提取模型进行微调,得到微调后的第二类别标签嵌入提取模型。
[0034]在一个可能的实施方式中,所述方法还包括:
[0035]将所述已知类别的第一图像重新输入至所述第二类别标签嵌入提取模型,得到每
个已知类别对应的第二已知类别标签嵌入;
[0036]基于所述第二已知类别标签嵌入更新所述未知类别的第二图像对应的类别标签嵌入;
[0037]基于所述第二已知类别标签嵌入和更新后的未知类别的第二图像对应的类别标签嵌入更新原始类别标签嵌入数据库。
[0038]在一个可能的实施方式中,所述方法还包括:
[0039]将所述待分类的第三图像分割成多个第三图像块;
[0040]将所述多个第三图像块以及更新后的提示向量输入至所述第二类别标签嵌入提取模型,得到所述第三图像对应的第三类别标签嵌入;
[0041]将原始类别标签嵌入数据库中与所述第三类别标签嵌入的相似度最高的类别标签嵌入对应的图像类别作为所述第三图像对应的图像类别。
[0042]第二方面,本专利技术实施例提供一种未知类别图像分类装置,包括:
[0043]训练模块,用于基于已知类别的第一图像训练初始类别标签嵌入提取模型;
[0044]微调模块,用于基于未知类别的第二图像对所述初始类别标签嵌入提取模型进行微调,得到微调后的第二类别标签嵌入提取模型;
[0045]分类模块,用于获取待分类的第三图像,基于所述第二类别标签嵌入提取模型对所述第三图像进行分类,得到所述第三图像对应的图像类别。
[0046]第三方面,本专利技术实施例提供一种计算机设备,包括:处理器和存储器,所述处理器用于执行所述存储器中存储的未知类别图像分类程序,以实现上述第一方面中所述的未知类别图像分类方法。
[0047]第四方面,本专利技术实施例提供一种存储介本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种未知类别图像分类方法,其特征在于,包括:基于已知类别的第一图像训练初始类别标签嵌入提取模型;基于未知类别的第二图像对所述初始类别标签嵌入提取模型进行微调,得到微调后的第二类别标签嵌入提取模型;获取待分类的第三图像,基于所述第二类别标签嵌入提取模型对所述第三图像进行分类,得到所述第三图像对应的图像类别。2.根据权利要求1所述的方法,其特征在于,所述基于已知类别的第一图像训练初始类别标签嵌入提取模型,包括:将所述第一图像分割成多个第一图像块;将所述多个第一图像块输入至初始模型中,得到所述第一图像对应的第一已知类别标签嵌入;基于所述第一已知类别标签嵌入对所述第一图像进行还原,得到还原后的第一图像。3.根据权利要求2所述的方法,其特征在于,所述方法还包括:通过第一公式计算所述第一图像和所述还原后的第一图像的重构损失,所述重构损失采用均方误差计算,所述第一公式为:其中,L
res
表示均方误差,N表示图像中像素点个数,i表示其中一个像素点,x
i
表示第一图像的一个像素点,x

i
表示还原后的第一图像的一个像素点;基于所述均方误差通过第二公式计算训练所述初始模型的损失函数,所述第二公式为:L
c
=αL
cls
+βL
res
+γL
s
其中,α、β、γ分别表示各部分的重要程度,为超参数,L
cls
表示类别标签嵌入分类损失,L
cls
=CE(y

x
,y
x
),y
x
为图像x的真实标签,分类标签y

x
为函数f
cls
输出并使用交叉熵计算分类损失,L
s
表示将已知类别标签嵌入映射到语义空间的映射函数f
s
的目标函数,通过第三公式计算得到,所述第三公式为:其中,wv
c
表示类别c的词向量;在所述损失函数L
c
符合预设条件时,将所述初始模型作为所述初始类别标签嵌入提取模型。4.根据权利要求2所述的方法,其特征在于,所述基于未知类别的第二图像对所述初始类别标签嵌入提取模型进行微调,得到微调后的第二类别标签嵌入提取模型,包括:将所述未知类别的第二图像分割成多个第二图像块;将所述多个第二图像块和多个随机初始化可学习的提示向量输入到所述初始类别标签嵌入提取模型,得到所述第二图像对应的...

【专利技术属性】
技术研发人员:张屹张国梁杜泽旭周飞刘浩林龙刘卫卫
申请(专利权)人:国网智能电网研究院有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1