【技术实现步骤摘要】
未知类别图像分类方法、装置、计算机设备及存储介质
[0001]本专利技术实施例涉及图像识别领域,尤其涉及一种未知类别图像分类方法、装置、计算机设备及存储介质。
技术介绍
[0002]目前,基于监督学习的电力图像缺陷分类模型已经得到了广泛应用,然而,这类模型需要大规模有标签图像进行模型训练来学习特征提取能力,在电力设备缺陷识别场景中,为每一个缺陷类别采集足够的图像往往是不现实的,此外还需要投入大量的人力对采集的原始图像进行标注,训练好的模型在没有图像参与训练的类别上表现效果下滑,新的缺陷类别需要重新训练,不利于电力设备缺陷的及时识别,因此需要引入零样本学习实现对未知类别的准确快速识别。
[0003]零样本学习的任务是为未知类别(训练集中不包含该类别的样本)进行图像分类,这就需要中间特征在类别标签与图像之间建立联系,目前零样本学习领域常用的中间特征有属性向量、词向量等,属性向量是人类对类别图像的直观感受,效果往往比依赖于上下文信息得到的词向量好,然而属性标注过程需要大量人力投入和专家知识,限制了零样本学习在新数据集上的拓展。此外,受限于人类的认知局限,其标注的属性无法遍历视觉空间,因而图像中一些具有辨别性的特征无法被属性捕捉,导致零样本学习效果不佳。
技术实现思路
[0004]鉴于此,为解决上述技术问题或部分技术问题,本专利技术实施例提供一种未知类别图像分类方法、装置、计算机设备及存储介质。
[0005]第一方面,本专利技术实施例提供一种未知类别图像分类方法,包括:
[0006]基 ...
【技术保护点】
【技术特征摘要】
1.一种未知类别图像分类方法,其特征在于,包括:基于已知类别的第一图像训练初始类别标签嵌入提取模型;基于未知类别的第二图像对所述初始类别标签嵌入提取模型进行微调,得到微调后的第二类别标签嵌入提取模型;获取待分类的第三图像,基于所述第二类别标签嵌入提取模型对所述第三图像进行分类,得到所述第三图像对应的图像类别。2.根据权利要求1所述的方法,其特征在于,所述基于已知类别的第一图像训练初始类别标签嵌入提取模型,包括:将所述第一图像分割成多个第一图像块;将所述多个第一图像块输入至初始模型中,得到所述第一图像对应的第一已知类别标签嵌入;基于所述第一已知类别标签嵌入对所述第一图像进行还原,得到还原后的第一图像。3.根据权利要求2所述的方法,其特征在于,所述方法还包括:通过第一公式计算所述第一图像和所述还原后的第一图像的重构损失,所述重构损失采用均方误差计算,所述第一公式为:其中,L
res
表示均方误差,N表示图像中像素点个数,i表示其中一个像素点,x
i
表示第一图像的一个像素点,x
′
i
表示还原后的第一图像的一个像素点;基于所述均方误差通过第二公式计算训练所述初始模型的损失函数,所述第二公式为:L
c
=αL
cls
+βL
res
+γL
s
其中,α、β、γ分别表示各部分的重要程度,为超参数,L
cls
表示类别标签嵌入分类损失,L
cls
=CE(y
′
x
,y
x
),y
x
为图像x的真实标签,分类标签y
′
x
为函数f
cls
输出并使用交叉熵计算分类损失,L
s
表示将已知类别标签嵌入映射到语义空间的映射函数f
s
的目标函数,通过第三公式计算得到,所述第三公式为:其中,wv
c
表示类别c的词向量;在所述损失函数L
c
符合预设条件时,将所述初始模型作为所述初始类别标签嵌入提取模型。4.根据权利要求2所述的方法,其特征在于,所述基于未知类别的第二图像对所述初始类别标签嵌入提取模型进行微调,得到微调后的第二类别标签嵌入提取模型,包括:将所述未知类别的第二图像分割成多个第二图像块;将所述多个第二图像块和多个随机初始化可学习的提示向量输入到所述初始类别标签嵌入提取模型,得到所述第二图像对应的...
【专利技术属性】
技术研发人员:张屹,张国梁,杜泽旭,周飞,刘浩,林龙,刘卫卫,
申请(专利权)人:国网智能电网研究院有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。