【技术实现步骤摘要】
基于聚类的无监督细粒度图像分类模型训练方法及分类方法
[0001]本专利技术涉及基于聚类的无监督细粒度图像分类模型训练方法及分类方法,属于计算机视觉
技术介绍
[0002]与通用图像分类相比,细粒度图像分类是一种需要区分更细粒度类别的图像分类任务。由于目标类别间差异更小,而类内又存在各种变化,因此细粒度图像分类任务极具挑战性。现有解决细粒度图像分类任务的方法大多基于有监督的标签信息来指导学习一个有效的模型,以实现在未知数据上好的推广能力。但是,细粒度图像分类任务中类别间差异小,使得数据标注困难、代价高,难以判断一个样本属于两种相近类别中的哪一个。
[0003]考虑到无监督学习不需要数据标签的优势,近年来在通用图像分类任务和个体级行人再识别任务上,不少研究者提出了基于聚类的无监督学习方法,利用聚类技术为无标签数据赋上伪标签,再利用伪标签指导学习,典型代表有基于kmeans聚类的方法、基于DBSCAN聚类的方法,这些方法可以克服标注难题。这两类方法在进行图像分类任务时,通用图像分类任务一般类别数少、单类样本多, ...
【技术保护点】
【技术特征摘要】
1.一种基于聚类的无监督细粒度图像分类模型训练方法,其特征在于,包括:获取细粒度图像数据;利用预先训练或训练过程中的细粒度图像分类模型,提取细粒度图像的特征并进行归一化处理,得到归一化特征;利用预定的聚类方法对所述归一化特征进行聚类,根据聚类结果对相应图像数据赋值伪标签,构建带伪标签的图像数据;利用所述带伪标签的图像数据对细粒度图像分类模型进行训练,采用批量随机梯度下降算法更新模型中参数,并动量更新各聚类的特征中心;其中,各聚类的特征中心由同一带伪标签的图像数据所对应的归一化特征计算加权均值得到;重复聚类和训练过程,当聚类结果多次不变或达到预设最大执行次数时退出,得到训练完成的无监督细粒度图像分类模型,以及细粒度图像的伪标签。2.根据权利要求1所述的基于聚类的无监督细粒度图像分类模型训练方法,其特征在于,所述细粒度图像分类模型包括网络层、全连接层、带参数的全局均值池化层和处理层,无监督细粒度图像依次输入网络层、全连接层和带参数的全局均值池化层进行特征提取,提取的特征输入处理层进行L2归一化。3.根据权利要求1所述的基于聚类的无监督细粒度图像分类模型训练方法,其特征在于,所述预定的聚类方法包括:DBSCAN聚类算法或HDBSCAN聚类算法。4.根据权利要求1所述的基于聚类的无监督细粒度图像分类模型训练方法,其特征在于,所述各聚类的特征中心,通过下式得到:式(1)中,为第k类的特征中心,N
k
为第k类中样本的数量,为第k类的第i个样本的归一化特征,为对应的加权权重,通过下式得到:式(2)中,为第k类所有样本特征的集合,exp()表示指数函数,距离度量采用以下三种计算方式中任一种进行计算得到:(1)不考虑距离约束,取(2)通过最小距离计算:表示计算特征到该类其他所有样本特征的最小距离;(3)通过平均距离计算:表示计算特征到该类其他所有样本特征的平均距离。
5.根据权利要求1所述的基于聚类的无监督细粒度图像分类模型训练方法,其特征在于,所述细粒度图像分类模型采用InfoNCE损失函数指导学习,其目标损失为:式(3)中,f
q
为第q个样本的归一化特征,c
+
表示第q个样本特征所属类的特征中心,c
k
表示第k个类的特征中心,t表示温度超参数,d(,)表示归一化特征到类特征中心的距离,采用欧式距离度量;当f
q
与其类特征中心c
+
越近,与其他类特征中心越远时,损失越小。6.根据权利要求1所述的基于聚类的无监督细粒度图像分类模型训练方法,其特征在于,所述采用批量随机梯度下降算法更新模型中参数,选用Adam优化器进行参数更新,并动量更新各聚类的特征中心,...
【专利技术属性】
技术研发人员:王家宝,李阳,苗壮,张睿,
申请(专利权)人:中国人民解放军陆军工程大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。