【技术实现步骤摘要】
一种基于多目标优化的长尾分布图像分类方法
[0001]本专利技术涉及计算机网络
,具体涉及一种基于多目标优化的长尾分布图像分类方法。
技术介绍
[0002]随着硬件和软件水平的发展,人工智能特别是深度学习领域涌现了大量的研究。而在计算机视觉领域,深度学习也得到了大量的运用。图像分类是计算机视觉领域经典的任务之一,该任务旨在针对输入图像,利用网络模型给输入图像在预定义标签空间范围内打上类别标签。从深度学习技术逐渐成熟开始,图像分类受到了广泛的研究。
[0003]目前大多数图像分类方法是采用Resnet、ResnetXt、VGG等预训练网络作为模型的主干网络来提取图像特征,再针对性地设计分类器完成分类任务。这些图像分类方法大多是基于ImageNet、CIFAR10、CIFAR100等类别平衡数据集,这些数据集的各类别样本量是相同的。然而在现实世界中,数据分布服从长尾分布,是类别不均衡的,即部分类别有大量的样本,而其他类别的样本量很少。这种数据集的类别不均衡现象导致基于深度卷积神经网络的模型在训练过程中,会偏向于学习 ...
【技术保护点】
【技术特征摘要】
1.一种基于多目标优化的长尾分布图像分类方法,其特征在于,该方法包括以下步骤:步骤S1、训练集T中随机无重复采样一个批次的数据获取一个批次的所有类别k的样本{x,y}的预测值Z
k
,将该批次的数据集输入到以Resnet32为主干的模型预训练网络;步骤S2、计算当前批次各类别的损失值,具体包括以下步骤:步骤S2.1、对当前批次各类别的预测值Z
k
分别使用Softmax函数处理,获得相应的预测概率值Pk,步骤S2.2、将当前批次所包含的每个类别k的预测概率值P
k
及其相应的标签向量y
k
输入到交叉熵函数中,计算当前批次中各类别样本的损失值L
k
,L
k
∈R,R表示实数集;步骤S3、将当前批次各类样本的损失值L
k
逐个反向传播,求解各类样本对应的网络梯度G
k
;步骤S4、采用L2 Normalization通过将当前批次各类别k对应的网络梯度G
k
归一化成将归一化后的网络梯度输入到FRANKWOLFESOLVER模块计算获得当前批次各类样本对应的权重α
k
;步骤S5、使用计算得到的权重α
k
对各类别的损失值L
k
加权求和,得到最终的网络梯度G
f
,使用G
f
反向传播并更新网络参数;网络梯度G
f
公式如下:其中,{C0,...,C
m
}为类别C的集合表示;步骤S6、重复步骤一到五直到训练完成,获得最优模型,利用该最优模型进行预测图像类别,输出预测结果的标签L。2.如权利要求1所述的基于多目标优化的长尾分布图像分类方法,其特征在于,求解当前批次各类样本的预测概率值P
...
【专利技术属性】
技术研发人员:冯伟,李炜骐,万亮,李楠,张乾,王小伟,巩一璞,
申请(专利权)人:天津大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。