【技术实现步骤摘要】
本专利技术涉及数据处理,具体来说涉及基于神经网络的图像分类,更具体地说,涉及一种基于auc优化的锐度感知最小化的图像分类训练方法。
技术介绍
1、在现实世界的数据集中,通常会出现长尾分布的情况,即头部类别样本数量较多,而尾部类别样本数量较少。在这种情况下,传统的评估指标(如准确率)通常会忽略尾部的表现,从而无法有效地衡量模型的性能。因此,roc曲线下面积(area under curve,简称auc)因为其对类别分布不敏感的特性逐渐成为了一种流行的评估指标,被广泛应用于许多长尾场景中,例如金融欺诈检测、疾病诊断和异常检测。
2、目前,优化auc的方法主要有两种。基于经验风险最小化原则的原始auc优化方法,称之为成对形式(p-auc),成对形式是指将样本组成正类和负类构成的样本对形式来指导模型训练,旨在最大化正负类之间的平均成对排名准确性。尽管成对形式能够有效优化代理指标的无偏估计,但其每次迭代的时间复杂度为,其中,和分别表示正例和负例的数量。鉴于此,文献[1]将原问题重新表述为实例级的极小极大问题,称为实例级形式 (i-au
...【技术保护点】
1.一种图像分类训练方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述扰动是由关于模型的第一梯度除以预设的加扰超参数得到的。
3.根据权利要求1或2所述的方法,其特征在于, 所述扰动按照以下方式计算:
4.根据权利要求3所述的方法,其特征在于, 第一损失函数为:
5.根据权利要求4所述的方法,其特征在于,在训练过程中,对模型参数、可学习参数和可学习参数使用梯度下降法进行更新,对可学习参数使用梯度上升法进行更新。
6.一种图像分类方法,其特征在于,所述方法包括:
7.一种异常检
...【技术特征摘要】
1.一种图像分类训练方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述扰动是由关于模型的第一梯度除以预设的加扰超参数得到的。
3.根据权利要求1或2所述的方法,其特征在于, 所述扰动按照以下方式计算:
4.根据权利要求3所述的方法,其特征在于, 第一损失函数为:
5.根据权利要求4所述的方法,其特征在于,在训练过程中,对模型参数、可学习参数和可学习参数使用梯度下降法进行更新,对可学习参数使用梯度...
【专利技术属性】
技术研发人员:黄庆明,许志康,许倩倩,王子泰,杨智勇,
申请(专利权)人:中国科学院计算技术研究所,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。