一种基于AUC优化的锐度感知最小化的图像分类训练方法技术

技术编号：44907708 阅读：25 留言：0更新日期：2025-04-08 18:53

本发明专利技术提供了一种基于AUC优化的锐度感知最小化的图像分类训练方法，本发明专利技术的技术方案通过对锐度感知最小化技术中所采用的扰动进行调整，利用预设的加扰超参数对关于模型参数的第一梯度进行映射，确定模型参数对应的扰动，从而避免实例级形式I‑AUC与锐度感知最小化技术的直接的适配所导致的复杂的极小极大‑极小极大优化问题，有效降低模型训练的时间，减少能源的消耗；同时，借助锐度感知最小化技术，有效提升了模型的泛化能力。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及数据处理，具体来说涉及基于神经网络的图像分类，更具体地说，涉及一种基于auc优化的锐度感知最小化的图像分类训练方法。

技术介绍

1、在现实世界的数据集中，通常会出现长尾分布的情况，即头部类别样本数量较多，而尾部类别样本数量较少。在这种情况下，传统的评估指标（如准确率）通常会忽略尾部的表现，从而无法有效地衡量模型的性能。因此，roc曲线下面积（area under curve，简称auc）因为其对类别分布不敏感的特性逐渐成为了一种流行的评估指标，被广泛应用于许多长尾场景中，例如金融欺诈检测、疾病诊断和异常检测。

2、目前，优化auc的方法主要有两种。基于经验风险最小化原则的原始auc优化方法，称之为成对形式(p-auc)，成对形式是指将样本组成正类和负类构成的样本对形式来指导模型训练，旨在最大化正负类之间的平均成对排名准确性。尽管成对形式能够有效优化代理指标的无偏估计，但其每次迭代的时间复杂度为，其中，和分别表示正例和负例的数量。鉴于此，文献[1]将原问题重新表述为实例级的极小极大问题，称为实例级形式 (i-au...

【技术保护点】

1.一种图像分类训练方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，所述扰动是由关于模型的第一梯度除以预设的加扰超参数得到的。

3.根据权利要求1或2所述的方法，其特征在于，所述扰动按照以下方式计算：

4.根据权利要求3所述的方法，其特征在于，第一损失函数为：

5.根据权利要求4所述的方法，其特征在于，在训练过程中，对模型参数、可学习参数和可学习参数使用梯度下降法进行更新，对可学习参数使用梯度上升法进行更新。

6.一种图像分类方法，其特征在于，所述方法包括：

7.一种异常检测方法，其特征在于，...

【技术特征摘要】

1.一种图像分类训练方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，所述扰动是由关于模型的第一梯度除以预设的加扰超参数得到的。

3.根据权利要求1或2所述的方法，其特征在于，所述扰动按照以下方式计算：

4.根据权利要求3所述的方法，其特征在于，第一损失函数为：

5.根据权利要求4所述的方法，其特征在于，在训练过程中，对模型参数、可学习参数和可学习参数使用梯度下降法进行更新，对可学习参数使用梯度...

【专利技术属性】
技术研发人员：黄庆明，许志康，许倩倩，王子泰，杨智勇，
申请(专利权)人：中国科学院计算技术研究所，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人