一种图像二分类模型的训练方法、图像识别方法技术

技术编号：40436152 阅读：9 留言：0更新日期：2024-02-22 23:00

本发明专利技术实施例提供了一种图像二分类模型的训练方法，图像二分类模型用于判定图像为二分类中的一类的概率，该方法包括：S1、获取原始图像训练集；S2、对所述原始图像训练集按照预设的规则添加分布扰动，得到对应的图像对抗训练集；S3、利用图像对抗训练集对所述图像二分类模型进行多次迭代训练，并在每次迭代训练时基于正样本为目标图像的概率预测值以及负样本为目标图像的概率预测值计算图像二分类模型的性能评估结果；S4、根据图像二分类模型的性能评估结果，基于目标逐样本损失函数更新图像对抗训练集以及图像二分类模型中可学习的参数。通过上述方法训练图像二分类模型，提高了AUC在分布扰动下的鲁棒性，从而提高图像二分类模型的性能。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及机器学习领域的图像分类领域，具体来说，涉及图像分类模型训练过程中的auc优化与分布鲁棒优化领域，更具体来说，涉及一种图像二分类模型的训练方法、图像识别方法。

技术介绍

1、接收者操作特征(receiver operating characteristic，roc)曲线是一种常用于评估二分类模型性能的方法，roc曲线下面积(area under the curve，auc)是机器学习中的重要指标，由于其统计意义等同于正确排列随机正负样本对的概率，即auc作为一种与类别比例无关的指标，成为了长尾场景下更适合的模型评价指标，因此，在面对不平衡分类问题时，auc是一种比准确性更为合适的模型评价指标。近年来，关于auc应用的研究在各种场景中迅速扩展，包括医疗图像分类、异常行为检测等。

2、当前关于auc优化的研究是假定训练集和测试集具有相同的分布，这在测试环境存在高度不确定性时难以满足。而这种情况在现实世界的应用中又非常常见，如在医学图像中，就往往存在各种噪声。

3、分布鲁棒优化(dro)作为一种处理分布不确定性的技术，已经成为各种应用中的热门解决方案，包括机器学习、能源系统和运输问题等。dro旨在开发一种模型，即使在与原始训练分布的指定距离内的最具对抗性的分布下也能表现良好。然而，现有的dro方法主要关注准确性作为评价指标，而当前的dro方法也难以直接应用于auc优化。

4、值得注意的是，研究人员曾讨论过关于auc优化和dro技术的结合，其讨论内容为：通过dro技术构建了偏auc及双路偏

5、综上所述，当前的dro方法也难以直接应用于auc优化；通过dro技术构建了偏auc及双路偏auc的估计的方法导致auc在分布扰动下的鲁棒性不高，从而使得分类模型的性能不好，在这种背景下，如何提高auc在分布扰动下的鲁棒性，从而提高分类模型的性能成为了一种亟需解决的问题。

技术实现思路

1、因此，本专利技术的目的在于克服上述现有技术的缺陷，提供一种图像二分类模型的训练方法、图像识别方法。

2、本专利技术的目的是通过以下技术方案实现的：

3、根据本专利技术的第一方面，提供一种图像二分类模型的训练方法，所述图像二分类模型用于判定图像为二分类中的一类的概率，所述方法包括：

4、s1、获取原始图像训练集，所述原始图像训练集包括正样本集合和负样本集合，其中，所述正样本集合包括多个正样本且所述正样本是目标图像，以及所述负样本集合包括多个负样本且所述负样本是非目标图像；

5、s2、对所述原始图像训练集按照预设的规则添加分布扰动，得到对应的图像对抗训练集；

6、s3、利用所述图像对抗训练集对所述图像二分类模型进行多次迭代训练，并在每次迭代训练时基于正样本为目标图像的概率预测值以及负样本为目标图像的概率预测值计算所述图像二分类模型的性能评估结果；

7、s4、根据所述图像二分类模型的性能评估结果，基于目标逐样本损失函数更新所述图像对抗训练集以及所述图像二分类模型中可学习的参数。

8、在本专利技术的一些实施例中，在所述步骤s2中，所述预设的规则是：添加扰动后的图像对抗训练集与原始图像训练集的沃瑟斯坦距离在预设的最大扰动距离内。

9、在本专利技术的一些实施例中，对原始图像训练集中的正样本集合和负样本集合添加相同的分布扰动，并使添加分布扰动后的图像对抗训练集与原始图像训练集的沃瑟斯坦距离在第一预设最大距离内。

10、在本专利技术的一些实施例中，在所述步骤s3中，采用如下方式计算所述图像二分类模型的性能评估结果：

11、

12、其中，fθ表示在可学习参数θ下的图像二分类模型，为原始图像训练集，为图像对抗训练集，表示原始图像训练集和图像对抗训练集之间的沃瑟斯坦距离，表示在图像对抗训练集下的期望，l(·)为损失函数，zi表示图像对抗训练集中第i个正样本，zj表示图像对抗训练集中第j个负样本，fθ(zi)表示第i个正样本为目标图像的概率预测值，fθ(zj)表示第j个负样本为目标图像的概率预测值，∈为第一预设最大距离。

13、在本专利技术的一些实施例中，在所述步骤s4中，所述目标逐样本损失函数为：

14、

15、

16、其中，a、b、α以及λ均为可学习的参数，zk表示图像对抗训练集中第k个样本，φθ,a,b,λ,α(zk)表示样本zk在可学习参数θ,a,b,λ以及α下对应的最大值函数。

17、在本专利技术的一些实施例中，对原始图像训练集中的正样本集合和负样本集合添加不同的分布扰动，并使添加分布扰动后的正样本对抗集合与原始图像训练集中的正样本集合之间的沃瑟斯坦距离在第二预设最大距离内，以及使添加分布扰动后的负样本对抗集合与原始图像训练集中的负样本集合之间的沃瑟斯坦距离在第三预设最大距离内。

18、在本专利技术的一些实施例中，在所述步骤s3中，采用如下方式计算所述图像二分类模型的性能评估结果：

19、

20、其中，fθ表示在可学习参数θ下的图像二分类模型，为原始图像训练集，为原始图像训练集中的正样本训练集，为原始图像训练集中的负样本训练集，为图像对抗训练集，为图像对抗训练集中的正样本对抗训练集，为图像对抗训练集中的负样本对抗训练集，∈+为第二预设最大扰动距离，∈-为第三预设最大扰动距离，表示正样本对抗训练集与正样本训练集之间的沃瑟斯坦距离，表示负样本对抗训练集与负样本训练集之间的沃瑟斯坦距离，表示在正样本对抗训练集和负样本对抗训练集下的期望，l(·)为损失函数，zi表示正样本对抗训练集中第i个正样本，zj表示负样本对抗训练集中第j个负样本，fθ(zi)表示第i个正样本为目标图像的概率预测值，fθ(zj)表示第j个负样本为目标图像的概率预测值。

21、在本专利技术的一些实施例中，在所述步骤s4中，所述目标逐样本损失函数为：

22、

23、

24、其中，a、b、α、λ+以及λ-均为可学习的参数，表示图像对抗训练集中正样本的比例，表示在正样本对抗训练集下的期望，表示在负样本对抗训练集下的期望，表示正样本zi在可学习参数θ,a,b,λ+以及α下对应的最大值函数，表示负样本zj在可学习参数θ,a,b,λ-以及α下对应的最大值函数。

25、根据本专利技术的第二方面，提供一种图像识别方法，所述方法包括：

26、获取待识别的图像；

27、采用上述实施例中所述的图像二分类模型对待识别图像进行识别以获取其为目标图像的概率；

28、基于概率判定待识别图像是否为目标图像。

29、根据本专利技术的第三方面，提供一种电子设备，包括：一个或多个处理器；存储装置，用于存储一个或多个程序，当所述一个或多个程序被所述一个本文档来自技高网...

【技术保护点】

1.一种图像二分类模型的训练方法，所述图像二分类模型用于判定图像为二分类中的一类的概率，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，在所述步骤S2中，所述预设的规则是：添加扰动后的图像对抗训练集与原始图像训练集的沃瑟斯坦距离在预设的最大扰动距离内。

3.根据权利要求2所述的方法，其特征在于，对原始图像训练集中的正样本集合和负样本集合添加相同的分布扰动，并使添加分布扰动后的图像对抗训练集与原始图像训练集的沃瑟斯坦距离在第一预设最大距离内。

4.根据权利要求3所述的方法，其特征在于，在所述步骤S3中，采用如下方式计算所述图像二分类模型的性能评估结果：

5.根据权利要求4所述的方法，其特征在于，在所述步骤S4中，所述目标逐样本损失函数为：

6.根据权利要求2所述的方法，其特征在于，对原始图像训练集中的正样本集合和负样本集合添加不同的分布扰动，并使添加分布扰动后的正样本对抗集合与原始图像训练集中的正样本集合之间的沃瑟斯坦距离在第二预设最大距离内，以及使添加分布扰动后的负样本对抗集合与原始图像训练集中的负

7.根据权利要求6所述的方法，其特征在于，在所述步骤S3中，采用如下方式计算所述图像二分类模型的性能评估结果：

8.根据权利要求7所述的方法，其特征在于，在所述步骤S4中，所述目标逐样本损失函数为：

9.一种图像识别方法，其特征在于，所述方法包括：

10.一种计算机可读存储介质，其特征在于，其上存储有计算机程序，所述计算机程序可被处理器执行以实现权利要求1-8、9任一所述方法的步骤。

11.一种电子设备，其特征在于，包括：

...

【技术特征摘要】

1.一种图像二分类模型的训练方法，所述图像二分类模型用于判定图像为二分类中的一类的概率，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，在所述步骤s2中，所述预设的规则是：添加扰动后的图像对抗训练集与原始图像训练集的沃瑟斯坦距离在预设的最大扰动距离内。

4.根据权利要求3所述的方法，其特征在于，在所述步骤s3中，采用如下方式计算所述图像二分类模型的性能评估结果：

5.根据权利要求4所述的方法，其特征在于，在所述步骤s4中，所述目标逐样本损失函数为：

6.根据权利要求2所述的方法，其特征在...

【专利技术属性】
技术研发人员：黄庆明，戴思然，许倩倩，杨智勇，操晓春，
申请(专利权)人：中国科学院计算技术研究所，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人