基于自训练对比学习无监督领域自适应的图像分类方法技术

技术编号：40560408 阅读：5 留言：0更新日期：2024-03-05 19:22

本发明专利技术引入了一种基于自训练对比学习无监督领域自适应的图像分类方法，包括：1.对源域目标域图像预处理；2构建基于自训练对比学习框架的领域自适应模型；3.将处理好的图像作为输入，以无监督的方式训练构建好的网络模型；4.利用训练好的网络模型进项跨域图像分类。本发明专利技术利用源域和目标域之间的内在分布差异，采用不同的策略来学习域不变特征，并引入了对抗性机制，以调整两个领域之间的分布差异，以促进从源域到目标领域的有效知识转移，从而能准确高效地完成图像分类。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及计算机视觉迁移学习域适应图像分类领域，具体地说是一种基于自训练对比学习无监督领域自适应图像分类方法。

技术介绍

1、在图像分类任务中，领域自适应(domain adaptation，da)的背景源于：

2、数据分布差异：图像分类模型在一个特定领域(源领域)上训练后，可能在另一个领域(目标领域)上的表现下降，因为两个领域的图像数据分布可能存在差异。例如，天气、照明条件、拍摄设备等的变化可能导致图像特征的差异；比如两只猫，他们的品种可能完全不相同，他们所处的背景也可能完全不相同，抑或是他们一个在白天而一个在黑夜，但是在分类结果上他们应该是相同的；

3、标签缺失：在目标领域中获取大量标记数据的成本可能很高，甚至不可行。因此，希望能够利用在源领域上训练的模型来改善在目标领域上的性能，即使目标领域上的标签数据很少。

4、图像分类的领域自适应方法旨在通过调整源领域上训练的模型，使其适应目标领域的特性，提高模型在目标领域上的性能。即在源域上训练的模型在目标域图像上取得很好的分类效果.通常采用对抗的方式来对齐两个不同的域，但是由于两个域的差异，会导致忽略了类(标签)的偏移；比如不同风格的图像，一只白天的大体型的猫和一只夜晚的小体型颜色花纹不一样的猫，过度强调领域对抗性可能导致模型过分关注源域中的某些特征，而忽略了目标域上的有益信息。这可能导致模型在目标域上的性能下降，分类错误，同时，对抗性训练通常引入了生成器和判别器之间的竞争，这可能导致训练的不稳定性。模型可能在训练中难以收敛，需要仔细调整训练

5、对于目标域图像而言，并不具备标签，通常将模型的分类结果当成伪标签，因此基于使用目标伪标签的自我训练是一种常见的选择；但是目标域的伪标签往往并不可靠，伪标签的生成通常依赖于初始模型的预测，如果初始模型在目标域上性能较差，生成的伪标签也可能包含大量错误。当图像本身模糊或含有噪声时，模型可能难以确信正确的类别标签，或者当

6、两个类别在视觉上非常相似时，模型可能更难以确保正确地将它们区分开。例如，两种品种非常相似的花可能在模型的预测中具有较高的不确定性。抑或是图像的对比度较低时，模型可能难以准确地提取特征，导致对图像内容的不确定性。这在一些暗光或光照不足的情况下可能发生，这些情况下，伪标签可能并不是确定性的类别标签，而是带有一定不确定性的预测结果。这种不确定性可能在训练过程中导致错误，这些错误可能会在后续训练中累积，导致模型学到错误的知识。这也会对分类结果造成影响；

技术实现思路

1、本专利技术是为了克服现有技术的不足，提出了一种基于自训练对比学习无监督领域自适应图像分类方法，以期能够克服图像分类对抗盲目对其导致分类边界模糊和伪标签不可靠的影响，并能提高领域内部的聚合度来进行对齐，从而能提高图像分类的准确率。

2、本专利技术为了解决技术问题采用如下方案：

3、本专利技术一种基于自训练对比学习无监督领域自适应的图像分类方法的特点在于，包括如下步骤：

4、步骤1：获取领域自适应图像数据集d＝{s，t}，其中，s表示有标签的源域图像集合，且其中，表示第i张有标签的源域图像，表示的标签，ns表示源域图像的总数，t表示无标签的目标域图像集合，且表示第j张无标签的目标域图像，nt表示目标域图像的总数；

5、源域图像和目标域图像共享相同的标签空间l＝{1，2，3，...，cl}，其中，cl表示标签的种类数量；

6、对第i张源域图像进行两次随机图像增强，得到两张增强后的源域图像和从而得到2×ns个增强后的源域图像构成的源域增强图像集合其中，表示第p张有标签的源域增强图像；i1、i2∈[1，2×ns]；

7、对第j张无标签的目标域图像进行k次数据增强，得到k个增强后的目标域图像其中，表示第j张目标域图像对应的第k个目标域增强图像；k∈[1，k]；

8、步骤2：构建基于对抗性自训练的无监督领域自适应网络，包括：特征生成器g、分类器c、域判别器d和投影层ph；

9、所述特征生成器g是由resnet-50组成，并包括五层网络结构，第一层是由一个卷积层、批量归一化层、relu激活函数和一个最大池化层组成；其余层均有若干个bottleneck块依次组成，每个bottleneck块由一个卷积层、一个批量归一化层和relu激活函数组成；

10、所述分类器c、判别器d和投影层ph均是一个全连接层组成；

11、步骤2.1：将第i张源域图像对应的两张有标签的源域增强图像和输入所述特征提取器g中进行处理，并相应得到第i张源域图像对应的两个源域增强特征和

12、所述特征生成器g对和进行处理，得到第i张源域图像对应的源域原始特征和第j张目标域图像对应的目标域原始特征

13、所述特征提取器g对进行处理，并得到第j张目标域图像对应的第k个目标域增强特征

14、步骤2.2：所述投影层ph对和进行处理后，得到两个源域投影增强特征和

15、步骤2.3：所述分类器c对和进行处理，并得到对应的预测标签和对应的预测标签将第j张目标域图像的预测标签经过argmax函数处理后，得到对应的伪标签

16、所述分类器c对第k个目标域增强特征进行处理，并得到对应的增强预测标签

17、步骤2.4：所述判别器d对和进行处理，得到源域领域标签和目标域领域标签

18、步骤3：构建损失函数并训练网络：

19、步骤3.1：利用式(1)构建源域的对比学习损失

20、

21、式(1)中，τ表示超参数；表示经过所述特征生成器g和所述投影层ph后得到的第p个源域投影增强特征，表示与和对应的源域图像不同的源域图像经过两次随机图像增强后再经过所述特征提取器g和投影层ph所得到的两个源域增强投影特征；

22、步骤3.2：利用式(2)构建目标域的自训练监督损失

23、

24、式(2)中，表示是否可靠性，若可靠，则令为1，否则，令为0，lce是标准交叉熵函数；

25、步骤3.3：利用式(3)建立对抗损失

26、

27、步骤3.4：利用式(4)构建监督损失

28、

29、式(4)中，ltsa是监督损失函数；

30、步骤3.5：利用式(5)构建第一阶段损失

31、

32、步骤3.6利用式(6)构建第二阶段损失

33、

34、式(6)中，γ和β是两个权衡参数；

35、步骤3.7使用sgd优化器对抗性自训练的无监督领域自适应网络进行训练，并计算第一阶段损失以更新网络参数，当训练次数达到所设定的阈值时，得到初步训练后的无监督领域自适应模型，再利用sgd优化器对初步训练后的无监督领域自适应模型进行训练，并计算第二阶段损失以更新模型参数，直到训练次数达到最本文档来自技高网...

【技术保护点】

1.一种基于自训练对比学习无监督领域自适应的图像分类方法，其特征在于，包括如下步骤：

2.根据权利要求1所述的基于对抗性对比学习和无监督领域自适应的图像分类方法，其特征在于，所述步骤3.2中的可靠性是按如下过程判断：

3.一种电子设备，包括存储器以及处理器，其特征在于，所述存储器用于存储支持处理器执行权利要求1或2所述图像分类方法的程序，所述处理器被配置为用于执行所述存储器中存储的程序。

4.一种计算机可读存储介质，计算机可读存储介质上存储有计算机程序，其特征在于，所述计算机程序被处理器运行时执行权利要求1或2所述图像分类方法的步骤。

【技术特征摘要】

1.一种基于自训练对比学习无监督领域自适应的图像分类方法，其特征在于，包括如下步骤：

2.根据权利要求1所述的基于对抗性对比学习和无监督领域自适应的图像分类方法，其特征在于，所述步骤3.2中的可靠性是按如下过程判断：

3.一种电子设备，包括存储器以及处理器，其特征...

【专利技术属性】
技术研发人员：王姗姗，胡敏彬，杨勋，张兴义，
申请(专利权)人：安徽大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人