一种对比自监督学习训练方法和系统技术方案

技术编号：38423989 阅读：11 留言：0更新日期：2023-08-07 11:22

本申请实施例公开了一种对比自监督学习训练方法和系统，所述方法包括：样本数据集分别与第一数据增强算子和数据增强算子计算得到数据增强样本数据集；将所述数据增强样本数据集分别输入第一模型和第二模型，得到正样本特征集和负样本特征集；根据所述负样本特征集所对应的原图像和正样本特征集得到正负样本组合特征集；根据所述正负样本组合特征集计算损失函数；基于所述损失函数计算梯度并更新第一模型的参数，基于更新后的第一模型的参数更新第二模型的参数，循环直到损失函数满足设定条件。设计出的损失函数和数据增强算子集适用于多种对比式自监督学习方法，具有更好的泛化性和鲁棒性。性和鲁棒性。性和鲁棒性。

全部详细技术资料下载

【技术实现步骤摘要】
一种对比自监督学习训练方法和系统

[0001]本申请实施例涉及计算机
，具体涉及一种对比自监督学习训练方法和系统。

技术介绍

[0002]监督学习在过去得到巨大成功，但其严重依赖于昂贵且难得的人工标签，同时容易陷入泛化错误，伪相关及受到对抗攻击，因此监督学习的相关研究也进入了瓶颈期。最近，基于自监督学习的预训练模式以其良好的数据利用效率和泛化能力，在计算机视觉中获得了非常巨大的进展，并形成了一套主流的训练范式，称为“自监督预训练
‑
基于任务微调”。
[0003]目前主流的模型训练方法主要是采用监督学习，其核心思想是使用有标签数据为模型提供强监督反馈信息。在训练的过程中，可以通过计算损失函数(即强监督反馈信息)和利用梯度反向传播技术，使模型不断调整自身参数，慢慢拟合目标输出分布。由此可见，监督学习是一个非常直观且高效的训练方法，但缺点也十分明显，其严重依赖于昂贵且难得的人工标签，大部分实际情况下的特定场景的海量数据仅有少部分可被标注，存在着大量的无标签数据无法被利用。除此之外，少量数据下的训练会使模型陷入泛化性差，鲁棒性差，容易受到噪声攻击等等问题。

技术实现思路

[0004]为此，本申请实施例提供一种对比自监督学习训练方法和系统，设计出的损失函数和数据增强算子集适用于多种对比式自监督学习方法，具有更好的泛化性和鲁棒性。
[0005]为了实现上述目的，本申请实施例提供如下技术方案：
[0006]根据本申请实施例的第一方面，提供了一种对比自监督学习训练方法，...

【技术保护点】

【技术特征摘要】
1.一种对比自监督学习训练方法，其特征在于，所述方法包括：从未标注数据集中采样得到样本数据集，从数据增强算子集中选择第一数据增强算子和第二数据增强算子；所述样本数据集分别与所述第一数据增强算子和第二数据增强算子计算得到数据增强样本数据集；将所述数据增强样本数据集分别输入第一模型和第二模型，得到正样本特征集和负样本特征集；根据所述负样本特征集所对应的原图像和正样本特征集得到正负样本组合特征集；根据所述正负样本组合特征集计算损失函数；基于所述损失函数计算梯度并更新第一模型的参数，基于更新后的第一模型的参数更新第二模型的参数，循环直到损失函数满足设定条件。2.如权利要求1所述的方法，其特征在于，根据所述负样本特征集所对应的原图像和正样本特征集得到正负样本组合特征集，包括：从所述负样本特征集随机采样和以及所述正样本特征集和分别组成正负样本组合特征集和x
p
·
≠k
·
表示负样本特征集所对应的原图像，p
·
≠k
·
表示样本数据集x
k
中所有图像均不为同张图像。3.如权利要求1所述的方法，其特征在于，根据所述正负样本组合特征集计算损失函数，包括：根据所述正负组合特征集计算目标函数；将目标函数作为约束项，基于InfoNCE损失函数计算所述损失函数。4.如权利要求3所述的方法，其特征在于，按照如下公式将目标函数作为约束项，基于InfoNCE损失函数计算所述损失函数：其中，a
i
·
和a
i
··
分别表示第一数据增强算子和第二数据增强算子，a
i
和a
j
分别是数据增强样本数据集中的第一数据增强样本数据集和第二数据增强样本数据集；F和F'分别为结构相同的第一模型和第二模型；X为未标注数据集，I为未标注数据集中的不变语义数据集，Y
S
为对比自监...

【专利技术属性】
技术研发人员：张睿，
申请(专利权)人：重庆特斯联启智科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人