一种对比自监督学习训练方法和系统技术方案

技术编号:38423989 阅读:11 留言:0更新日期:2023-08-07 11:22
本申请实施例公开了一种对比自监督学习训练方法和系统,所述方法包括:样本数据集分别与第一数据增强算子和数据增强算子计算得到数据增强样本数据集;将所述数据增强样本数据集分别输入第一模型和第二模型,得到正样本特征集和负样本特征集;根据所述负样本特征集所对应的原图像和正样本特征集得到正负样本组合特征集;根据所述正负样本组合特征集计算损失函数;基于所述损失函数计算梯度并更新第一模型的参数,基于更新后的第一模型的参数更新第二模型的参数,循环直到损失函数满足设定条件。设计出的损失函数和数据增强算子集适用于多种对比式自监督学习方法,具有更好的泛化性和鲁棒性。性和鲁棒性。性和鲁棒性。

【技术实现步骤摘要】
一种对比自监督学习训练方法和系统


[0001]本申请实施例涉及计算机
,具体涉及一种对比自监督学习训练方法和系统。

技术介绍

[0002]监督学习在过去得到巨大成功,但其严重依赖于昂贵且难得的人工标签,同时容易陷入泛化错误,伪相关及受到对抗攻击,因此监督学习的相关研究也进入了瓶颈期。最近,基于自监督学习的预训练模式以其良好的数据利用效率和泛化能力,在计算机视觉中获得了非常巨大的进展,并形成了一套主流的训练范式,称为“自监督预训练

基于任务微调”。
[0003]目前主流的模型训练方法主要是采用监督学习,其核心思想是使用有标签数据为模型提供强监督反馈信息。在训练的过程中,可以通过计算损失函数(即强监督反馈信息)和利用梯度反向传播技术,使模型不断调整自身参数,慢慢拟合目标输出分布。由此可见,监督学习是一个非常直观且高效的训练方法,但缺点也十分明显,其严重依赖于昂贵且难得的人工标签,大部分实际情况下的特定场景的海量数据仅有少部分可被标注,存在着大量的无标签数据无法被利用。除此之外,少量数据下的训练会使模型陷入泛化性差,鲁棒性差,容易受到噪声攻击等等问题。

技术实现思路

[0004]为此,本申请实施例提供一种对比自监督学习训练方法和系统,设计出的损失函数和数据增强算子集适用于多种对比式自监督学习方法,具有更好的泛化性和鲁棒性。
[0005]为了实现上述目的,本申请实施例提供如下技术方案:
[0006]根据本申请实施例的第一方面,提供了一种对比自监督学习训练方法,所述方法包括:
[0007]从未标注数据集中采样得到样本数据集,从数据增强算子集中选择第一数据增强算子和第二数据增强算子;
[0008]所述样本数据集分别与所述第一数据增强算子和第二数据增强算子计算得到数据增强样本数据集;
[0009]将所述数据增强样本数据集分别输入第一模型和第二模型,得到正样本特征集和负样本特征集;
[0010]根据所述负样本特征集所对应的原图像和正样本特征集得到正负样本组合特征集;
[0011]根据所述正负样本组合特征集计算损失函数;
[0012]基于所述损失函数计算梯度并更新第一模型的参数,基于更新后的第一模型的参数更新第二模型的参数,循环直到损失函数满足设定条件。
[0013]可选地,根据所述负样本特征集所对应的原图像和正样本特征集得到正负样本组
合特征集,包括:
[0014]从所述负样本特征集随机采样和以及所述正样本特征集和分别组成正负样本组合特征集和x
p
·
≠k
·
表示负样本特征集所对应的原图像,p
·
≠k
·
表示样本数据集x
k
中所有图像均不为同张图像。
[0015]可选地,根据所述正负样本组合特征集计算损失函数,包括:
[0016]根据所述正负组合特征集计算目标函数;
[0017]将目标函数作为约束项,基于InfoNCE损失函数计算所述损失函数。
[0018]可选地,按照如下公式将目标函数作为约束项,基于InfoNCE损失函数计算所述损失函数:
[0019][0020]其中,a
i
·
和a
i
··
分别表示第一数据增强算子和第二数据增强算子,a
i
和a
j
分别是数据增强样本数据集中的第一数据增强样本数据集和第二数据增强样本数据集;F和F'分别为结构相同的第一模型和第二模型;X为未标注数据集,I为未标注数据集中的不变语义数据集,Y
S
为对比自监督学习的代理任务集;PD为衡量分布差异距离的方法;σ表示权重因子。
[0021]可选地,对比自监督学习的条件分布按照如下公式表示:
[0022][0023]其中,P(Y
S
|I,a
i
)和P(Y
St
|I,a
j
)均表示自监督学习代理任务的条件分布,A表示数据增强算子集。
[0024]可选地,在得到正样本特征集和负样本特征集之后,所述方法还包括:
[0025]将负样本特征集存储至负样本缓存区,以供随机采样。
[0026]根据本申请实施例的第二方面,提供了一种对比自监督学习训练系统,所述系统包括:
[0027]数据采样模块,用于从未标注数据集中采样得到样本数据集,从数据增强算子集中选择第一数据增强算子和第二数据增强算子;
[0028]增强样本模块,用于所述样本数据集分别与所述第一数据增强算子和第二数据增强算子计算得到数据增强样本数据集;
[0029]正负样本特征模块,用于将所述数据增强样本数据集分别输入第一模型和第二模型,得到正样本特征集和负样本特征集;
[0030]组合特征模块,用于根据所述负样本特征集所对应的原图像和正样本特征集得到正负样本组合特征集;
[0031]损失函数模块,用于根据所述正负样本组合特征集计算损失函数;
[0032]更新模块,用于基于所述损失函数计算梯度并更新第一模型的参数,基于更新后的第一模型的参数更新第二模型的参数,循环直到损失函数满足设定条件。
[0033]可选地,所述损失函数模块,用于:
[0034]根据所述正负组合特征集计算目标函数;
[0035]将目标函数作为约束项,基于InfoNCE损失函数计算所述损失函数。
[0036]根据本申请实施例的第三方面,提供了一种电子设备,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器运行所述计算机程序时执行以实现上述第一方面所述的方法。
[0037]根据本申请实施例的第四方面,提供了一种计算机可读存储介质,其上存储有计算机可读指令,所述计算机可读指令可被处理器执行以实现上述第一方面所述的方法。
[0038]综上所述,本申请实施例提供了一种对比自监督学习训练方法和系统,通过从未标注数据集中采样得到样本数据集,从数据增强算子集中选择第一数据增强算子和第二数据增强算子;所述样本数据集分别与所述第一数据增强算子和第二数据增强算子计算得到数据增强样本数据集;将所述数据增强样本数据集分别输入第一模型和第二模型,得到正样本特征集和负样本特征集;根据所述负样本特征集所对应的原图像和正样本特征集得到正负样本组合特征集;根据所述正负样本组合特征集计算损失函数;基于所述损失函数计算梯度并更新第一模型的参数,基于更新后的第一模型的参数更新第二模型的参数,循环直到损失函数满足设定条件。设计出的损失函数和数据增强算子集适用于多种对比式自监督学习方法,具有更好的泛化性和鲁棒性。
附图说明
[0039]为了更清楚地说明本专利技术的实施方式或现有技术中的技术方案,下面将对实施方式或现有技术描述中所需要使用的附图作简单地介绍。显而易见地,下面描述中的附图仅仅是示例性的本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种对比自监督学习训练方法,其特征在于,所述方法包括:从未标注数据集中采样得到样本数据集,从数据增强算子集中选择第一数据增强算子和第二数据增强算子;所述样本数据集分别与所述第一数据增强算子和第二数据增强算子计算得到数据增强样本数据集;将所述数据增强样本数据集分别输入第一模型和第二模型,得到正样本特征集和负样本特征集;根据所述负样本特征集所对应的原图像和正样本特征集得到正负样本组合特征集;根据所述正负样本组合特征集计算损失函数;基于所述损失函数计算梯度并更新第一模型的参数,基于更新后的第一模型的参数更新第二模型的参数,循环直到损失函数满足设定条件。2.如权利要求1所述的方法,其特征在于,根据所述负样本特征集所对应的原图像和正样本特征集得到正负样本组合特征集,包括:从所述负样本特征集随机采样和以及所述正样本特征集和分别组成正负样本组合特征集和x
p
·
≠k
·
表示负样本特征集所对应的原图像,p
·
≠k
·
表示样本数据集x
k
中所有图像均不为同张图像。3.如权利要求1所述的方法,其特征在于,根据所述正负样本组合特征集计算损失函数,包括:根据所述正负组合特征集计算目标函数;将目标函数作为约束项,基于InfoNCE损失函数计算所述损失函数。4.如权利要求3所述的方法,其特征在于,按照如下公式将目标函数作为约束项,基于InfoNCE损失函数计算所述损失函数:其中,a
i
·
和a
i
··
分别表示第一数据增强算子和第二数据增强算子,a
i
和a
j
分别是数据增强样本数据集中的第一数据增强样本数据集和第二数据增强样本数据集;F和F'分别为结构相同的第一模型和第二模型;X为未标注数据集,I为未标注数据集中的不变语义数据集,Y
S
为对比自监...

【专利技术属性】
技术研发人员:张睿
申请(专利权)人:重庆特斯联启智科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1