当前位置: 首页 > 专利查询>北京大学专利>正文

模型训练方法、装置、设备及存储介质制造方法及图纸

技术编号:38651250 阅读:11 留言:0更新日期:2023-09-02 22:40
本申请涉及一种模型训练方法、装置、设备及存储介质,该方法在神经网络模型训练的过程中,引入第一特征空间,并获取当前训练图像在第一特征空间中的第一类特征,进一步计算第一类特征与第一特征组中各特征的相似度,得到第一相似度组,以第一相似度组校正与神经网络模型的第二特征空间相关的第二相似度组,使得校正后的校正相似度组关注到与当前训练图像属于相同语义类别但相似度较低的样本,从而缓解了不可靠样本带来的错误指导。了不可靠样本带来的错误指导。了不可靠样本带来的错误指导。

【技术实现步骤摘要】
模型训练方法、装置、设备及存储介质


[0001]本申请涉及计算机领域,尤其涉及一种模型训练方法、装置、设备及存储介质。

技术介绍

[0002]自监督表示学习是近年来的研究热点,主要是通过解决精心设计的代理任务来从大规模无标注数据中学习到通用的特征表示,并以此作为大量下游任务的初始化。
[0003]当前,基于对比学习的实例判别方法在自监督表示学习中表现出了巨大的潜力,在各个下游任务中已经接近甚至超过有监督预训练。它的具体实现是在特征空间中拉近利用数据增强技术得到的正样本同时把其他样本作为负样本推远。但是,实例判别方法的负样本中不可避免地存在与当前样本属于相同语义类别的样本,即假阴性(FalseNegative)样本,这导致学习到的语义结构受限。

技术实现思路

[0004]本申请提供了一种模型训练方法、装置、设备及存储介质,用以解决模型训练过程中,假阴性样本导致学习到的语义结构受限,给模型训练带来错误指导的问题。
[0005]第一方面,提供一种模型训练方法,包括:
[0006]获取当前训练图像的第一增强视图在第一特征空间的第一类特征,所述第一特征空间用于描述所述当前训练图像需要被提取的特征的维度;
[0007]计算所述第一类特征与第一特征组中各特征的相似度,得到第一相似度组;所述第一特征组中的特征为训练数据集中训练图像的第一类特征;所述训练数据集包括所述当前训练图像;
[0008]采用所述第一相似度组校正第二相似度组,得到校正相似度组;所述第二相似度组为所述第一增强视图的第二类特征与第二特征组中各特征的相似度的集合;所述第二特征组中的特征为所述训练数据集中训练图像的第二类特征;所述第一增强视图的第二类特征为所述第一增强视图在第二特征空间的图像特征;所述第二特征空间中的维度与所述第一特征空间的维度不完全相同;
[0009]利用所述校正相似度组优化神经网络模型的参数,所述神经网络模型用于提取所述第二类特征。
[0010]可选地,利用所述校正相似度组优化所述第二特征空间对应的神经网络模型的参数,包括:
[0011]利用所述校正相似度组、第三相似度组和预设的损失函数,计算模型损失;所述第三相似度组为第二增强视图的第二类特征与所述第二特征组中各特征的相似度的集合;所述第二增强视图为所述当前训练图像的另一视图;
[0012]采用所述模型损失优化所述神经网络模型的参数。
[0013]可选地,采用所述第一相似度组校正第二相似度组,得到校正相似度组,包括:
[0014]获取所述第一相似度组中最大的K个相似度;
[0015]对于所述K个图像相似度中的任一图像相似度,获取所述任一图像相似度在所述第一相似度组中的目标位置;
[0016]采用所述任一图像相似度更新所述第二相似度组中处于所述目标位置的图像相似度,得到所述校正相似度组。
[0017]可选地,采用所述任一图像相似度更新所述第二相似度组中处于所述目标位置的图像相似度,以得到所述校正相似度组,包括:
[0018]获取所述K个图像相似度中的最大图像相似度;
[0019]计算所述任一图像相似度与所述最大图像相似度的商值;
[0020]采用所述商值替换所述第二相似度组中处于所述目标位置的图像相似度,得到所述校正相似度组。
[0021]可选地,采用所述商值替换所述第二相似度组中处于所述目标位置的图像相似度,以得到所述校正相似度组之前,还包括:
[0022]确定所述商值和处于所述目标位置的图像相似度属于归一化取值。
[0023]可选地,获取当前训练图像的第一增强视图在第一特征空间的第一类特征之前,还包括:
[0024]确定所述神经网络模型的迭代轮次未超过预设轮次。
[0025]可选地,获取当前训练图像的第一增强视图在第一特征空间的第一类特征,包括:
[0026]获取所述第一增强视图的方向梯度直方图特征;
[0027]将所述方向梯度直方图特征作为所述第一类特征。
[0028]第二方面,提供一种模型训练装置,包括:
[0029]获取模块,用于获取当前训练图像的第一增强视图在第一特征空间的第一类特征,所述第一特征空间用于描述所述当前训练图像需要被提取的特征的维度;
[0030]计算模块,用于计算所述第一类特征与第一特征组中各特征的相似度,得到第一相似度组;所述第一特征组中的特征为训练数据集中训练图像的第一类特征;所述训练数据集包括所述当前训练图像;
[0031]校正模块,用于采用所述第一相似度组校正第二相似度组,得到校正相似度组;所述第二相似度组为所述第一增强视图的第二类特征与第二特征组中各特征的相似度的集合;所述第二特征组中的特征为所述训练数据集中训练图像的第二类特征;所述第一增强视图的第二类特征为所述第一增强视图在第二特征空间的图像特征;所述第二特征空间中的维度与所述第一特征空间的维度不完全相同;
[0032]优化模块,用于利用所述校正相似度组优化神经网络模型的参数,所述神经网络模型用于提取所述第二类特征。
[0033]第三方面,提供一种电子设备,其特征在于,包括:处理器、存储器和通信总线,其中,处理器和存储器通过通信总线完成相互间的通信;
[0034]存储器,用于存储计算机程序;
[0035]处理器,用于执行存储器中所存储的程序,实现第一方面所述的模型训练方法。
[0036]第四方面,提供一种计算机可读存储介质,存储有计算机程序,其特征在于,计算机程序被处理器执行时实现第一方面所述的模型训练方法。
[0037]本申请实施例提供的上述技术方案与现有技术相比具有如下优点:本申请实施例
提供的该方法,在神经网络模型训练的过程中,引入第一特征空间,并获取当前训练图像在第一特征空间中的第一类特征,进一步计算第一类特征与第一特征组中各特征的相似度,得到第一相似度组,以第一相似度组校正与神经网络模型相关的第二相似度组,使得校正后的校正相似度组关注到与当前训练图像属于相同语义类别但相似度较低的样本,从而缓解了不可靠样本带来的错误指导。
附图说明
[0038]此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本专利技术的实施例,并与说明书一起用于解释本专利技术的原理。
[0039]为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
[0040]图1为传统的基于样本关联的方法中目标分布存在不可靠关联的场景示意图;
[0041]图2为本实施例中模型训练方法的流程示意图;
[0042]图3为本实施例中神经网络模型的结构示意图;
[0043]图4为本申请实施例中利用改进后的CSAC在特征空间中的结果示意图;
[0044]图5为本实施例中模型本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种模型训练方法,其特征在于,包括:获取当前训练图像的第一增强视图在第一特征空间的第一类特征,所述第一特征空间用于描述所述当前训练图像需要被提取的特征的维度;计算所述第一类特征与第一特征组中各特征的相似度,得到第一相似度组;所述第一特征组中的特征为训练数据集中训练图像的第一类特征;所述训练数据集包括所述当前训练图像;采用所述第一相似度组校正第二相似度组,得到校正相似度组;所述第二相似度组为所述第一增强视图的第二类特征与第二特征组中各特征的相似度的集合;所述第二特征组中的特征为所述训练数据集中训练图像的第二类特征;所述第一增强视图的第二类特征为所述第一增强视图在第二特征空间的图像特征;所述第二特征空间中的维度与所述第一特征空间的维度不完全相同;利用所述校正相似度组优化神经网络模型的参数,所述神经网络模型用于提取所述第二类特征。2.根据权利要求1所述的方法,其特征在于,利用所述校正相似度组优化所述第二特征空间对应的神经网络模型的参数,包括:利用所述校正相似度组、第三相似度组和预设的损失函数,计算模型损失;所述第三相似度组为第二增强视图的第二类特征与所述第二特征组中各特征的相似度的集合;所述第二增强视图为所述当前训练图像的另一视图;采用所述模型损失优化所述神经网络模型的参数。3.根据权利要求1或2所述的方法,其特征在于,采用所述第一相似度组校正第二相似度组,得到校正相似度组,包括:获取所述第一相似度组中最大的K个相似度;对于所述K个图像相似度中的任一图像相似度,获取所述任一图像相似度在所述第一相似度组中的目标位置;采用所述任一图像相似度更新所述第二相似度组中处于所述目标位置的图像相似度,得到所述校正相似度组。4.根据权利要求3所述的方法,其特征在于,采用所述任一图像相似度更新所述第二相似度组中处于所述目标位置的图像相似度,以得到所述校正相似度组,包括:获取所述K个图像相似度中的最大图像相似度;计算所述任一图像相似度与所述最大图像相似度的商值;采用所述商值替换所述第二相似度组中处于所述目标位置的图像相似度,得到所述校正相似度组。5.根据权利...

【专利技术属性】
技术研发人员:曾炜陈建平袁孝宇
申请(专利权)人:北京大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1