模型训练方法、装置、设备及存储介质制造方法及图纸

技术编号：38651250 阅读：11 留言：0更新日期：2023-09-02 22:40

本申请涉及一种模型训练方法、装置、设备及存储介质，该方法在神经网络模型训练的过程中，引入第一特征空间，并获取当前训练图像在第一特征空间中的第一类特征，进一步计算第一类特征与第一特征组中各特征的相似度，得到第一相似度组，以第一相似度组校正与神经网络模型的第二特征空间相关的第二相似度组，使得校正后的校正相似度组关注到与当前训练图像属于相同语义类别但相似度较低的样本，从而缓解了不可靠样本带来的错误指导。了不可靠样本带来的错误指导。了不可靠样本带来的错误指导。

全部详细技术资料下载

【技术实现步骤摘要】
模型训练方法、装置、设备及存储介质

[0001]本申请涉及计算机领域，尤其涉及一种模型训练方法、装置、设备及存储介质。

技术介绍

[0002]自监督表示学习是近年来的研究热点，主要是通过解决精心设计的代理任务来从大规模无标注数据中学习到通用的特征表示，并以此作为大量下游任务的初始化。
[0003]当前，基于对比学习的实例判别方法在自监督表示学习中表现出了巨大的潜力，在各个下游任务中已经接近甚至超过有监督预训练。它的具体实现是在特征空间中拉近利用数据增强技术得到的正样本同时把其他样本作为负样本推远。但是，实例判别方法的负样本中不可避免地存在与当前样本属于相同语义类别的样本，即假阴性(FalseNegative)样本，这导致学习到的语义结构受限。

技术实现思路

[0004]本申请提供了一种模型训练方法、装置、设备及存储介质，用以解决模型训练过程中，假阴性样本导致学习到的语义结构受限，给模型训练带来错误指导的问题。
[0005]第一方面，提供一种模型训练方法，包括：
[0006]获取当前训练图像的第一增强视图在第一特征空间的第一类特征，所述第一特征空间用于描述所述当前训练图像需要被提取的特征的维度；
[0007]计算所述第一类特征与第一特征组中各特征的相似度，得到第一相似度组；所述第一特征组中的特征为训练数据集中训练图像的第一类特征；所述训练数据集包括所述当前训练图像；
[0008]采用所述第一相似度组校正第二相似度组，得到校正相似度组；所述第二相似度组为所述第一增强...

【技术保护点】

【技术特征摘要】
1.一种模型训练方法，其特征在于，包括：获取当前训练图像的第一增强视图在第一特征空间的第一类特征，所述第一特征空间用于描述所述当前训练图像需要被提取的特征的维度；计算所述第一类特征与第一特征组中各特征的相似度，得到第一相似度组；所述第一特征组中的特征为训练数据集中训练图像的第一类特征；所述训练数据集包括所述当前训练图像；采用所述第一相似度组校正第二相似度组，得到校正相似度组；所述第二相似度组为所述第一增强视图的第二类特征与第二特征组中各特征的相似度的集合；所述第二特征组中的特征为所述训练数据集中训练图像的第二类特征；所述第一增强视图的第二类特征为所述第一增强视图在第二特征空间的图像特征；所述第二特征空间中的维度与所述第一特征空间的维度不完全相同；利用所述校正相似度组优化神经网络模型的参数，所述神经网络模型用于提取所述第二类特征。2.根据权利要求1所述的方法，其特征在于，利用所述校正相似度组优化所述第二特征空间对应的神经网络模型的参数，包括：利用所述校正相似度组、第三相似度组和预设的损失函数，计算模型损失；所述第三相似度组为第二增强视图的第二类特征与所述第二特征组中各特征的相似度的集合；所述第二增强视图为所述当前训练图像的另一视图；采用所述模型损失优化所述神经网络模型的参数。3.根据权利要求1或2所述的方法，其特征在于，采用所述第一相似度组校正第二相似度组，得到校正相似度组，包括：获取所述第一相似度组中最大的K个相似度；对于所述K个图像相似度中的任一图像相似度，获取所述任一图像相似度在所述第一相似度组中的目标位置；采用所述任一图像相似度更新所述第二相似度组中处于所述目标位置的图像相似度，得到所述校正相似度组。4.根据权利要求3所述的方法，其特征在于，采用所述任一图像相似度更新所述第二相似度组中处于所述目标位置的图像相似度，以得到所述校正相似度组，包括：获取所述K个图像相似度中的最大图像相似度；计算所述任一图像相似度与所述最大图像相似度的商值；采用所述商值替换所述第二相似度组中处于所述目标位置的图像相似度，得到所述校正相似度组。5.根据权利...

【专利技术属性】
技术研发人员：曾炜，陈建平，袁孝宇，
申请(专利权)人：北京大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人