一种机器学习模型的训练方法、计算机设备及存储介质技术

技术编号:28038669 阅读:34 留言:0更新日期:2021-04-09 23:21
本发明专利技术公开了一种机器学习模型的训练方法、计算机设备及存储介质,该方法包括:从多个样本域中,获取多个第一样本数据和第二样本数据;将各第一样本数据输入至目标模型中,得到多个第一损失函数值,并进行后向计算,得到多个判别网络参数;将第二样本数据输入至加载各判别网络参数的目标模型中,得到多个第二损失函数值;根据各第一损失函数值和各第二损失函数值,计算得到总损失函数值,并根据总损失函数值进行后向计算,返回执行从多个样本域中,获取多个第一样本数据和第二样本数据的操作,直至满足结束训练条件。本发明专利技术实施例的技术方案可以实现机器学习模型训练过程的自动化,有效提高机器学习模型在不同场景中的鲁棒性。

【技术实现步骤摘要】
一种机器学习模型的训练方法、计算机设备及存储介质
本专利技术实施例涉及人工智能
,尤其涉及一种机器学习模型的训练方法、计算机设备及存储介质。
技术介绍
随着数据分析技术及人工智能技术的研究与发展,人们越来越关注机器学习模型在不同应用场景中的鲁棒性。其中,鲁棒性高的机器学习模型在新场景中能够维持某些性能,有效性较高。为了提高机器学习模型的鲁棒性,现有的方法是在模型训练过程中引入正则化或者dropout等算法;或者,对机器学习模型进行微调,即使用新应用场景的训练样本在预训练模型的基础上继续训练。其中,引入正则化或者dropout等算法虽然能在一定程度上提升机器学习模型的鲁棒性,但是容易降低机器学习模型的稳定性,模型的最终效果往往依赖于开发者的经验及大量的试错;通过对机器学习模型进行微调后,模型的最终效果通常不如对模型重新训练的效果好,并且,无论是上述哪种方法,都需要开发者做模型针对各种场景的适配工作,并且维护众多的模型版本。
技术实现思路
本专利技术实施例提供一种机器学习模型的训练方法、计算机设备及存储介质本文档来自技高网...

【技术保护点】
1.一种机器学习模型的训练方法,其特征在于,包括:/n从多个样本域中,获取多个第一样本数据和第二样本数据,每个样本域内包括与同一场景对应的多个样本数据;/n将各所述第一样本数据输入至目标模型中,分别使用所述目标模型中的特征提取网络和判别网络对各所述第一样本数据进行前向计算,得到多个第一损失函数值,并进行后向计算,得到多个判别网络参数;/n将各所述第二样本数据输入至加载各判别网络参数的目标模型中,对各所述第二样本数据进行前向计算,得到多个第二损失函数值;/n根据各第一损失函数值和各第二损失函数值,计算得到总损失函数值,并根据所述总损失函数值进行后向计算,返回执行从多个样本域中,获取多个第一样本数...

【技术特征摘要】
1.一种机器学习模型的训练方法,其特征在于,包括:
从多个样本域中,获取多个第一样本数据和第二样本数据,每个样本域内包括与同一场景对应的多个样本数据;
将各所述第一样本数据输入至目标模型中,分别使用所述目标模型中的特征提取网络和判别网络对各所述第一样本数据进行前向计算,得到多个第一损失函数值,并进行后向计算,得到多个判别网络参数;
将各所述第二样本数据输入至加载各判别网络参数的目标模型中,对各所述第二样本数据进行前向计算,得到多个第二损失函数值;
根据各第一损失函数值和各第二损失函数值,计算得到总损失函数值,并根据所述总损失函数值进行后向计算,返回执行从多个样本域中,获取多个第一样本数据和第二样本数据的操作,直至满足结束训练条件。


2.根据权利要求1所述的方法,其特征在于,从多个样本域中,获取多个第一样本数据和第二样本数据,包括:
获取多个样本域,从各样本域中获取对应的批量样本数据;
在全部批量样本数据中,随机选取多个样本域对应的批量样本数据作为第一样本数据,并将剩余的多个样本域对应的批量样本数据作为第二样本数据。


3.根据权利要求2所述的方法,其特征在于,获取多个样本域,包括:
获取多个样本数据,将各所述样本数据按照预设的分类规则,划分成多个样本集合;
对各样本集合内不同类别样本数据之间的比例,以及各样本集合之间的样本数据的比例进行调整,得到多个样本域。


4.根据权利要求2所述的方法,其特征在于,从各样本域中获取对应的批量样本数据,包括:
通过与各样本域对应的数据加载器,根据预设的批量阈值,从各样本域中获取与所述批量阈值匹配的批量样本数据。


5.根据权利要求1所述的方法,其特征在于,在得到多个判别网络参数之后,还包括:
获取所述目标模型中特征提取网络输出的与各第一样本数据对应的特征,根据与各第一样本数据对应的特征,通过孪生网络损失函数,计算第一孪生损失函数值;
在得到多个第二损失函数值之后,还包括:
获取所述目标模型中特征提取网络输出的与各第二样本数据对应的特征,根据与各所述第二样本数据对应的特征,通过孪生网络损失函数,计算第二孪生损失函数值;
根据各第一损失函数值和各第二损失函数值,计算得到总损失函数值,并根据所述总损失函数值进行后向计算,包括:
根据各第一损失函数值、第二损失函数值、第一孪生损失函数值以及第二孪生损失函数值,计算得到总损失函数值,并根据总损失函数值进行后向计算,根据计算结果更新所述目标模型的参数。


6.根据权利要求5所述的方法,其特征在于,根据各第一损失函数值、第二损失函数值、第一孪生损失函数值以及第二孪生损失函数值,计算得到总损失函数值,包括:
将各第一损失函数值与第二损失函数值进行张量相加,得到第一函数值;
将第一孪生损失函数值与第二孪生损失函数值进行张量相加,得到第二函数值;
根据第一函数值、第二函数值以及与所述目标模型对应的超参数,计算得到所述总损失函数值。


7.一种计算机设备,包括处理器和存储器,所述存储器用于存储指令,当所述指令执行时使得所述处理器执行以下操作:
从多个样本域中,获取多个第一样本数据和第二样本数据,每个样本域内包括与...

【专利技术属性】
技术研发人员:夏正勋杨一帆范豪钧
申请(专利权)人:重庆星环人工智能科技研究院有限公司
类型:发明
国别省市:重庆;50

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1