机器学习模型的训练方法、装置、电子设备和存储介质制造方法及图纸

技术编号:32456197 阅读:22 留言:0更新日期:2022-02-26 08:34
本公开提供一种机器学习模型的训练方法、装置、电子设备和存储介质。该方法包括:利用第一数据集进行机器学习训练,得到第一模型;利用第二数据集的子集对第一模型进行更新,得到第二模型;根据第二模型在第一数据集上的预测结果,从第二数据集的子集中筛选出目标数据;将目标数据由第二数据集转移至第一数据集,得到更新后的第一数据集;利用更新后的第一数据集对第二模型进行更新,得到目标模型。该方法能够实现同特征但是数据量数据分布不一致的迁移训练。迁移训练。迁移训练。

【技术实现步骤摘要】
机器学习模型的训练方法、装置、电子设备和存储介质


[0001]本公开的实施例涉及机器学习
,具体涉及机器学习模型的训练方法、装置、电子设备和存储介质。

技术介绍

[0002]目前迁移训练的方式可以分为两种。一种是特征的迁移,一种是同特征但是数据量数据分布不一致的迁移的。第一种特征的迁移研究在学术领域,目前商用的就是联邦训练的方式,本质是基于加密算法的特征撞库。第二种同特征但是数据量数据分布不一致的迁移停留在理论阶段,比如one

shot learning等,缺少可落地的迁移方法。
[0003]因此,有必要提出一种新的进行机器学习模型训练的技术方案。

技术实现思路

[0004]本公开的实施例提出了机器学习模型的训练方法、装置、电子设备和存储介质。
[0005]第一方面,本公开提供了一种机器学习模型的训练方法,包括:
[0006]利用第一数据集进行机器学习训练,得到第一模型,其中,上述第一数据集中的第一数据具有相应的标注标签;
[0007]利用第二数据集的子集对上述第一模型进行更新,得到第二模型,其中,上述第二数据集的子集中的第二数据具有通过上述第一模型获得的预测标签;
[0008]根据上述第二模型在上述第一数据集上的预测结果,从上述第二数据集的子集中筛选出目标数据;
[0009]将上述目标数据由上述第二数据集转移至上述第一数据集,得到更新后的第一数据集;
[0010]利用上述更新后的第一数据集对上述第二模型进行更新,得到目标模型。
[0011]在一些可选的实施方式中,上述方法还包括:
[0012]将上述目标模型作为新的上述第一模型,重复执行从对上述第一模型进行更新至得到目标模型的处理过程,直至达到预设的停止条件。
[0013]在一些可选的实施方式中,上述利用第二数据集的子集对上述第一模型进行更新,得到第二模型,包括:
[0014]将上述第二数据集中的上述第二数据输入上述第一模型,得到上述第二数据的预测标签以及相应的预测概率;
[0015]基于上述第二数据对应的上述预测概率,对上述第二数据集中的上述第二数据进行筛选,得到上述第二数据集的子集;
[0016]利用上述第二数据集的子集对上述第一模型进行机器学习训练,得到上述第二模型。
[0017]在一些可选的实施方式中,上述基于上述第二数据对应的上述预测概率,对上述第二数据集中的上述第二数据进行筛选,得到上述第二数据集的子集,包括:
[0018]选取上述第二数据集中预测概率大于第一阈值的全体第二数据,以及在预测概率大于第二阈值并且小于或者等于上述第一阈值的第二数据中进行随机抽取,以得到上述第二数据集的子集,其中,上述第一阈值大于上述第二阈值。
[0019]在一些可选的实施方式中,上述根据上述第二模型在上述第一数据集上的预测结果,从上述第二数据集的子集中筛选出目标数据,包括:
[0020]将上述第一数据集中的第一数据输入上述第二模型,得到上述第一数据的预测标签;
[0021]根据上述第一数据的预测标签和标注标签,得到上述第一数据集的预测标签对应的分类指标;
[0022]基于上述分类指标对上述第一数据集的预测标签进行筛选,得到目标预测标签;
[0023]将上述第二数据集的子集中与上述目标预测标签对应的第二数据确定为上述目标数据。
[0024]在一些可选的实施方式中,上述基于上述分类指标包括精确率、召回率和/或精确率和召回率的调和平均数。
[0025]在一些可选的实施方式中,上述基于上述分类指标对上述第一数据集的预测标签进行筛选,得到目标预测标签,包括:
[0026]将上述第一数据集的预测标签对应的分类指标与预设分类指标进行比较,并且将分类指标优于上述预设分类指标的预测标签确定为上述目标预测标签。
[0027]第二方面,本公开提供了一种机器学习模型的训练装置,包括:
[0028]第一训练单元,用于利用第一数据集进行机器学习训练,得到第一模型,其中,上述第一数据集中的第一数据具有相应的标注标签;
[0029]第二训练单元,用于利用第二数据集的子集对上述第一模型进行更新,得到第二模型,其中,上述第二数据集的子集中的第二数据具有通过上述第一模型获得的预测标签;
[0030]筛选单元,用于根据上述第二模型在上述第一数据集上的预测结果,从上述第二数据集的子集中筛选出目标数据;
[0031]转移单元,用于将上述目标数据由上述第二数据集转移至上述第一数据集,得到更新后的第一数据集;
[0032]第三训练单元,用于利用上述更新后的第一数据集对上述第二模型进行更新,得到目标模型。
[0033]在一些可选的实施方式中,上述装置还包括循环单元,用于:
[0034]将上述目标模型作为新的上述第一模型,重复执行从对上述第一模型进行更新至得到目标模型的处理过程,直至达到预设的停止条件。
[0035]在一些可选的实施方式中,上述第二训练单元还用于:
[0036]将上述第二数据集中的上述第二数据输入上述第一模型,得到上述第二数据的预测标签以及相应的预测概率;
[0037]基于上述第二数据对应的上述预测概率,对上述第二数据集中的上述第二数据进行筛选,得到上述第二数据集的子集;
[0038]利用上述第二数据集的子集对上述第一模型进行机器学习训练,得到上述第二模型。
[0039]在一些可选的实施方式中,上述第二训练单元还用于:
[0040]选取上述第二数据集中预测概率大于第一阈值的全体第二数据,以及在预测概率大于第二阈值并且小于或者等于上述第一阈值的第二数据中进行随机抽取,以得到上述第二数据集的子集,其中,上述第一阈值大于上述第二阈值。
[0041]在一些可选的实施方式中,上述筛选单元还用于:
[0042]将上述第一数据集中的第一数据输入上述第二模型,得到上述第一数据的预测标签;
[0043]根据上述第一数据的预测标签和标注标签,得到上述第一数据集的预测标签对应的分类指标;
[0044]基于上述分类指标对上述第一数据集的预测标签进行筛选,得到目标预测标签;
[0045]将上述第二数据集的子集中与上述目标预测标签对应的第二数据确定为上述目标数据。
[0046]在一些可选的实施方式中,上述基于上述分类指标包括精确率、召回率和/或精确率和召回率的调和平均数。
[0047]在一些可选的实施方式中,上述筛选单元还用于:
[0048]将上述第一数据集的预测标签对应的分类指标与预设分类指标进行比较,并且将分类指标优于上述预设分类指标的预测标签确定为上述目标预测标签。
[0049]第三方面,本公开提供了一种电子设备,包括:
[0050]一个或多个处理器;
[0051]存储装置,其上存储有一个或多个程序,
[0052]当上述一个或多个程序被上本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种机器学习模型的训练方法,包括:利用第一数据集进行机器学习训练,得到第一模型,其中,所述第一数据集中的第一数据具有相应的标注标签;利用第二数据集的子集对所述第一模型进行更新,得到第二模型,其中,所述第二数据集的子集中的第二数据具有通过所述第一模型获得的预测标签;根据所述第二模型在所述第一数据集上的预测结果,从所述第二数据集的子集中筛选出目标数据;将所述目标数据由所述第二数据集转移至所述第一数据集,得到更新后的第一数据集;利用所述更新后的第一数据集对所述第二模型进行更新,得到目标模型。2.根据权利要求1所述的方法,其中,所述方法还包括:将所述目标模型作为新的所述第一模型,重复执行从对所述第一模型进行更新至得到目标模型的处理过程,直至达到预设的停止条件。3.根据权利要求1所述的方法,其中,所述利用第二数据集的子集对所述第一模型进行更新,得到第二模型,包括:将所述第二数据集中的所述第二数据输入所述第一模型,得到所述第二数据的预测标签以及相应的预测概率;基于所述第二数据对应的所述预测概率,对所述第二数据集中的所述第二数据进行筛选,得到所述第二数据集的子集;利用所述第二数据集的子集对所述第一模型进行机器学习训练,得到所述第二模型。4.根据权利要求3所述的方法,其中,所述基于所述第二数据对应的所述预测概率,对所述第二数据集中的所述第二数据进行筛选,得到所述第二数据集的子集,包括:选取所述第二数据集中预测概率大于第一阈值的全体第二数据,以及在预测概率大于第二阈值并且小于或者等于所述第一阈值的第二数据中进行随机抽取,以得到所述第二数据集的子集,其中,所述第一阈值大于所述第二阈值。5.根据权利要求1所述的方法,其中,所述根据所述第二模型在所述第一数据集上的预测结果,从所述第二数据集的子集中筛选出目标数据,包括:将所述第一数据集中的第一数据输入所述第二模型,得到所述第一数...

【专利技术属性】
技术研发人员:吴雨霏
申请(专利权)人:中信百信银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1