基于联邦学习的模型训练方法、金融行为预测方法及装置制造方法及图纸

技术编号:38516984 阅读:12 留言:0更新日期:2023-08-19 16:58
本公开提供了一种基于联邦学习的模型训练方法,可以应用于人工智能技术领域。该方法包括:根据标签数据集和金融属性特征数据集生成第一数据集和第二数据集;将第二数据集输入标签预测模型,输出第三数据集;根据第三数据集和第一数据集生成样本数据集;以及利用样本数据集训练得到联邦学习模型。本公开还提供了一种基于联邦学习的模型训练装置、金融行为预测方法、金融行为预测装置、计算机系统和计算机可读存储介质。机可读存储介质。机可读存储介质。

【技术实现步骤摘要】
基于联邦学习的模型训练方法、金融行为预测方法及装置


[0001]本公开涉及人工智能
,更具体地,涉及一种基于联邦学习的模型训练方法、金融行为预测方法、装置、计算机系统和计算机可读存储介质。

技术介绍

[0002]在联邦学习中,理论上涉及诸如:数据处理、特征工程、模型训练、模型评估、在线推理等诸多环节。在实际应用时,仅有通过ID撞库的方式对数据求交产生的样本交集才会用来进行模型训练,输出模型结果。特别是在金融场景的纵向联邦学习业务中,由于金融侧数据的使用监管较严,一般在建模时无法采用自有特征,而判断正负样本的标签就成为了金融侧最有价值的建模数据。除此之外以金融场景的营销转化业务为例,样本交集中的“正样本”数量非常有限,往往会出现“正样本”规模远远小于“负样本”规模的情况,相关技术中的解决方案大多选择“负样本”欠采样方案,以此均衡正负样本再进行建模;但由于入模“正样本”小,导致整体数据规模有限,从而导致训练完成的联邦学习模型存在对于用户的金融行为的预测准确率较低的技术问题。

技术实现思路

[0003]有鉴于此,本公开提供了一种基于联邦学习的模型训练方法、基于联邦学习的模型训练装置、金融行为预测方法、金融行为预测装置、计算机系统和计算机可读存储介质。
[0004]本公开的一个方面提供了一种基于联邦学习的模型训练方法,包括:
[0005]根据标签数据集和金融属性特征数据集生成第一数据集和第二数据集,其中,上述标签数据集存储于金融系统中,上述金融属性特征数据集存储于与上述金融系统相关联的合作方系统中,上述第一数据集包括上述金融属性特征数据集和上述标签数据集的共有数据,上述第二数据集包括上述金融属性特征数据集和上述标签数据集的非共有数据;
[0006]将上述第二数据集输入标签预测模型,输出第三数据集,其中,上述第三数据集中的数据携带有预测标签信息;
[0007]根据上述第三数据集和上述第一数据集生成样本数据集;以及
[0008]利用上述样本数据集训练得到联邦学习模型。
[0009]根据本公开的实施例,上述预测标签信息具有置信度;
[0010]上述根据上述第三数据集和上述第一数据集生成样本数据集包括:
[0011]对上述第三数据集进行同态加密处理,生成第四数据集;
[0012]基于上述置信度对上述第四数据集中的数据进行筛选处理,生成第五数据集;
[0013]将上述第五数据集和上述第一数据集合并,生成上述样本数据集。
[0014]根据本公开的实施例,上述将上述第二数据集输入标签预测模型,输出第三数据集包括:
[0015]获取上述第一数据集中的数据量;
[0016]根据上述数据量对上述第二数据集进行筛选处理,生成第六数据集,其中,上述第
六数据集中的数据量与上述第一数据集中的数据量相匹配;
[0017]将上述第六数据集输入上述标签预测模型,输出第三数据集。
[0018]根据本公开的实施例,上述联邦学习模型包括与上述合作方系统对应的第一联邦学习子模型和与上述金融系统对应的第二联邦学习子模型;
[0019]上述利用上述样本数据集训练得到联邦学习模型包括:
[0020]利用上述样本数据集分别训练上述第一联邦学习子模型和上述第二联邦学习子模型,生成与上述第一联邦学习子模型对应的第一梯度结果和与上述第二联邦学习子模型对应的第二梯度结果;
[0021]对上述第一梯度结果和上述第二梯度结果进行同态加密处理,生成待验证结果;
[0022]基于上述待验证结果确定上述联邦学习模型是否收敛;
[0023]在上述联邦学习模型未收敛的情况下,迭代的调整上述联邦学习模型和上述标签预测模型的网络参数,直至上述待验证结果表征上述联邦学习模型收敛。
[0024]根据本公开的实施例,上述金融属性特征数据集和上述标签数据集中的数据具有标识信息;
[0025]上述根据存储标签数据集和金融属性特征数据集生成第一数据集和第二数据集包括:
[0026]对上述特征数据和上述标签数据集求交集,生成共现标识信息集;
[0027]根据上述标识信息集,从上述金融属性特征数据集和上述标签数据集中获取与上述标识信息集对应的数据,生成上述第一数据集;
[0028]根据上述金融属性特征数据集中除上述第一数据集中的数据以外的数据生成上述第二数据集。
[0029]本公开的另一个方面提供了一种金融行为预测方法,包括:
[0030]获取待预测用户的金融属性信息;以及
[0031]将上述金融属性信息输入联邦学习模型,输出预测结果,其中,上述预测结果表征上述待预测用户产生金融行为的概率,上述联邦学习模型是由如上上述的基于联邦学习的模型训练方法训练生成的。
[0032]本公开的另一个方面提供了一种基于联邦学习的模型训练装置,包括:
[0033]第一生成模块,用于根据标签数据集和金融属性特征数据集生成第一数据集和第二数据集,其中,上述标签数据集存储于金融系统中,上述金融属性特征数据集存储于与上述金融系统相关联的合作方系统中,上述第一数据集包括上述金融属性特征数据集和上述标签数据集的共有数据,上述第二数据集包括上述金融属性特征数据集和上述标签数据集的非共有数据;
[0034]第一输出模块,用于将上述第二数据集输入标签预测模型,输出第三数据集,其中,上述第三数据集中的数据携带有预测标签信息;
[0035]第二生成模块,用于根据上述第三数据集和上述第一数据集生成样本数据集;以及
[0036]训练模块,用于利用上述样本数据集训练待训练得到联邦学习模型。
[0037]本公开的另一个方面提供了一种金融行为预测装置,包括:
[0038]第一获取模块,用于获取待预测用户的金融属性信息;以及
[0039]预测模块,用于将上述金融属性信息输入联邦学习模型,输出预测结果,其中,上述预测结果表征上述待预测用户产生金融行为的概率,上述联邦学习模型是由如上上述的的基于联邦学习的模型训练方法训练生成的。
[0040]本公开的另一方面提供了一种计算机可读存储介质,存储有计算机可执行指令,上述指令在被执行时用于实现本公开实施例上述的方法。
[0041]本公开的另一方面提供了一种计算机程序产品,上述计算机程序产品包括计算机可执行指令,上述计算机可执行指令在被执行时用于实现如上上述的方法。
[0042]公开的另一方面提供了一种计算机系统,包括:
[0043]一个或多个处理器;
[0044]存储器,用于存储一个或多个程序,
[0045]其中,当上述一个或多个程序被上述一个或多个处理器执行时,使得上述一个或多个处理器实现如上上述的方法。
[0046]根据本公开的实施例,因为采用了基于金融属性特征数据集和标签数据集生成第一数据集和第二数据集,其中,第一数据集包括金融属性特征数据集和标签数据集的共有数据,第二数据集包括金融本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于联邦学习的模型训练方法,包括:根据标签数据集和金融属性特征数据集生成第一数据集和第二数据集,其中,所述标签数据集存储于金融系统中,所述金融属性特征数据集存储于与所述金融系统相关联的合作方系统中,所述第一数据集包括所述金融属性特征数据集和所述标签数据集的共有数据,所述第二数据集包括所述金融属性特征数据集和所述标签数据集的非共有数据;将所述第二数据集输入标签预测模型,输出第三数据集,其中,所述第三数据集中的数据携带有预测标签信息;根据所述第三数据集和所述第一数据集生成样本数据集;以及利用所述样本数据集训练得到联邦学习模型。2.根据权利要求1所述的方法,其中,所述预测标签信息具有置信度;所述根据所述第三数据集和所述第一数据集生成样本数据集包括:对所述第三数据集进行同态加密处理,生成第四数据集;基于所述置信度对所述第四数据集中的数据进行筛选处理,生成第五数据集;将所述第五数据集和所述第一数据集合并,生成所述样本数据集。3.根据权利要求1所述的方法,所述将所述第二数据集输入标签预测模型,输出第三数据集包括:获取所述第一数据集中的数据量;根据所述数据量对所述第二数据集进行筛选处理,生成第六数据集,其中,所述第六数据集中的数据量与所述第一数据集中的数据量相匹配;将所述第六数据集输入所述标签预测模型,输出第三数据集。4.根据权利要求1所述的方法,其中,所述联邦学习模型包括与所述合作方系统对应的第一联邦学习子模型和与所述金融系统对应的第二联邦学习子模型;所述利用所述样本数据集训练得到联邦学习模型包括:利用所述样本数据集分别训练所述第一联邦学习子模型和所述第二联邦学习子模型,生成与所述第一联邦学习子模型对应的第一梯度结果和与所述第二联邦学习子模型对应的第二梯度结果;对所述第一梯度结果和所述第二梯度结果进行同态加密处理,生成待验证结果;基于所述待验证结果确定所述联邦学习模型是否收敛;在所述联邦学习模型未收敛的情况下,迭代的调整所述联邦学习模型和所述标签预测模型的网络参数,直至所述待验证结果表征所述联邦学习模型收敛。5.根据权利要求1所述的方法,其中,所述金融属性特征数据集和所述标签数据集中的数据具有...

【专利技术属性】
技术研发人员:袁梓焜王科刘博
申请(专利权)人:北京京东世纪贸易有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1