联合训练目标模型的贡献度的确定方法、装置和终端设备制造方法及图纸

技术编号:26846936 阅读:33 留言:0更新日期:2020-12-25 13:10
本说明书提供了一种联合训练目标模型的贡献度的确定方法、装置和终端设备。基于上述方法,可以先根据相匹配的处理规则,基于对照模型、目标模型、测试数据,与第二终端设备进行相应的数据处理,以确定出第二终端设备所拥有的第二数据源对于目标模型训练的边际预测效果提升参数;再使用预设的检验区间,确定出能衡量引入第二终端设备所拥有的第二数据源对目标模型训练的边际预测效果提升作用的检验结果;进而可以根据上述检验结果,确定出第二终端设备所拥有的第二数据源对联合训练目标模型的贡献度。从而可以有效地解决现有方法中存在的无法准确地量化评价联合训练场景下参与联合训练的数据源的贡献度的技术问题。

【技术实现步骤摘要】
联合训练目标模型的贡献度的确定方法、装置和终端设备
本说明书属于互联网
,尤其涉及联合训练目标模型的贡献度的确定方法、装置和终端设备。
技术介绍
在一些业务场景中,不同的数据方往往拥有不同数据源。有时需要同时利用不同数据方所拥有的数据源,在不向对方泄露己方所拥有的数据的前提下,通过联合训练(例如,联邦学习)来构建所需要的目标模型。例如,在金融业务场景中,A银行拥有B城居民的银行平台的借贷数据,而C购物网站拥有B城居民的网络平台的借贷数据。目前,A银行希望可以训练得到一个能较为全面、准确地预测B城居民的借贷信用风险的预测模型。针对上述场景,A银行希望与C购物网站合作,利用各自所拥有的数据源通过联合训练,来构建得到用于预测B城居民的借贷信用风险的预测模型。但是,基于现有的相关方法,A银行无法准确地确定出引入C购物网站所拥有的数据源对训练该借贷信用风险的预测模型的边际预测效果的提升作用具体有多大,进而无法准确地确定出C购物网站对该模型训练的贡献度,导致无法以较合理地方式与C购物网站达成对应的合作协议。因此,亟需一种能够准本文档来自技高网...

【技术保护点】
1.一种联合训练目标模型的贡献度的确定方法,其特征在于,包括:/n获取对照模型、目标模型;其中,所述对照模型为在第一终端设备没有与第二终端设备进行联合训练的情况下所得到的模型,所述目标模型为在第一终端设备与第二终端设备进行联合训练的情况下所得到的模型;/n根据相匹配的处理规则,基于所述对照模型、目标模型、测试数据,与第二终端设备进行相应的数据处理,以确定出第二终端设备所拥有的第二数据源对于目标模型训练的边际预测效果提升参数;/n根据所述边际预测效果提升参数,和预设的检验区间,确定出对应的检验结果;其中,所述检验结果用于衡量引入第二终端设备所拥有的第二数据源对目标模型训练的边际预测效果提升作用;...

【技术特征摘要】
1.一种联合训练目标模型的贡献度的确定方法,其特征在于,包括:
获取对照模型、目标模型;其中,所述对照模型为在第一终端设备没有与第二终端设备进行联合训练的情况下所得到的模型,所述目标模型为在第一终端设备与第二终端设备进行联合训练的情况下所得到的模型;
根据相匹配的处理规则,基于所述对照模型、目标模型、测试数据,与第二终端设备进行相应的数据处理,以确定出第二终端设备所拥有的第二数据源对于目标模型训练的边际预测效果提升参数;
根据所述边际预测效果提升参数,和预设的检验区间,确定出对应的检验结果;其中,所述检验结果用于衡量引入第二终端设备所拥有的第二数据源对目标模型训练的边际预测效果提升作用;
根据所述检验结果,确定出第二终端设备所拥有的第二数据源对联合训练目标模型的贡献度。


2.根据权利要求1所述的方法,其特征在于,在确定出第二终端设备所拥有的第二数据源对联合训练目标模型的贡献度之后,所述方法还包括:
根据所述贡献度,确定针对第二终端设备的奖励数据;
向所述第二终端设备发送相应的奖励数据。


3.根据权利要求1所述的方法,其特征在于,所述相匹配的处理规则包括:基于横向联邦学习的处理规则、基于纵向联邦学习的处理规则,或基于联邦迁移学习的处理规则。


4.根据权利要求3所述的方法,其特征在于,所述相匹配的处理规则按照以下方式确定:
确定第一终端设备和第二终端设备在联合训练目标模型时所采用的联合训练类型;其中,所述联合训练类型包括:横向联邦学习、纵向联邦学习,或联邦迁移学习;
根据所述联合训练类型,确定出相匹配的处理规则。


5.根据权利要求3所述的方法,其特征在于,在确定所述相匹配的处理规则为基于纵向联邦学习的处理规则的情况下,所述目标模型包括第一终端设备持有的第一模型,和第二终端设备持有的第二模型。


6.根据权利要求5所述的方法,其特征在于,在确定所述相匹配的处理规则为基于纵向联邦学习的处理规则的情况下,根据相匹配的处理规则,基于所述对照模型、目标模型、测试数据,与第二终端设备进行相应的数据处理,以确定出第二终端设备所拥有的第二数据源对于目标模型训练的边际预测效果提升参数,包括:
利用所述对照模型处理所述测试数据,得到第一组预测概率;
利用所述第一模型处理所述测试数据,得到第一处理结果;
获取来自第二终端设备的第二处理结果;其中,所述第二处理结果为第二终端设备利用所述第二模型处理所述测试数据得到的;
根据所述第一处理结果和所述第二处理结果,确定出第二组预测概率;
根据所述第一组预测概率,和所述第二组预测概率,确定出第二数据源对于目标模型训练的边际预测效果提升参数。


7.根据权利要求6所述的方法,其特征在于,所述获取来自第二终端设备的第二处理结果,包括:
接收加密后的第二处理结果;其中,所述第二终端设备基于同态加密算法加密所述第二处理结果得到对应的加密后的第二处理结果;
对所述加密后的第二处理结果进行相应的解密处理,以得到所述第二处理结果。


8.根据权利要求6所述的方法,其特征在于,根据所述第一组预测概率,和所述第二组预测概率,确定出第二数据源对于目标模型训练的边际预测效果提升参数,包括:
根据测试数据的数据标签、所述第一组预测概率、所述第二组预测概率,分别计算基于对照模型的第一AUC参数和基于目标模型的第二AUC参数;
根据所述第一AUC参数、所述第二AUC参数,计算标准差;
根据所述第一AUC参数、所述第二AUC参数,所述标准差,计算第二数据源对于目标模型训练的边际预测效果提升参数。


9.根据权利要求8所述的方法,其特征在于,所述预设的检验区间按照以下算式配置:

【专利技术属性】
技术研发人员:霍昱光孙昊王雪权纯
申请(专利权)人:建信金融科技有限责任公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1