联邦树模型的数据处理方法、装置、设备及存储介质制造方法及图纸

技术编号:33292745 阅读:14 留言:0更新日期:2022-05-01 00:15
本申请提供了一种联邦树模型的数据处理方法、装置、设备,应用于第一参与方设备;方法包括:获取目标节点在联邦树模型中的第一节点路由,目标节点与第一参与方设备提供的至少两个第一特征相对应;接收第二参与方设备发送的至少一个匿名特征,以及与各匿名特征对应的第二节点路由;基于第一节点路由及第二节点路由,模拟联邦树模型,得到联邦树模型对应的伪联邦树模型,并通过伪联邦树模型,对用作联邦树模型的训练样本的特征集合所包括的特征子集进行预测,得到相应的预测值;结合预测值及目标预测结果,确定特征集合中各特征对应目标预测结果的贡献信息。通过本申请,能够快速、准确的确定样本中各参与方所提供的各特征的贡献信息。献信息。献信息。

【技术实现步骤摘要】
联邦树模型的数据处理方法、装置、设备及存储介质


[0001]本申请涉及人工智能技术,尤其涉及一种联邦树模型的数据处理方法、装置、电子设备、计算机可读存储介质及计算机程序产品。

技术介绍

[0002]随着各行各业逐渐加强数据隐私保护的大趋势下,联邦学习,一种可以在保护数据隐私的情况下协同多方数据建立机器学习的技术,成为了各企业/行业间合作的关键之一。如今,纵向场景下,纵向树模型已经广泛地在纵向联邦场景下,成为了金融、风控领域的常用且强力的算法之一。
[0003]在金融、风控领域,往往想要获取单条样本中的各特征对于联邦树模型输出结果的影响。如对于某个特定样本(比方说违约的客户),需要获取具体是哪个特征以及该特征的哪些取值,对确定用户是违约用户产生了重要的影响。另外,还需要确定合作方提供的特征对于模型输出的影响。
[0004]相关联邦树模型解释方案,通过获取特征重要度从整体上对树模型进行解释,无法具体的解释单条样本中各特征的贡献度。另外,虽然使用特征重要度能够得知合作方的特征使用了多少次,但是合作方特征对于模型输出结果的影响的正负性是不可知的,且确定特征贡献信息时模型计算量大。

技术实现思路

[0005]本申请实施例提供一种联邦树模型的数据处理方法、装置、电子设备、计算机可读存储介质及计算机程序产品,能够快速、准确的确定样本中各参与方所提供的各特征的贡献信息。
[0006]本申请实施例的技术方案是这样实现的:
[0007]本申请实施例提供一种联邦树模型的数据处理方法,基于联邦学习系统,所述联邦学习系统包括第一参与方设备及至少一个第二参与方设备,所述方法应用于第一参与方设备,包括:
[0008]获取目标节点在所述联邦树模型中的第一节点路由,所述目标节点与所述第一参与方设备提供的至少两个第一特征相对应;
[0009]接收所述第二参与方设备发送的至少一个匿名特征,以及与各所述匿名特征对应的第二节点路由;
[0010]其中,所述匿名特征与用于训练所述联邦树模型的第二特征相对应,所述第二节点路由,用于指示以所述匿名特征作为所述联邦树模型的分裂节点时,所述分裂节点对应的子节点路径;
[0011]基于所述第一节点路由及所述第二节点路由,模拟所述联邦树模型,得到所述联邦树模型对应的伪联邦树模型,并通过所述伪联邦树模型,对用作所述联邦树模型的训练样本的特征集合所包括的特征子集进行预测,得到相应的预测值;
[0012]其中,所述特征集合包括:携带目标预测结果的所述至少两个第一特征、及至少一个所述第二参与方设备提供的所述第二特征;
[0013]结合所述预测值及所述目标预测结果,确定所述特征集合中各特征对应所述目标预测结果的贡献信息。
[0014]本申请实施例提供一种联邦树模型的数据处理装置,包括:
[0015]获取模块,用于获取目标节点在所述联邦树模型中的第一节点路由,所述目标节点与所述第一参与方设备提供的至少两个第一特征相对应;
[0016]接收模块,用于接收第二参与方设备发送的至少一个匿名特征,以及与各所述匿名特征对应的第二节点路由;其中,所述匿名特征与用于训练所述联邦树模型的第二特征相对应,所述第二节点路由,用于指示以所述匿名特征作为所述联邦树模型的分裂节点时,所述分裂节点对应的子节点路径;
[0017]模拟模块,用于基于所述第一节点路由及所述第二节点路由,模拟所述联邦树模型,得到所述联邦树模型对应的伪联邦树模型,并通过所述伪联邦树模型,对用作所述联邦树模型的训练样本的特征集合所包括的特征子集进行预测,得到相应的预测值;其中,所述特征集合包括:携带目标预测结果的所述至少两个第一特征、及至少一个所述第二参与方设备提供的所述第二特征;
[0018]确定模块,用于结合所述预测值及所述目标预测结果,确定所述特征集合中各特征对应所述目标预测结果的贡献信息。
[0019]上述方案中,所述接收模块,还用于发送携带样本标识的匿名特征获取请求至所述第二参与方设备;
[0020]其中,所述匿名特征获取请求用于,所述第二参与方设备响应所述匿名特征获取请求,确定所述样本标识对应的所述第二特征、所述第二特征对应的匿名特征以及所述匿名特征对应的第二节点路由;
[0021]接收到所述第二参与方设备返回的与所述样本标识对应的匿名特征、以及所述匿名特征对应的第二节点路由。
[0022]上述方案中,所述接收模块,还用于在本地创建匿名关系记录表,所述匿名关系记录表,用于记录用于训练所述联邦树模型的训练样本的样本标识、所述样本标识对应的所述第二参与方设备的匿名特征、以及所述匿名特征对应的第二节点路由;
[0023]将接收到的与所述样本标识对应的匿名特征、以及所述匿名特征对应的第二节点路由存储于所述匿名关系记录表中。
[0024]上述方案中,所述确定模块,还用于从所述第一参与方设备提供的至少两个第一特征、以及至少一个所述第二参与方设备提供的第二特征中,选取至少两个特征;
[0025]构建包括所述至少两个特征的特征交互组,并确定所述特征交互组对应的至少一个交互边际贡献值;
[0026]基于所述至少一个交互边际贡献值,确定所述特征交互组对应所述目标预测结果的交互贡献信息。
[0027]上述方案中,所述确定模块,还用于确定所述特征集合的第一特征子集,所述第一特征子集包括所述至少两个特征中至少之一;
[0028]确定所述特征集合的第二特征子集,所述第二特征子集与所述特征交互组为互补
关系;
[0029]获取所述第一特征子集对应的预测值、以及所述第二特征子集对应的预测值,并基于所述第一特征子集对应的预测值、以及所述第二特征子集对应的预测值,确定所述特征交互组对应的交互边际贡献值。
[0030]上述方案中,所述确定模块,还用于当所述交互边际贡献值的数量为多个时,对多个所述交互边际贡献值进行求和,得到所述特征交互组对应所述目标预测结果的交互贡献信息。
[0031]本申请实施例还提供一种联邦树模型的数据处理方法,基于联邦学习系统,所述联邦学习系统包括第一参与方设备及至少一个第二参与方设备,所述方法应用于第二参与方设备,包括:
[0032]针对用于训练所述联邦树模型的各第二特征,分别生成与各所述第二特征对应的匿名特征,并获取与各所述匿名特征对应的第二节点路由;
[0033]所述第二节点路由,用于指示以所述匿名特征作为所述联邦树模型的分裂节点时,所述分裂节点对应的子节点路径;
[0034]发送与各所述第二特征对应的匿名特征,以及与各所述匿名特征对应的第二节点路由至所述第一参与方设备;
[0035]其中,所述第二节点路由用于,所述第一参与方设备基于所述第二节点路由,获取所述联邦树模型对应的伪联邦树模型,并通过所述伪联邦树模型,确定特征集合中各特征对应目标预测结果的贡献信息;
[0036]其中,所述特征集合用作所述联邦树模型的训练样本,包括:所述第一参本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种联邦树模型的数据处理方法,其特征在于,基于联邦学习系统,所述联邦学习系统包括第一参与方设备及至少一个第二参与方设备,所述方法应用于第一参与方设备,所述方法包括:获取目标节点在所述联邦树模型中的第一节点路由,所述目标节点与所述第一参与方设备提供的至少两个第一特征相对应;接收所述第二参与方设备发送的至少一个匿名特征,以及与各所述匿名特征对应的第二节点路由;其中,所述匿名特征与用于训练所述联邦树模型的第二特征相对应,所述第二节点路由,用于指示以所述匿名特征作为所述联邦树模型的分裂节点时,所述分裂节点对应的子节点路径;基于所述第一节点路由及所述第二节点路由,模拟所述联邦树模型,得到所述联邦树模型对应的伪联邦树模型,并通过所述伪联邦树模型,对用作所述联邦树模型的训练样本的特征集合所包括的特征子集进行预测,得到相应的预测值;其中,所述特征集合包括:携带目标预测结果的所述至少两个第一特征、及至少一个所述第二参与方设备提供的所述第二特征;结合所述预测值及所述目标预测结果,确定所述特征集合中各特征对应所述目标预测结果的贡献信息。2.根据权利要求1所述的方法,其特征在于,所述接收所述第二参与方设备发送的至少一个匿名特征,以及与各所述匿名特征对应的第二节点路由,包括:发送携带样本标识的匿名特征获取请求至所述第二参与方设备;其中,所述匿名特征获取请求用于,所述第二参与方设备响应所述匿名特征获取请求,确定所述样本标识对应的所述第二特征、所述第二特征对应的匿名特征以及所述匿名特征对应的第二节点路由;接收到所述第二参与方设备返回的与所述样本标识对应的匿名特征、以及所述匿名特征对应的第二节点路由。3.根据权利要求2所述的方法,其特征在于,所述方法还包括:在本地创建匿名关系记录表,所述匿名关系记录表,用于记录用于训练所述联邦树模型的训练样本的样本标识、所述样本标识对应的所述第二参与方设备的匿名特征、以及所述匿名特征对应的第二节点路由;将接收到的与所述样本标识对应的匿名特征、以及所述匿名特征对应的第二节点路由存储于所述匿名关系记录表中。4.根据权利要求1所述的方法,其特征在于,在所述确定所述特征集合中各特征对应所述目标预测结果的贡献信息之后,所述方法还包括:从所述第一参与方设备提供的至少两个第一特征、以及至少一个所述第二参与方设备提供的第二特征中,选取至少两个特征;构建包括所述至少两个特征的特征交互组,并确定所述特征交互组对应的至少一个交互边际贡献值;基于所述至少一个交互边际贡献值,确定所述特征交互组对应所述目标预测结果的交互贡献信息。
5.根据权利要求4所述的方法,其特征在于,所述确定所述特征交互组对应的交互边际贡献值,包括:确定所述特征集合的第一特征子集,所述第一特征子集包括所述至少两个特征中至少之一;确定所述特征集合的第二特征子集,所述第二特征子集与所述特征交互组为互补关系;获取所述第一特征子集对应的预测值、以及所述第二特征子集对应的预测值,并基于所述第一特征子集对应的预测值、以及所述第二特征子集对应的预测值,确定所述特征交互组对应的交互边际贡献值。6.根据权利要求4所述的方法,其特征在于,所述基于所述至少一个交互边际贡献值,确定所述特征交互组对应所述目标预测结果的交互贡献信息,包括:当所述交互边际贡献值的数量为多个时,对多个所述交互边际贡献值进行求和,得到所述特征交互组对应所述目标预测结果的交互贡献信息。7.一种联邦树模型的数据处理方法,其特征在于,基于联邦学习系统,所述联邦学习系统包括第一参与方设备及至少一个第二参与方设备,所述方法应用于第二参与方设备,所述方法包括:针对用于训练所述联邦树模型的各第二特征,分别生成与...

【专利技术属性】
技术研发人员:陈伟敬马国强范涛徐倩
申请(专利权)人:深圳前海微众银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1