联邦树模型的数据处理方法、装置、设备及存储介质制造方法及图纸

技术编号:32364106 阅读:29 留言:0更新日期:2022-02-20 03:35
本申请提供了一种联邦树模型的数据处理方法、装置、设备、存储介质及程序产品,应用于第一参与方设备;方法包括:获取用作联邦树模型的训练样本的特征集合,特征集合包括第一参与方设备提供的第一特征、以及第二参与方设备提供的第二特征;接收各第二参与方设备发送的用于模拟联邦树模型的第一节点路由;获取各第一特征所对应节点在联邦树模型中的第二节点路由;基于第一节点路由及第二节点路由,得到联邦树模型对应的伪联邦树模型;通过伪联邦树模型对特征集合所包括的特征子集进行预测,得到预测值,并结合预测值及目标预测结果,确定特征集合中各特征对应目标预测结果的贡献信息。通过本申请,能够快速、准确的确定样本中各特征的贡献信息。特征的贡献信息。特征的贡献信息。

【技术实现步骤摘要】
联邦树模型的数据处理方法、装置、设备及存储介质


[0001]本申请涉及人工智能技术,尤其涉及一种联邦树模型的数据处理方法、装置、电子设备、计算机可读存储介质及计算机程序产品。

技术介绍

[0002]随着各行各业逐渐加强数据隐私保护的大趋势下,联邦学习,一种可以在保护数据隐私的情况下协同多方数据建立机器学习的技术,成为了各企业/行业间合作的关键之一。如今,纵向场景下,纵向树模型已经广泛地在纵向联邦场景下,成为了金融、风控领域的常用且强力的算法之一。
[0003]在金融、风控领域,往往想要获取单条样本中的各特征对于联邦树模型输出结果的影响。如对于某个特定样本(比方说违约的客户),需要获取具体是哪个特征以及该特征的哪些取值,对确定用户是违约用户产生了重要的影响。另外,还需要确定合作方提供的特征对于模型输出的影响。
[0004]相关联邦树模型解释方案,通过获取特征重要度从整体上对树模型进行解释,无法具体的解释单条样本。另外,虽然使用特征重要度能够得知合作方的特征使用了多少次,但是合作方特征对于模型输出结果的影响的正负性是不可知的,且确定本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种联邦树模型的数据处理方法,其特征在于,基于联邦学习系统,所述联邦学习系统包括第一参与方设备及至少一个第二参与方设备,所述方法应用于第一参与方设备,所述方法包括:获取用作联邦树模型的训练样本的特征集合,所述特征集合包括第一参与方设备提供的至少两个携带目标预测结果的第一特征、以及所述第二参与方设备提供的至少一个第二特征;接收各所述第二参与方设备发送的用于模拟所述联邦树模型的第一节点路由,所述第一节点路由,用于指示以所述第二特征作为所述联邦树模型的分裂节点时,所述分裂节点对应的子节点路径;获取所述至少两个第一特征所对应节点在所述联邦树模型中的第二节点路由;基于所述第一节点路由及所述第二节点路由,模拟所述联邦树模型,得到所述联邦树模型对应的伪联邦树模型;通过所述伪联邦树模型对所述特征集合所包括的特征子集进行预测,得到相应的预测值,并结合所述预测值及所述目标预测结果,确定所述特征集合中各特征对应所述目标预测结果的贡献信息。2.根据权利要求1所述的方法,其特征在于,所述接收各所述第二参与方设备发送的用于模拟所述联邦树模型的第一节点路由,包括:向各所述第二参与方设备发送节点路由获取请求,所述节点路由获取请求携带有训练样本对应的样本标识;接收到各所述第二参与方设备基于所述节点路由获取请求,返回的与所述样本标识对应的、用于模拟所述联邦树模型的第一节点路由。3.根据权利要求1所述的方法,其特征在于,所述基于所述第一节点路由及所述第二节点路由,模拟所述联邦树模型,得到所述联邦树模型对应的伪联邦树模型,包括:创建所述联邦树模型的模型副本,并从根节点开始对所述模型副本的每个节点进行遍历;当遍历到的当前节点对应的特征为所述第二特征时,获取与所述第二参与方设备对应的联邦特征,并将当前节点对应的特征替换为所述联邦特征;根据所述第一节点路由所指示的子节点路径,确定当前节点包括的子节点;当遍历到的当前节点对应的特征为所述第一特征时,执行针对其它节点的遍历,直至所述模型副本中的节点遍历完成,将所述模型副本中对应所述第一特征的第一节点、对应所述第二特征的第二节点、所述第二节点包括的子节点所构成的树模型作为所述伪联邦模型。4.根据权利要求1所述的方法,其特征在于,所述基于所述第一节点路由及所述第二节点路由,模拟所述联邦树模型,得到所述联邦树模型对应的伪联邦树模型,包括:创建初始树模型,所述初始树模型中具有对应所述第一特征的节点,且所述初始树模型中的节点对应所述第二节点路由;获取与所述第二参与方设备存在一一对应关系的联邦特征;根据所述第一节点路由,在所述初始树模型中创建对应所述联邦特征的节点及所述节点包括的子节点,以得到所述伪联邦树模型。
5.根据权利要求1所述的方法,其特征在于,所述通过所述伪联邦树模型对所述特征集合所包括的特征子集进行预测,得到相应的预测值,包括:针对所述特征集合包括的各特征子集,分别执行以下操作:从所述伪联邦树模型的根节点开始,遍历所述伪联邦树模型的节点;当遍历到的当前节点为非叶子节点,且所述特征子集包括所述当前节点对应的特征时,获取所述当前节点对应的节点路由;根据所述节点路由确定所述当前节点对应的叶子节点,并将所述叶子节点对应的特征值作为所述特征子集的预测值。6.根据权利要求1所述的方法,其特征在于,所述通过所述伪联邦树模型对所述特征集合所包括的特征子集进行预测,得到相应的预测值,包括:针对所述特征集合包括的各特征子集,分别执行以下操作:从所述伪联邦树模型的根节点开始,遍历所述伪联邦树模型的节点;当遍历到的当前节点为非叶子节点,且所述特征子集不包括所述当前节点对应的特征时,...

【专利技术属性】
技术研发人员:陈伟敬马国强范涛
申请(专利权)人:深圳前海微众银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1