联邦学习方法、装置、设备和可读存储介质制造方法及图纸

技术编号:34012441 阅读:6 留言:0更新日期:2022-07-02 14:55
本申请提供一种联邦学习方法、装置、设备和可读存储介质,其中,该方法包括:将样本加密标签的第一分量共享至参与方,根据第二分量,计算得到主动方的每个分裂的信息增益分量,根据参与方的每个分裂的信息增益分量和主动方的每个分裂的信息增益分量,从分裂中确定出最优分裂,根据最优分裂,与参与方共同构建得到最优分裂的分裂信息。该技术方案中,通过主动方将样本加密标签中的分量共享给参与方,由主动方和参与方分别在本地计算所有分裂的信息增益,本地比较得到最优分裂,之后主动方再与参与方通信构建得到分裂信息的明文,能够降低联邦学习的训练过程中的通讯成本。联邦学习的训练过程中的通讯成本。联邦学习的训练过程中的通讯成本。

【技术实现步骤摘要】
联邦学习方法、装置、设备和可读存储介质


[0001]本申请涉及联邦学习
,尤其涉及一种联邦学习方法、装置、设备和可读存储介质。

技术介绍

[0002]纵向联邦学习是联邦学习中的一种类别,不同的数据持有方具备的是同一样本的不同特征维度,而样本标签仅为其中一方持有,其它各方仅拥有部分数据特征,其中,持有样本标签的一方称为主动方,仅拥有部分数据特征的一方称为参与方,主动方通常希望通过与参与方合作,利用参与方的数据特征来提升联邦学习模型的效果。
[0003]现有技术中,联邦学习模型的训练主要涉及的是构建决策树,决定决策树中每个节点是否分裂以及如何分裂。在决策树的构建过程中,主动方与参与方之间通常需要通讯来传递同态密文,以保护主动方的样本标签和参与方的特征信息,防止发生泄露。
[0004]但是,现有技术每一轮训练所传输的同态密文数量非常大,会占用很大的通讯成本,导致模型的训练成本大幅增加。

技术实现思路

[0005]本申请提供一种联邦学习方法、装置、设备和可读存储介质,用于解决现有的联邦学习在训练过程中主动方与参与方之间传递同态密文,通讯成本占用大的问题。
[0006]第一方面,本申请实施例提供一种联邦学习方法,应用于联邦学习中的主动方,所述主动方包括有第一样本数据和样本标签,所述方法包括:
[0007]将所述样本加密标签的第一分量共享至参与方,所述样本加密标签为所述主动方对所述样本标签加密得到,所述样本加密标签包括第一分量和第二分量,所述第一分量用于所述参与方计算得到待构建模型中分裂节点的每个分裂的信息增益分量;
[0008]根据所述第二分量,计算得到所述主动方的每个分裂的信息增益分量;
[0009]根据所述参与方的每个分裂的信息增益分量和所述主动方的每个分裂的信息增益分量,从所述分裂中确定出最优分裂,所述最优分裂的信息增益分量值最大;
[0010]根据所述最优分裂,与所述参与方共同构建得到所述最优分裂的分裂信息,所述最优分裂的分裂信息用于构建所述待构建模型中所述分裂节点的左节点和右节点。
[0011]在第一方面的一种可能设计中,
[0012]所述将所述样本加密标签的第一分量共享至参与方,包括:
[0013]与所述参与方共同生成公钥和私钥,每个参与方和主动方持有至少一个私钥;
[0014]根据所述公钥和私钥,将所述样本加密标签的第一分量共享至所述参与方。
[0015]在第一方面的另一种可能设计中,所述根据所述公钥和私钥,将所述样本加密标签的第一分量共享至所述参与方,包括:
[0016]获取每个参与方发送的第一加密结果,所述第一加密结果为所述参与方使用所述公钥对持有的随机秘密消息进行加密得到的;
[0017]使用所述公钥对所述主动方持有的随机密码消息进行加密,得到第二加密结果;
[0018]根据所述第一加密结果和第二加密结果,对所述样本标签进行加密得到密文值;
[0019]与所述参与方共同对所述密文值进行解密,得到解密结果;
[0020]根据每个参与方持有的私钥,从所述解密结果中得到第一分量,共享至所述参与方。
[0021]在第一方面的再一种可能设计中,所述根据所述第二分量,计算得到所述主动方的每个分裂的信息增益分量之前,还包括:
[0022]根据所述主动方持有的私钥,从所述解密结果中得到第二分量。
[0023]在第一方面的又一种可能设计中,所述根据所述第二分量,计算得到所述主动方的每个分裂的信息增益分量,包括:
[0024]获取每个分裂的左节点的样本向量和右节点的样本向量;
[0025]根据所述第二分量、所述左节点的样本分量和右节点的样本向量,计算得到所述主动方的每个分裂的信息增益分量。
[0026]在第一方面的又一种可能设计中,所述根据所述第二分量、所述左节点的样本分量和右节点的样本向量,计算得到所述主动方的每个分裂的信息增益分量,包括:
[0027]根据所述第二分量、所述左节点的样本向量和所述右节点的样本向量,计算所述左节点的标签向量和所述右节点的标签向量;
[0028]根据所述左节点的标签向量和右节点的标签向量,获取左节点的标签比率和右节点的标签比率;
[0029]根据所述左节点的样本向量和所述右节点的样本向量,获取所述左节点的样本比率和右节点的样本比率;
[0030]根据所述左节点的标签比率、左节点的样本比率、右节点的标签比率和右节点的样本比率,计算得到所述主动方的每个分裂的信息增益分量。
[0031]在第一方面的又一种可能设计中,所述根据所述参与方的每个分裂的信息增益分量和所述主动方的每个分裂的信息增益分量,从所述分裂中确定出最优分裂,包括:
[0032]获取所述参与方的最优分裂分量,所述最优分裂分量为所述参与方在本地根据每个分裂的信息增益分量计算得到的;
[0033]根据所述主动方的每个分裂的信息增益分量,得到所述主动方的最优分裂分量;
[0034]根据所述参与方的最优分裂分量和所述主动方的最优分裂分量,从所述分裂中确定出最优分裂。
[0035]在第一方面的又一种可能设计中,所述从所述分裂中确定出最优分裂,包括:
[0036]基于多方安全计算,与所述参与方通讯共同比较所述主动方的最优分裂分量和所述参与方的最优分裂分量,确定出最优分裂。
[0037]在第一方面的又一种可能设计中,所述根据所述最优分裂,与所述参与方共同构建得到所述最优分裂的分裂信息,包括:
[0038]获取所述最优分裂对应的指标,所述指标至少包括特征分量、分裂分量和信息增益分量;
[0039]根据所述最优分裂对应的指标,与所述参与方构建得到所述最优分裂的分裂信息。
[0040]在第一方面的又一种可能设计中,所述根据所述最优分裂,与所述参与方共同构建得到所述最优分裂的分裂信息之后,还包括:
[0041]确定所述左节点/右节点是否达到预设分裂条件;
[0042]若所述左节点/右节点达到预设分裂条件,则将所述左节点/右节点作为所述待构建模型的叶子节点;
[0043]获取所述参与方发送的所述叶子节点的节点编号和叶子节点的标签向量;
[0044]根据所述叶子节点的标签向量,得到所述叶子节点的样本标签。
[0045]第二方面,本申请实施例提供一种联邦学习方法,应用于联邦学习的参与方,所述方法包括:
[0046]获取主动方加密共享的第一分量、待构建模型中分裂节点的每个分裂的左节点样本向量、右节点样本向量;
[0047]根据所述第一分量、所述左节点的样本向量和右节点的样本向量,计算得到参与方的每个分裂的信息增益分量;
[0048]根据所述主动方的每个分裂的信息增益分量和所述参与方的每个分裂的信息增益分量,从所述分裂中确定出最优分裂,所述最优分裂的信息增益分量值最大;
[0049]根据所述最优分裂,与所述主动方共同构本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种联邦学习方法,其特征在于,应用于联邦学习中的主动方,所述主动方包括有第一样本数据和样本标签,所述方法包括:将样本加密标签的第一分量共享至参与方,所述样本加密标签为所述主动方对所述样本标签加密得到,所述样本加密标签包括第一分量和第二分量,所述第一分量用于所述参与方计算得到待构建模型中分裂节点的每个分裂的信息增益分量;根据所述第二分量,计算得到所述主动方的每个分裂的信息增益分量;根据所述参与方的每个分裂的信息增益分量和所述主动方的每个分裂的信息增益分量,从所述分裂中确定出最优分裂,所述最优分裂的信息增益分量值最大;根据所述最优分裂,与所述参与方共同构建得到所述最优分裂的分裂信息,所述最优分裂的分裂信息用于构建所述待构建模型中所述分裂节点的左节点和右节点。2.根据权利要求1所述的方法,其特征在于,所述将样本加密标签的第一分量共享至参与方,包括:与所述参与方共同生成公钥和私钥,每个参与方和主动方持有至少一个私钥;根据所述公钥和私钥,将所述样本加密标签的第一分量共享至所述参与方。3.根据权利要求2所述的方法,其特征在于,所述根据所述公钥和私钥,将所述样本加密标签的第一分量共享至所述参与方,包括:获取每个参与方发送的第一加密结果,所述第一加密结果为所述参与方使用所述公钥对持有的随机秘密消息进行加密得到的;使用所述公钥对所述主动方持有的随机密码消息进行加密,得到第二加密结果;根据所述第一加密结果和第二加密结果,对所述样本标签进行加密得到密文值;与所述参与方共同对所述密文值进行解密,得到解密结果;根据每个参与方持有的私钥,从所述解密结果中得到第一分量,共享至所述参与方。4.根据权利要求3所述的方法,其特征在于,所述根据所述第二分量,计算得到所述主动方的每个分裂的信息增益分量之前,还包括:根据所述主动方持有的私钥,从所述解密结果中得到第二分量。5.根据权利要求1所述的方法,其特征在于,所述根据所述第二分量,计算得到所述主动方的每个分裂的信息增益分量,包括:获取每个分裂的左节点的样本向量和右节点的样本向量;根据所述第二分量、所述左节点的样本分量和右节点的样本向量,计算得到所述主动方的每个分裂的信息增益分量。6.根据权利要求5所述的方法,其特征在于,所述根据所述第二分量、所述左节点的样本分量和右节点的样本向量,计算得到所述主动方的每个分裂的信息增益分量,包括:根据所述第二分量、所述左节点的样本向量和所述右节点的样本向量,计算所述左节点的标签向量和所述右节点的标签向量;根据所述左节点的标签向量和右节点的标签向量,获取左节点的标签比率和右节点的标签比率;根据所述左节点的样本向量和所述右节点的样本向量,获取所述左节点的样本比率和右节点的样本比率;根据所述左节点的标签比率、左节点的样本比率、右节点的标签比率和右节点的样本
比率,计算得到所述主动方的每个分裂的信息增益分量。7.根据权利要求1所述的方法,其特征在于,所述根据所述参与方的每个分裂的信息增益分量和所述主动方的每个分裂的信息增益分量,从所述分裂中确定出最优分裂,包括:获取所述参与方的最优分裂分量,所述最优分裂分量为所述参与方在本地根据每个分裂的信息增益分量计算得到的;根据所述主动方的每个分裂的信息增益分量,得到所述主动方的最优分裂分量;根据所述参与方的最优分裂分量和所述主动方的最优分裂分量,从所述分裂中确定出最优分裂。8.根据权利要求7所述的方法,其特征在于,所述从所述分裂中确定出最优分裂,包括:基于多方安全计算,与所述参与方通讯共同比较所述主动方的最优分裂分量和所述参与方的最优分裂分量,确定出最优分裂。9.根据权利要求8所述的方法,其特征在于,所述根据所述最优分裂,与所述参与方共同构建得到所述最优分裂的分裂信息,包括:获取所述最优分裂对应的指标,所述指标至少包括特征分量、分裂分量和信息增益分量;根据所述最优分裂对应的指标,与所述参与方构建得到所述最优分裂的分裂信息。10.根据权利要求1所述的方法,其特征在于,所述根据所述最优分裂,与所述参与方共同构建得到所述最优分裂的分裂信息之后,还包括:确定所述左节点/右节点是否达到预设分裂条件;若所述左节点/右节点达到预设分裂条件,则将所述左节点/右节点作为所述待构建模型的叶子节点;获取所述参与方发送的...

【专利技术属性】
技术研发人员:苏莉娅杨恺黄志翔彭南博
申请(专利权)人:京东科技控股股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1