构建横向联邦树的方法、主服务器、业务平台和系统技术方案

技术编号:30027744 阅读:18 留言:0更新日期:2021-09-15 10:15
本公开提出一种构建横向联邦树的方法、主服务器、业务平台和系统,涉及计算机技术领域。主服务器根据各个业务平台的样本的所有共同特征的维度和预设参数确定第一向量,预设参数表示不参与横向联邦树的本次节点分裂的共同特征的个数,第一向量表示每个共同特征参与横向联邦树的本次节点分裂的程度;主服务器根据所有共同特征对应的全局特征取值范围确定第二向量,第二向量表示每个共同特征的全局特征取值范围内的随机分裂点;主服务器将两个向量下发给各个业务平台,以使得各个业务平台利用两个向量来进行横向联邦树的节点的分裂,避免了各个业务平台的原始数据或样本的数据分布信息暴露的风险,增强了数据的安全性和隐私性。性。性。

【技术实现步骤摘要】
构建横向联邦树的方法、主服务器、业务平台和系统


[0001]本公开涉及计算机
,特别涉及一种构建横向联邦树的方法、主服务器、业务平台和系统。

技术介绍

[0002]大数据时代产生的海量信息推动了人工智能的不断进步和发展,保护企业、个人、政府等其他机构的业务平台的数据的安全是合法利用大数据推动社会进步的前提。一些机构的业务平台需要在不共享数据的同时,能够联合其他机构的业务平台具有的数据来进行跨机构联合建模,因此,在保护数据安全和隐私性的前提下实现联合建模是当下需要解决的重要问题。
[0003]针对一些业务平台之间数据样本中存在的样本特征重叠较多而样本重叠较少的情况,由此,在一些相关技术中提出了横向联邦树模型,利用各个业务平台样本特征相同而样本不完全相同的数据样本联合起来构建联邦树模型。
[0004]在构建横向联邦树模型的过程中,业务平台每次基于随机选择的一个特征进行节点的一次分裂,并将本地样本基于该次分裂的数据分布信息等训练结果通过主服务器共享给其他业务平台,可以在不暴露业务平台自身所拥有的原始数据的情况下,通过一个主服务器来收集和共享各个业务平台的数据分布等信息,协调各业务平台以实现跨平台的统一建模。

技术实现思路

[0005]专利技术人发现,在多个业务平台参与构建横向联邦树模型的相关技术中,虽然不会暴露业务平台的原始数据,但是会暴露样本的数据分布信息,对数据的安全和隐私性造成一定程度的威胁。
[0006]在本公开实施例中,主服务器根据收集的各个业务平台样本的共同特征的维度和共同特征的全局特征取值范围生成两个随机向量,并将这两个随机向量下发给各个业务平台,以使得各个业务平台利用这两个随机向量进行横向联邦树的节点的分裂,最终完成横向联邦树模型的构建,避免了各个业务平台的原始数据或样本的数据分布信息暴露的风险,增强了数据的安全性和隐私性。
[0007]根据本公开的一些实施例,提供一种构建横向联邦树的方法,包括:
[0008]主服务器根据各个业务平台的样本所具有的所有共同特征的维度和预设参数确定第一向量,所述预设参数表示不参与所述横向联邦树的本次节点分裂的所述共同特征的个数,所述第一向量表示每个共同特征参与所述横向联邦树的本次节点分裂的程度;
[0009]主服务器根据各个业务平台的样本所具有的所有共同特征对应的全局特征取值范围确定第二向量,所述第二向量表示每个共同特征的全局特征取值范围内的随机分裂点;
[0010]主服务器将所述第一向量和所述第二向量分别下发给各个业务平台,以使得各个
业务平台利用所述第一向量和所述第二向量来进行横向联邦树的节点的分裂;
[0011]重复上述所有步骤,直至满足预设的终止条件。
[0012]在一些实施例中,确定第一向量包括:生成一个符合正态分布的随机向量,所述随机向量的维度等于各个业务平台对应的所有共同特征的维度;将所述随机向量中的所述预设参数指示的相应个数的元素的值设置为0,得到所述第一向量。
[0013]在一些实施例中,确定第二向量包括:主服务器从每个共同特征对应的全局特征取值范围内随机选取一个数值,所有共同特征对应的一组数值组成第二向量。
[0014]在一些实施例中,每个共同特征对应的全局特征取值范围根据所述共同特征在各个业务平台的局部特征取值范围的并集确定。
[0015]在一些实施例中,每个共同特征对应的全局特征取值范围根据各个业务平台上报的所述共同特征的各个取值的范围确定。
[0016]在一些实施例中,主服务器从每个共同特征对应的全局特征取值范围内随机选取一个数值包括:主服务器从每个共同特征对应的全局特征取值范围内选取位于中间位置处的数值。
[0017]在一些实施例中,还包括:主服务器对各个业务平台的样本的原始特征进行特征对齐,将对齐的原始特征确定为各个业务平台的样本所具有的共同特征。
[0018]在一些实施例中,所述预设参数小于各个业务平台所具有的所有共同特征的维度。
[0019]在一些实施例中,所述横向联邦树用于评测设备性能,所述各个业务平台包括拥有待评测设备类型的设备样本的多个业务平台,所述各个业务平台的样本所具有的所有共同特征包括所述各个业务平台所拥有的所述待评测设备类型的设备样本的共同的运行参数,分裂过程中设备样本所在节点的横向联邦树深度信息与所述设备样本的性能信息相对应。
[0020]根据本公开的另一些实施例,提供一种构建横向联邦树的方法,包括:
[0021]业务平台接收主服务器下发的第一向量和第二向量,所述第一向量表示每个共同特征参与所述横向联邦树的本次节点分裂的程度,所述第二向量表示每个共同特征的全局特征取值范围内的随机分裂点;
[0022]业务平台利用所述第一向量和所述第二向量来进行横向联邦树的节点的分裂,以构建横向联邦树;
[0023]业务平台重复执行上述所有步骤,直至满足预设的终止条件。
[0024]在一些实施例中,所述业务平台利用所述第一向量和所述第二向量来进行横向联邦树的节点的分裂包括:所述业务平台计算本地的每个样本的特征向量与所述第二向量的差值,得到每个样本对应的差值向量;计算每个样本对应的所述差值向量与所述第一向量的乘积,得到每个样本对应的分裂值;根据每个样本所对应的所述分裂值对当前节点进行分裂,以确定所述样本所属的所述当前节点的子节点。
[0025]在一些实施例中,根据每个样本所对应的所述分裂值对当前节点进行分裂包括:如果样本对应的分裂值小于0,将所述样本划分到当前节点的右子节点,如果样本对应的分裂值大于0,将所述样本划分到当前节点的左子节点;或者,如果样本对应的分裂值小于0,将所述样本划分到当前节点的左子节点,如果样本对应的分裂值大于0,将所述样本划分到
当前节点的右子节点。
[0026]在一些实施例中,所述终止条件包括:横向联邦树的深度达到预设深度;或者,横向联邦树的叶子节点的样本数量达到预设数量。
[0027]在一些实施例中,还包括:业务平台向主服务器上报每个共同特征的局部特征取值范围,以使得主服务器根据所述共同特征在各个业务平台的各个局部特征取值范围的并集确定相应共同特征对应的全局特征取值范围,根据各个业务平台所具有的所有共同特征对应的所述全局特征取值范围确定第二向量。
[0028]在一些实施例中,还包括:业务平台从每个共同特征的局部特征取值范围选取一个数值,并上报给主服务器,以使得主服务器根据各个业务平台上报的每个共同特征的各个取值的范围确定相应共同特征对应的全局特征取值范围,根据各个业务平台所具有的所有共同特征对应的所述全局特征取值范围确定第二向量。
[0029]在一些实施例中,还包括:利用任一实施例所述的构建横向联邦树的方法,构建多个横向联邦树,以生成横向联邦森林。
[0030]在一些实施例中,还包括:业务平台初始化横向联邦树的根节点,使得根节点包括所述业务平台的所有样本。
[0031]在一些实施例中,所述横向联邦树本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种构建横向联邦树的方法,其特征在于,包括:主服务器根据各个业务平台的样本所具有的所有共同特征的维度和预设参数确定第一向量,所述预设参数表示不参与所述横向联邦树的本次节点分裂的所述共同特征的个数,所述第一向量表示每个共同特征参与所述横向联邦树的本次节点分裂的程度;主服务器根据各个业务平台的样本所具有的所有共同特征对应的全局特征取值范围确定第二向量,所述第二向量表示每个共同特征的全局特征取值范围内的随机分裂点;主服务器将所述第一向量和所述第二向量分别下发给各个业务平台,以使得各个业务平台利用所述第一向量和所述第二向量来进行横向联邦树的节点的分裂;重复上述所有步骤,直至满足预设的终止条件。2.根据权利要求1所述的构建横向联邦树的方法,其特征在于,确定第一向量包括:生成一个符合正态分布的随机向量,所述随机向量的维度等于各个业务平台对应的所有共同特征的维度;将所述随机向量中的所述预设参数指示的相应个数的元素的值设置为0,得到所述第一向量。3.根据权利要求1所述的构建横向联邦树的方法,其特征在于,确定第二向量包括:主服务器从每个共同特征对应的全局特征取值范围内随机选取一个数值,所有共同特征对应的一组数值组成第二向量。4.根据权利要求3所述的构建横向联邦树的方法,其特征在于,每个共同特征对应的全局特征取值范围根据所述共同特征在各个业务平台的局部特征取值范围的并集确定。5.根据权利要求3所述的构建横向联邦树的方法,其特征在于,每个共同特征对应的全局特征取值范围根据各个业务平台上报的所述共同特征的各个取值的范围确定。6.根据权利要求3所述的构建横向联邦树的方法,其特征在于,主服务器从每个共同特征对应的全局特征取值范围内随机选取一个数值包括:主服务器从每个共同特征对应的全局特征取值范围内选取位于中间位置处的数值。7.根据权利要求1所述的构建横向联邦树的方法,其特征在于,还包括:主服务器对各个业务平台的样本的原始特征进行特征对齐,将对齐的原始特征确定为各个业务平台的样本所具有的共同特征。8.根据权利要求1所述的构建横向联邦树的方法,其特征在于,所述预设参数小于各个业务平台所具有的所有共同特征的维度。9.根据权利要求1-8任一项所述的构建横向联邦树的方法,其特征在于,所述横向联邦树用于评测设备性能,所述各个业务平台包括拥有待评测设备类型的设备样本的多个业务平台,所述各个业务平台的样本所具有的所有共同特征包括所述各个业务平台所拥有的所述待评测设备类型的设备样本的共同的运行参数,分裂过程中设备样本所在节点的横向联邦树深度信息与所述设备样本的性能信息相对应。10.一种构建横向联邦树的方法,其特征在于,包括:业务平台接收主服务器下发的第一向量和第二向量,所述第一向量表示每个共同特征参与所述横向联邦树的本次节点分裂的程度,所述第二向量表示每个共同特征的全局特征取值范围内的随机分裂点;业务平台利用所述第一向量和所述第二向量来进行横向联邦树的节点的分裂,以构建
横向联邦树;业务平台重复执行上述所有步骤,直至满足预设的终止条件。11.根据权利要求10所述的构建横向联邦树的方法,其特征在于,所述业务平台利用所述第一向量和所述第二向量来进行横向联邦树的节点的分裂包括:所述业...

【专利技术属性】
技术研发人员:刘洋杜师帅张芳娟张钧波郑宇
申请(专利权)人:京东城市北京数字科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1