【技术实现步骤摘要】
构建横向联邦树的方法、主服务器、业务平台和系统
[0001]本公开涉及计算机
,特别涉及一种构建横向联邦树的方法、主服务器、业务平台和系统。
技术介绍
[0002]大数据时代产生的海量信息推动了人工智能的不断进步和发展,保护企业、个人、政府等其他机构的业务平台的数据的安全是合法利用大数据推动社会进步的前提。一些机构的业务平台需要在不共享数据的同时,能够联合其他机构的业务平台具有的数据来进行跨机构联合建模,因此,在保护数据安全和隐私性的前提下实现联合建模是当下需要解决的重要问题。
[0003]针对一些业务平台之间数据样本中存在的样本特征重叠较多而样本重叠较少的情况,由此,在一些相关技术中提出了横向联邦树模型,利用各个业务平台样本特征相同而样本不完全相同的数据样本联合起来构建联邦树模型。
[0004]在构建横向联邦树模型的过程中,业务平台每次基于随机选择的一个特征进行节点的一次分裂,并将本地样本基于该次分裂的数据分布信息等训练结果通过主服务器共享给其他业务平台,可以在不暴露业务平台自身所拥有的原始数据的情况下,通过一个主服务器来收集和共享各个业务平台的数据分布等信息,协调各业务平台以实现跨平台的统一建模。
技术实现思路
[0005]专利技术人发现,在多个业务平台参与构建横向联邦树模型的相关技术中,虽然不会暴露业务平台的原始数据,但是会暴露样本的数据分布信息,对数据的安全和隐私性造成一定程度的威胁。
[0006]在本公开实施例中,主服务器根据收集的各个业务平台样本的共同特征的维 ...
【技术保护点】
【技术特征摘要】
1.一种构建横向联邦树的方法,其特征在于,包括:主服务器根据各个业务平台的样本所具有的所有共同特征的维度和预设参数确定第一向量,所述预设参数表示不参与所述横向联邦树的本次节点分裂的所述共同特征的个数,所述第一向量表示每个共同特征参与所述横向联邦树的本次节点分裂的程度;主服务器根据各个业务平台的样本所具有的所有共同特征对应的全局特征取值范围确定第二向量,所述第二向量表示每个共同特征的全局特征取值范围内的随机分裂点;主服务器将所述第一向量和所述第二向量分别下发给各个业务平台,以使得各个业务平台利用所述第一向量和所述第二向量来进行横向联邦树的节点的分裂;重复上述所有步骤,直至满足预设的终止条件。2.根据权利要求1所述的构建横向联邦树的方法,其特征在于,确定第一向量包括:生成一个符合正态分布的随机向量,所述随机向量的维度等于各个业务平台对应的所有共同特征的维度;将所述随机向量中的所述预设参数指示的相应个数的元素的值设置为0,得到所述第一向量。3.根据权利要求1所述的构建横向联邦树的方法,其特征在于,确定第二向量包括:主服务器从每个共同特征对应的全局特征取值范围内随机选取一个数值,所有共同特征对应的一组数值组成第二向量。4.根据权利要求3所述的构建横向联邦树的方法,其特征在于,每个共同特征对应的全局特征取值范围根据所述共同特征在各个业务平台的局部特征取值范围的并集确定。5.根据权利要求3所述的构建横向联邦树的方法,其特征在于,每个共同特征对应的全局特征取值范围根据各个业务平台上报的所述共同特征的各个取值的范围确定。6.根据权利要求3所述的构建横向联邦树的方法,其特征在于,主服务器从每个共同特征对应的全局特征取值范围内随机选取一个数值包括:主服务器从每个共同特征对应的全局特征取值范围内选取位于中间位置处的数值。7.根据权利要求1所述的构建横向联邦树的方法,其特征在于,还包括:主服务器对各个业务平台的样本的原始特征进行特征对齐,将对齐的原始特征确定为各个业务平台的样本所具有的共同特征。8.根据权利要求1所述的构建横向联邦树的方法,其特征在于,所述预设参数小于各个业务平台所具有的所有共同特征的维度。9.根据权利要求1-8任一项所述的构建横向联邦树的方法,其特征在于,所述横向联邦树用于评测设备性能,所述各个业务平台包括拥有待评测设备类型的设备样本的多个业务平台,所述各个业务平台的样本所具有的所有共同特征包括所述各个业务平台所拥有的所述待评测设备类型的设备样本的共同的运行参数,分裂过程中设备样本所在节点的横向联邦树深度信息与所述设备样本的性能信息相对应。10.一种构建横向联邦树的方法,其特征在于,包括:业务平台接收主服务器下发的第一向量和第二向量,所述第一向量表示每个共同特征参与所述横向联邦树的本次节点分裂的程度,所述第二向量表示每个共同特征的全局特征取值范围内的随机分裂点;业务平台利用所述第一向量和所述第二向量来进行横向联邦树的节点的分裂,以构建
横向联邦树;业务平台重复执行上述所有步骤,直至满足预设的终止条件。11.根据权利要求10所述的构建横向联邦树的方法,其特征在于,所述业务平台利用所述第一向量和所述第二向量来进行横向联邦树的节点的分裂包括:所述业...
【专利技术属性】
技术研发人员:刘洋,杜师帅,张芳娟,张钧波,郑宇,
申请(专利权)人:京东城市北京数字科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。