一种纵向xgboost决策树的联邦学习方法和系统技术方案

技术编号：32649950 阅读：26 留言：0更新日期：2022-03-12 18:40

本发明专利技术公开一种纵向xgboost决策树的联邦学习方法和系统，涉及联邦学习和机器学习决策树技术领域，能够保证各方所持有样本的特征数据的隐私性，增强对各方特征数据的安全性。本发明专利技术的主要技术方案为：本发明专利技术提供了纵向xgboost决策树的联合训练过程和联合推理过程，在联合训练过程中计算分裂点以及在联合推理过程中对每个节点进行判别，联合训练过程公开的信息是每个参与方的最大分裂值，而不会直接泄露每个参与方的特征信息，联合推理过程的安全依赖门限同态加密方案。本发明专利技术主要应用于决策树的联合训练和联合推理过程。决策树的联合训练和联合推理过程。决策树的联合训练和联合推理过程。

全部详细技术资料下载

【技术实现步骤摘要】
一种纵向xgboost决策树的联邦学习方法和系统

[0001]本专利技术涉及联邦学习和机器学习决策树
，尤其涉及一种纵向xgboost决策树的联邦学习方法和系统。

技术介绍

[0002]纵向xgboost决策树联邦学习是指当每个样本的特征信息和标签信息掌握在不同所有者处，各方联合进行xgboost决策树的训练，并且各方在训练和推理过程中不希望向其他任意方泄露关于样本的特征信息或者标签信息。
[0003]例如xgboost决策树的训练所需要的完整样本信息如下，例举表一：IDx1x2x3x4x5x6yu1.....................u2.....................u3.....................其中，ID表示能唯一确定所描述对象的标识，x1到x6表示该对象的属性信息（特征信息），y表示标签信息。其中的属性信息有可能分布在不同的机构，例如机构A具有前三个特征信息和标签信息；机构B具有后三个特征信息。比如，现实中银行和保险机构可以有一批共同的客户，而银行和保险具有关于其共同客户的不同属性信息，因此不同机构间具有联合进行xgboost决策树训练的条件。联合训练的障碍来自银行和保险不愿/不能向对方透漏各自客户的信息。
[0004]目前，对于使用paillier同态加密方案设计纵向xgboost决策树联邦学习，例如SecureBoost方案，它是一种新的基于联邦学习的无损隐私保护树增强方案，具体阐述如下：在SecureBoost方案中，拥有标签信息的参与方称为“主动方...

【技术保护点】

【技术特征摘要】
1.一种纵向xgboost决策树的联邦学习方法，其特征在于，所述方法包括：根据前t
‑
1轮生成的决策树模型，参与方计算每个样本的一阶梯度和二阶梯度；一个所述参与方将每个样本的一阶梯度和二阶梯度发送给其他多个参与方；每个所述参与方在本地计算其拥有的所有特征对应的多个分裂值并从中选择最大分裂值，得到每个所述参与方自身对应的最大分裂值；通过比较每个所述参与方自身对应的最大分裂值，选择一个全局最大分裂值；根据所述全局最大分裂值确定目标分裂点，完成对节点样本空间进行划分，将划分后的节点样本空间对应的集合信息同步给每个所述参与方，以使得每个所述参与方共同获知每棵决策树的全局结构信息，用于完成对第t轮生成的k棵决策树模型的训练过程；每个所述参与方分别对所述k棵决策树模型中所有需要其负责判别的节点进行本地判别，利用门限同态加密方案保护各个所述参与方的交互过程，以完成纵向联邦决策树的联合推理过程。2.根据权利要求1所述的方法，其特征在于，所述每棵决策树的全局结构信息，包括：每个节点对应的属主、不同节点之间的关联，所述属主为对节点进行判别的参与方；每个节点具有唯一编号，所述编号为由树的序号和节点所述树中的位置进行表征。3.根据权利要求1所述的方法，其特征在于，所述通过比较每个所述参与方自身对应的最大分裂值，选择一个全局最大分裂值，包括：在每个所述参与方确定自身对应的最大分裂值之后，每个所述参与方将自身对应的最大分裂值发送给其他参与方；所有的参与方经比较多个所述最大分裂值，从中选择一个全局最大分裂值。4.根据权利要求1所述的方法，其特征在于，所述根据所述全局最大分裂值确定目标分裂点，完成对节点样本空间进行划分，包括：根据所述全局最大分裂值，确定对应的属主；根据所述全局最大分裂值和所述属主，确定目标分裂点的特征和阈值；根据所述特征和阈值对节点样本空间进行划分。5.根据权利要求1所述的方法，其特征在于，所述每个所述参与方分别对所述k棵决策树模型中所有需要其负责判别的节点进行本地判别，利用门限同态加密方案保护各个所述参与方的交互过程，以完成纵向联邦决策树的联合推理过程，包括：每个所述参与方获取对应的判别输出表；根据所述判别输出表，每个所述参与方计算对应所负责节点的判别边长，...

【专利技术属性】
技术研发人员：李登峰，
申请(专利权)人：神州融安科技北京有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人