纵向联邦XGBoost训练方法、系统、设备、介质及产品技术方案

技术编号：41725400 阅读：28 留言：0更新日期：2024-06-19 12:49

本公开是关于一种纵向联邦XGBoost训练方法、系统、设备、介质及产品，通过利用索引矩阵和秘密共享两种形式替代原始数据和标签的交互，使得Guest方和Host方均无法知道对方的数据；在保证安全性的同时，利用秘密共享的加法同态性保证了节点分裂和节点权重计算的准确性，从而保证模型是无损的，同时，计算方和数据方仅使用较少的交互次数即可高效完成模型的训练。

全部详细技术资料下载

【技术实现步骤摘要】

本公开涉及机器学习，尤其涉及一种纵向联邦xgboost训练方法、系统、设备、介质及产品。

技术介绍

1、联邦学习，是一种机器学习新范式，旨在满足用户隐私保护、数据安全、合法合规的要求下，联合多方进行机器学习算法建模。xgboost[1]作为机器学习算法的典型代表，有着较少的调参、优秀的可解释性、强大的性能，广泛应用于推荐系统、数据挖掘等领域。

2、在联邦学习中，一般分为guest和host两种角色方，目前联邦xgboost算法在面对计算方和数据方分离，通常情况下某个角色方是计算方也是数据方，即该角色提供数据的同时也提供运算服务。面对角色方分离成数据方和计算方的场景时，即角色方将数据资源和计算资源分离开，同时两个资源服务间互不信任时，现有的联邦学习xgboost均无法适用。

技术实现思路

1、为克服相关技术中存在的问题，本公开提供一种纵向联邦xgboost训练方法、系统、设备、介质及产品。

2、根据本公开实施例的第一方面，提供一种纵向联邦xgboost训练方法，gue...

【技术保护点】

1.一种纵向联邦XGBoost训练方法，其特征在于，Guest方包括第一数据方和第一计算方，Host方包括第二计算方包括和第二数据方，包括：

2.如权利要求1所述的纵向联邦XGBoost训练方法，其特征在于，基于秘密共享的方式将样本标签划分为正常标签和加密标签，将所述正常标签发送给所述第一计算方，将所述加密标签发送给所述第二计算方，所述第二计算方具备用于解密所述加密标签的私钥，包括：

3.如权利要求1所述的纵向联邦XGBoost训练方法，其特征在于，对所述第一交集样本和所述第二交集样本的最优分裂点所在位置的节点进行分裂，直至满足迭代条件或样本集合不能再划分，获取多...

【技术特征摘要】

1.一种纵向联邦xgboost训练方法，其特征在于，guest方包括第一数据方和第一计算方，host方包括第二计算方包括和第二数据方，包括：

2.如权利要求1所述的纵向联邦xgboost训练方法，其特征在于，基于秘密共享的方式将样本标签划分为正常标签和加密标签，将所述正常标签发送给所述第一计算方，将所述加密标签发送给所述第二计算方，所述第二计算方具备用于解密所述加密标签的私钥，包括：

3.如权利要求1所述的纵向联邦xgboost训练方法，其特征在于，对所述第一交集样本和所述第二交集样本的最优分裂点所在位置的节点进行分裂，直至满足迭代条件或样本集合不能再划分，获取多个所述guest方和所述的host方的决策树，基于多个所述决策树获取纵向联邦xgboost模型，包括：

4.如权利要求1所述的纵向联邦xgboost训练方法，其特征在于，将所述第一数据方的第一索引矩阵和所述第二数据方的第二索引矩阵均发送给所述第一计算方和所述第二计算方，所述第一索引矩阵和所述第二索引矩阵是根据各自样本对每个特征进行...

【专利技术属性】
技术研发人员：王洪波，何冉，许芬，
申请(专利权)人：拓尔思天行网安信息技术有限责任公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人