一种树模型构建方法、装置、电子设备及存储介质制造方法及图纸

技术编号：35136746 阅读：26 留言：0更新日期：2022-10-05 10:11

本申请提供了一种树模型构建方法、装置、电子设备及存储介质，用于改善目前联邦学习树模型的构建过程的安全性较低的问题。该树模型构建方法可以应用于联邦学习的第一参与方设备，该方法包括：获取样本数据和样本标签；根据样本数据和样本标签计算初始梯度值；若在树模型中已构建的子树数量小于预设阈值，则对初始梯度值进行加噪处理，获得加噪梯度值，并根据加噪梯度值构建树模型；若在树模型中已构建的子树数量大于或等于预设阈值，则对初始梯度值进行同态加密，获得加密梯度值，并根据加密梯度值构建树模型。度值构建树模型。度值构建树模型。

全部详细技术资料下载

【技术实现步骤摘要】
一种树模型构建方法、装置、电子设备及存储介质

[0001]本申请涉及联邦学习和机器学习的
，具体而言，涉及一种树模型构建方法、装置、电子设备及存储介质。

技术介绍

[0002]联邦机器学习(Federated Machine Learning，FML)，又被称为联邦学习(Federated Learning)、联合学习或者联盟学习，是一种机器学习技术，具体来说就是人们在多个拥有本地数据样本的分散式边缘设备或服务器上训练算法；这种方法与传统的集中式机器学习技术有显著不同，传统的集中式机器学习技术将所有的本地数据集上传到一个服务器上，而更经典的分散式方法则通常假设本地数据样本都是相同分布的。联邦机器学习是一个机器学习框架，能有效帮助多个机构在满足用户隐私保护、数据安全和法律法规的要求下，进行数据使用和机器学习建模。
[0003]在目前的联邦学习树模型的构建过程中，有标签方设备和无标签方设备可以相互通信；无标签方设备是指存储有用于训练模型的样本数据的设备，而有标签方设备是指存储有该样本数据对应样本标签的设备，包括两种情况：第一种情况，有标签方设备是仅仅包含该样本数据对应样本标签的设备；第二种情况，有标签方设备是既包含样本数据，又包含该样本数据对应样本标签的设备。有标签方设备需要在无需获知无标签设备上明文存储的样本数据的情况下，计算出样本数据对应预测标签与样本标签的损失值，并将损失值发送给无标签方设备，以使无标签方设备根据损失值计算出梯度值，使用梯度值对本地模型进行训练。在具体的实践过程中发现，目前联邦学习树模...

【技术保护点】

【技术特征摘要】
1.一种树模型构建方法，其特征在于，应用于联邦学习的第一参与方设备，包括：获取样本数据和样本标签；根据所述样本数据和所述样本标签计算初始梯度值；若在树模型中已构建的子树数量小于预设阈值，则对所述初始梯度值进行加噪处理，获得加噪梯度值，并根据所述加噪梯度值构建所述树模型；若在树模型中已构建的子树数量大于或等于预设阈值，则对所述初始梯度值进行同态加密，获得加密梯度值，并根据所述加密梯度值构建所述树模型。2.根据权利要求1所述的方法，其特征在于，所述对所述初始梯度值进行加噪处理，包括：获取Laplace噪声或者差分隐私噪声，并在所述初始梯度值中添加所述Laplace噪声或者所述差分隐私噪声。3.根据权利要求1所述的方法，其特征在于，所述根据所述加噪梯度值构建所述树模型，包括：获取所述加噪梯度值对应的梯度总和；向联邦学习的多个第二参与方设备中的每个参与方设备分别发送所述加噪梯度值和所述加噪梯度值对应的梯度总和，以使所述每个参与方设备根据存储的特征数据、所述加噪梯度值和所述加噪梯度值对应的梯度总和计算出并返回第一分裂信息，所述分裂信息是所述树模型中已构建的子树分裂时所需信息；接收所述多个第二参与方设备发送的多个第一分裂信息；从所述多个第一分裂信息和本地计算出的第二分裂信息筛选出目标分裂信息，所述第二分裂信息是对本地的特征数据、所述加噪梯度值和所述加噪梯度值对应的梯度总和计算获得的；根据所述目标分裂信息对所述树模型进行子树分裂，直至所述树模型满足构建终止条件。4.根据权利要求3所述的方法，其特征在于，所述目标分裂信息包括：分裂值、分裂特征和分裂点；所述从所述多个第一分裂信息和本地计算出的第二分裂信息筛选出目标分裂信息，包括：从所述多个第一分裂信息和所述第二分裂信息的多个分裂值中筛选出最优分裂值；将所述最优分裂值、所述最优分裂值对应的分裂特征和分裂点确定为所述目标分裂信息。5.根据权利要求4所述的方法，其特征在于，所述根据所述目标分裂信息对所述树模型进...

【专利技术属性】
技术研发人员：蔡晓娟，陈立峰，李腾飞，邢旭，卞阳，
申请(专利权)人：上海富数科技有限公司广州分公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人