基于标签加密发送的企业间联邦学习算法模型训练方法技术

技术编号：37307325 阅读：22 留言：0更新日期：2023-04-21 22:51

本发明专利技术提供了一种基于标签加密发送的企业间联邦学习算法模型训练方法，包括：S1：协调者进行初始化，获取各项训练参数，感知参与方数量，并开始让参与方进行标签ID对齐操作；S2：完成标签对齐后，协调者发起模型训练，各参与方将利用共有的实体数据训练机器学习模型；S3：各参与方对ID对应的标签结果进行预测，协调方根据各参与方的预测结果计算最终预测值。本发明专利技术解决了传统联邦学习算法在不同业态企业间的条件下的通讯过程中责任所有制与效率的问题。的问题。的问题。

全部详细技术资料下载

【技术实现步骤摘要】
基于标签加密发送的企业间联邦学习算法模型训练方法

[0001]本专利技术涉及人工智能
，特别涉及一种基于标签加密发送的企业间联邦学习算法模型训练方法。

技术介绍

[0002]随着隐私的重要性与数据安全的问题受到越来越多的关注，数据隐私和安全问题已成为时下的热点问题，受到了来自各大企业的重点关注。与此同时，人工智能技术与大数据的在公司业务中的应用效果颇具成效，引发了人工智能的时代浪潮。在这两个前提下，联邦学习应运而生。
[0003]在联邦学习中，各方参与者之间可以共享训练数据但对数据内容不可见，可以实现协同训练的效果。在该机制下，由可信协调者控制流程，并负责管理密钥的生成、发放与解密，各个参与方将所持有的数据经过加密后发送至协调者与其他参与方，实现联合训练一个联邦模型，再将这个模型给各个参与方使用。但与此同时，在这个过程中，每个参与方都需要发送自己的数据，若密钥泄露，这个过程中数据泄露的风险需要所有参与方共同承担。此外，如何在保证数据安全的前提下提升各个环节的交互效率，对于提升联邦学习的效率有重要的意义。
[0004]鉴于企业间的数据特征空间重叠度小，但可能共享一个巨大的用户群体，因此采用一种基于用户对齐，扩展特征空间的联邦学习。但在传统的联邦学习体系下，各参与方都需要承担将数据发送至其他参与方中可能会导致数据泄露带来的风险。这种风险一定程度上降低了联邦学习的可操作性，阻碍了企业间建立良好的数据共享环境。
[0005]在目前传统联邦学习中，交互过程中需要每一轮都发送中间结果，并利用中间结果...

【技术保护点】

【技术特征摘要】
1.一种基于标签加密发送的企业间联邦学习算法模型训练方法，其特征在于，包括：S1：协调者进行初始化，获取各项训练参数，感知参与方数量，并开始让参与方进行标签ID对齐操作；S2：完成标签对齐后，协调者发起模型训练，各参与方将利用共有的实体数据训练机器学习模型；S3：各参与方对ID对应的标签结果进行预测，协调方根据各参与方的预测结果计算最终预测值。2.根据权利要求1所述的企业间联邦学习算法模型训练方法，其特征在于，步骤S1中，所述训练参数包括训练目标以、训练轮数以及正则化参数。3.根据权利要求1所述的企业间联邦学习算法模型训练方法，其特征在于，步骤S1中，样本ID对齐方式采用RSA密钥与哈希函数进行的加密样本对齐。4.根据权利要求1所述的企业间联邦学习算法模型训练方法，其特征在于，步骤S2中，各参与方在训练过程中均采用同一种机器学习模型算法进行模型训练。5.根据权利要求3所述的企业间联邦学习算法模型训练方法，其特征在于，步骤S1，具体过程如下：S101：协调者获取各项训练参数，感知参与方数量，并发送标签对齐消息至各参与方；S102：持有标签方生成RSA密钥对，包括公钥(e，n)与私钥(d，n)，并利用私钥计算自身样本ID的最终签名；S103：发送公钥(e，n)至无标签参与方，并将私钥存储在本地；S104：对每一个样本生成一个与n互质且不为1的随机数，利用公钥对ID进行加密，并乘以随机数进行加盲扰动，加密后的数据作为第一数据；S105：无标签参与方发送第一数据至持有标签发送方；S106：利用私钥进行对第一数据进行签名的初步计算，将该数据与自身的最终签名作为第二数据；S107：持有标签方将第二数据发送至无标签参与方；S108：对第二数据进行去盲计算，并计算得到最终签名，将双方的最终签名进行取交集运算，得到对齐ID集合；S109：无标签方将对齐ID集合发送给持有标签方，持有标签方保存对齐ID集合，并发送样本对齐完成信号至协调者；S110：协调者接收到样本对齐完成信号后，...

【专利技术属性】
技术研发人员：刘淼，苏生，唐永清，黄伟程，段志国，黄晨晗，李精书，赵飞，刘秋霞，田园，田野，
申请(专利权)人：泸州老窖集团有限责任公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人