联邦学习模型的训练方法、装置、电子设备及存储介质制造方法及图纸

技术编号:41622779 阅读:14 留言:0更新日期:2024-06-13 02:23
本申请提供一种联邦学习模型的训练方法、装置、电子设备及存储介质,联邦学习模型的训练方法包括:获取训练终端内训练数据的隐私信息量;根据隐私信息量确定噪声量,噪声量与隐私信息量呈正相关;按照噪声量为训练终端内的训练数据添加噪声,得到噪声数据;基于噪声数据进行训练,得到联邦学习模型。根据每个训练终端内自身训练数据的隐私信息量,为训练数据添加相应量的噪声,确保各训练终端的隐私得到有效保护,还能够提高联邦学习模型的训练效率和准确性。

【技术实现步骤摘要】

本申请涉及信息安全,尤其涉及一种联邦学习模型的训练方法、装置、电子设备及存储介质


技术介绍

1、所谓联邦学习模型,是在多个训练终端与聚合服务器之间训练出的一种模型。当需要训练模型时,聚合服务器将初始模型的参数发送至各个训练终端。每个训练终端使用其自身的数据和参数进行模型训练,得到候选模型,并将候选模型的参数发送至聚合服务器。聚合服务器基于初始模型以及各个训练终端发送的参数生成中间模型,进而再将中间模型的参数发送至各个训练终端,开始下一轮的模型训练。直到所有轮训练完成,得到目标模型。

2、各个训练终端将其训练后的模型参数发送至聚合服务器的过程中,如果模型参数被第三方获取,第三方通过对模型参数进行反推,就能够获得训练终端自身的数据,进而降低训练终端内的数据安全。为了解决这一问题,目前,是为各个训练终端添加用于隐私保护的噪声。即,在训练终端内,当使用自身数据进行模型训练时,先为自身数据添加噪声,得到噪声数据,再使用噪声数据对模型进行训练。

3、但是,对于不同的训练终端,有的训练终端其自身数据的隐私性较高,而有的训练终端其自身数据的隐私性本文档来自技高网...

【技术保护点】

1.一种联邦学习模型的训练方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述训练数据的数量为多个,每个训练数据中包括多个属性,每个属性用于描述相应的训练数据;所述获取训练终端内训练数据的隐私信息量,包括:

3.根据权利要求2所述的方法,其特征在于,所述获取训练终端内所有训练数据的隐私矩阵,包括:

4.根据权利要求2所述的方法,其特征在于,所述获取训练终端内每个属性的隐私权重,包括:

5.根据权利要求2所述的方法,其特征在于,在基于所述隐私向量中各元素的值,确定训练终端内相应训练数据的隐私信息量之前,所述方法还包...

【技术特征摘要】

1.一种联邦学习模型的训练方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述训练数据的数量为多个,每个训练数据中包括多个属性,每个属性用于描述相应的训练数据;所述获取训练终端内训练数据的隐私信息量,包括:

3.根据权利要求2所述的方法,其特征在于,所述获取训练终端内所有训练数据的隐私矩阵,包括:

4.根据权利要求2所述的方法,其特征在于,所述获取训练终端内每个属性的隐私权重,包括:

5.根据权利要求2所述的方法,其特征在于,在基于所述隐私向量中各元素的值,确定训练终端内相应训练数据的隐私信息量之前,所述方法还包括:

6.根据权利要求1至5中任一项所述的方法,其特征在于,所述方法应用于多个训练终端,每个训练终端内训练数据的数量为多个;所述根据所述隐私信息量确定噪声量,包括:

7....

【专利技术属性】
技术研发人员:贺小川荀智德左金鑫张龙姜洪溥
申请(专利权)人:奇安信网神信息技术北京股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1