一种联邦学习的数据处理方法、装置、设备、介质及产品制造方法及图纸

技术编号:42814843 阅读:23 留言:0更新日期:2024-09-24 20:55
本申请提供一种联邦学习的数据处理方法、装置、设备、介质及产品。该方法包括:确定目标参与方的本地数据对应的本地类别分布;将所述本地类别分布发送至服务器,以供所述服务器根据各个参与方的本地类别分布,确定全局类别分布,并根据各个参与方的分布相似度和所述全局类别分布,确定各个参与方的贡献度;获取所述服务器发送的目标参与方的贡献度,并根据所述贡献度,对利用本地数据训练得到的本地模型添加噪声,得到加噪后的模型,并将所述加噪后的模型发送给所述服务器,以供所述服务器根据各个参与方发送的加噪后的模型得到聚合模型。

【技术实现步骤摘要】

本申请涉及数据安全领域,尤其涉及一种联邦学习的数据处理方法、装置、设备、介质及产品


技术介绍

1、在智慧医疗、工业互联网、数字城市等现实场景下,通过机器学习可以自动挖掘不同场景的数据中蕴藏的信息。传统的机器学习算法需要将数据集中存储,这在实际应用中面临着隐私泄露的风险,因此,为了解决这一问题,联邦学习应运而生。

2、联邦学习算法以保护隐私数据为前提,以“数据不动模型动”的方式,即通过在中央服务器预训练一个模型,然后将该模型分享给每个参与方,参与方利用自身的数据在本地对该模型进行训练,然后将训练好的模型发送至中央服务器,中央服务器接收所有参与方的模型后,将所有参与方的模型进行聚合,得到一个全局模型,然后再将全局模型分享给每个参与方。联邦学习让原始数据不出本地,只共享加密的模型参数,很好地平衡了数据利用与隐私保护。但是,在参与方将模型发送至中央服务器的过程中,攻击者可能会获取到该模型,并利用生成对抗网络,可以根据该模型的参数间接推断出数据,进而造成隐私泄露。

3、现有技术中,为了保护参与方的隐私,利用基于本地化差分隐私的联邦学习算法对本文档来自技高网...

【技术保护点】

1.一种联邦学习的数据处理方法,其特征在于,应用于多个参与方中的任一目标参与方,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述根据所述贡献度,对利用本地数据训练得到的本地模型添加噪声,包括:

3.根据权利要求2所述的方法,其特征在于,所述根据所述贡献度、所述总贡献度和预设初始噪声规模,得到与所述贡献度成负相关的噪声规模,包括:

4.根据权利要求1至3任一所述的方法,其特征在于,所述目标参与方用于对本地模型执行多个轮次的训练;所述根据所述贡献度,对利用本地数据训练得到的本地模型添加噪声,得到加噪后的模型,并将所述加噪后的模型发送给所述服务...

【技术特征摘要】

1.一种联邦学习的数据处理方法,其特征在于,应用于多个参与方中的任一目标参与方,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述根据所述贡献度,对利用本地数据训练得到的本地模型添加噪声,包括:

3.根据权利要求2所述的方法,其特征在于,所述根据所述贡献度、所述总贡献度和预设初始噪声规模,得到与所述贡献度成负相关的噪声规模,包括:

4.根据权利要求1至3任一所述的方法,其特征在于,所述目标参与方用于对本地模型执行多个轮次的训练;所述根据所述贡献度,对利用本地数据训练得到的本地模型添加噪声,得到加噪后的模型,并将所述加噪后的模型发送给所述服务器,以供所述服务器根据各个参与方发送的加噪后的模型得到聚合模型之前,所述方法还包括:

5.根据权利要求4所述的方法,其特征在于,所述根据所述模型相似度对所述当前本地模型中的参数进行裁剪处理,包括:

6.根据权利要求1所述的方法,其特征在于,所述聚合模型为用于预测类别的模型...

【专利技术属性】
技术研发人员:姜慧孔祥斌林敏张晓东金赛辉
申请(专利权)人:中国联合网络通信集团有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1