一种联邦学习中数据操纵攻击的安全防御方法技术

技术编号：25042649 阅读：30 留言：0更新日期：2020-07-29 05:33

本发明专利技术公开一种联邦学习中数据操纵攻击的安全防御方法，包括以下几个步骤：步骤1，中心服务器接收用户上传的本地模型参数，计算每个用户上传的本轮本地模型参数的相似程度及每个用户对应的融合系数；所述本地模型参数为用户采用私有训练数据训练一轮后的本地模型参数；步骤2，中心服务器接收到本地用户一个周期的本地模型参数后，根据融合系数计算每个用户的本地模型参数的加权平均值得到全局模型参数，所述一个周期为预设的本地模型参数更新轮数；步骤3，将全局模型参数下发至对应的用户，用户收到全局模型参数后更新本地模型参数。

全部详细技术资料下载

【技术实现步骤摘要】
一种联邦学习中数据操纵攻击的安全防御方法
本专利技术涉及一种联邦学习的安全训练框架实现方法，更具体的说是涉及一种防御联邦学习中数据操纵攻击的安全训练框架的实现方法。
技术介绍
联邦学习是一种新兴的深度学习框架。在传统的集中式深度学习中，中心服务器需要收集大量的用户数据用于训练神经网络模型(简称模型)，但是由于数据传输的网络通信开销较大、用户数据归属权以及用户数据隐私性等问题，用于进行深度学习的用户数据往往难以获取。而联邦学习采取了另一种训练神经网络模型的方式：在一轮训练中，每一个用户利用其私有数据训练本地模型，然后将本地模型的参数上传至中心服务器，由中心服务器将所有用户的参数进行融合生成全局模型的参数，再将全局模型的参数下发至用户，用户根据全局模型参数对本地模型进行更新，如此循环若干轮训练直至全局模型收敛，训练结束。基于这种技术，联邦学习能够在用户的私有训练数据不离开本地的前提下实现多个用户共同进行深度学习，完成指定的学习任务，如：图像分类、文本预测等，解决了传统的集中式深度学习中用户数据难以获取的问题。但是，在联邦学习中也存在着一些安全隐患。由于参与联邦学习的用户并非全都是正常用户，一些恶意用户能够通过发动数据操纵攻击威胁到用户数据隐私以及影响神经网络模型的训练结果，对参与联邦学习的正常用户的数据安全性和模型可用性造成巨大的危害。数据操纵攻击是指恶意用户通过训练恶意的神经网络模型对上传至中心服务器的本地模型参数进行伪造、篡改而实现的一种攻击方式。其中，生成式对抗网络攻击和模型投毒攻击是两种代表性的数据操纵攻...

【技术保护点】
1.一种联邦学习中数据操纵攻击的安全防御方法，其特征在于，包括以下几个步骤：/n步骤1，中心服务器接收用户上传的本地模型参数，计算每个用户上传的本轮本地模型参数的相似程度及每个用户对应的融合系数；所述本地模型参数为用户采用私有训练数据训练一轮后的本地模型参数；/n步骤2，中心服务器接收到本地用户一个训练周期的本地模型参数后，根据融合系数计算每个用户的本地模型参数的加权平均值得到全局模型参数，所述一个训练周期为预设的本地模型参数更新轮数；/n步骤3，将全局模型参数下发至对应的用户，用户收到全局模型参数后更新本地模型参数。/n

【技术特征摘要】
1.一种联邦学习中数据操纵攻击的安全防御方法，其特征在于，包括以下几个步骤：
步骤1，中心服务器接收用户上传的本地模型参数，计算每个用户上传的本轮本地模型参数的相似程度及每个用户对应的融合系数；所述本地模型参数为用户采用私有训练数据训练一轮后的本地模型参数；
步骤2，中心服务器接收到本地用户一个训练周期的本地模型参数后，根据融合系数计算每个用户的本地模型参数的加权平均值得到全局模型参数，所述一个训练周期为预设的本地模型参数更新轮数；
步骤3，将全局模型参数下发至对应的用户，用户收到全局模型参数后更新本地模型参数。

2.根据权利要求1所述的联邦学习中数据操纵攻击的安全防御方法，其特征在于：所述步骤1中，中心服务器接收用户i上传的本地模型参数所述本地模型参数为用户i利用私有训练数据进行第t轮训练后的本地模型参数。

3.根据权利要求1所述的联邦学习中数据操纵攻击的安全防御方法，其特征在于，所述步骤1具体包括：
步骤101，接收所述正常用户和恶意用户上传的本地模型参数(i＝1,2,…,n)；
步骤102，选择每一个用户本地模型参数中绝对值较大的参数的索引计算索引的并集然后选择索引st对应每一个用户部分本地模型参数
步骤103，计算步骤102所得的所有用户的部分本地模型参数的中位数
步骤104，计算每一个用户的部分本地模型参数与步骤103计算的中位数对应的相似度
步骤105，利用均值漂移算法计算步骤104所得的相似度的中心点
步骤106，计算步骤104所得的每个用户对应的相似度与步骤105所得的中心点之间的聚集度
步骤107,利用步骤106所得的聚集度计算融合系数

4.根据权利要求3所述的联邦学习中数据操纵攻击的安全防御方法，其特征在于，所述步骤2和步骤3分别为：
步骤2，判断t是否为τ的倍数，若是，转到步骤3；否则，转到步骤1；所述t为用户实际训练轮数，τ为一个训练周期内包含的本地...

【专利技术属性】
技术研发人员：毛云龙，袁新雨，赵心阳，仲盛，
申请(专利权)人：南京大学，
类型：发明
国别省市：江苏;32

全部详细技术资料下载我是这个专利的主人