一种基于SM9算法的隐私保护的联邦学习方法技术

技术编号:35861037 阅读:40 留言:0更新日期:2022-12-07 10:50
本发明专利技术涉及网络安全和联邦学习技术领域,公开了一种基于SM9算法的隐私保护的联邦学习方法,包括:在联邦学习架构中构建评估服务器,构建后的联邦学习架构中含有三个实体对象,分别为训练参与者,中心服务器以及评估服务器;将训练参与者发送的模型数据进行评估验证,剔除掉恶意参与者的毒化数据,并将SM9标识密码算法嵌入联邦学习的框架之中;训练参与者针对指定组的评估服务器ID进行模型加密,并将签名后的加密数据连同签名一起发送给中心服务器,中心服务器将通过签名验证的加密模型数据分发给对应组中的评估服务器;评估服务器在不知道数据来源的前提下对数据进行解密并评估。本发明专利技术用于解决联邦学习过程中可能存在的推理攻击与毒化攻击。攻击与毒化攻击。攻击与毒化攻击。

【技术实现步骤摘要】
一种基于SM9算法的隐私保护的联邦学习方法


[0001]本专利技术涉及网络安全和联邦学习
,具体地说,是一种基于SM9算法的隐私保护的联邦学习方法,用于解决联邦学习过程中可能存在的推理攻击与毒化攻击。

技术介绍

[0002]2017年McMahan在《Communication

efficient learning of deep networks from decentralized data》中首次提出联邦学习的概念。紧接着人们发现可以利用模型梯度数据重建模型,从而导致训练参与者隐私数据泄露。因此,众多利用安全聚合,同态加密,差分隐私等各种安全机制的训练参与者数据保护方案被提出并发表。以google FL研究团队于2017年发表的《Practical Secure Aggregation for Privacy

Preserving Machine Learning》论文为例,该文章提出了一种安全聚合加密方案(SMPC),服务器只能看到聚合完成之后的梯度,不能知道每个训练参与者的私有的真实梯度值。这种方法适用于大规模终端(例如手机)通过一个服务器,共同计算各自输入之和的情形,但是前提是不泄露某个特定的终端的输入,无论是对服务器还是对其他的终端。但大多数方案都仅针对梯度数据进行隐私保护,并不具备抗毒化攻击的能力。为满足核心技术自主创新、信息安全自主可控的要求,我国自主设计了包括密钥交换协议、数字签名算法、密钥封装机制和公钥加密算法的SM9标识系列密码。SM9的加密强度等同于3072位密钥的RSA加密算法。
[0003]目前联邦学习过程中可能存在的推理攻击与毒化攻击,但并无相应的技术对其进行解决,因此,本专利技术基于传统联邦学习,尝试将SM9标识密码算法嵌入联邦学习的框架之中,保证了在没有可信第三方的情况下,训练参与者的模型梯度数据隐私不被泄露。

技术实现思路

[0004]本专利技术的目的在于提供一种基于SM9算法的隐私保护的联邦学习方法,在可评估的联邦学习的框架中引入了SM9的加解密算法和签名签验算法实现了隐私保护,并且通过构建一个三方参与的联邦学习架构实现了抵御来自恶意训练参与者的毒化攻击。
[0005]本专利技术通过下述技术方案实现:一种基于SM9算法的隐私保护的联邦学习方法,包括以下步骤:
[0006]步骤S1,在联邦学习架构中构建评估服务器,构建后的联邦学习架构中含有三个实体对象,分别为训练参与者,中心服务器以及评估服务器;
[0007]步骤S2,将训练参与者发送的模型数据进行评估验证,剔除掉恶意参与者的毒化数据,并将SM9标识密码算法嵌入联邦学习的框架之中;训练参与者针对指定组的评估服务器ID进行模型加密,并将签名后的加密数据连同签名一起发送给中心服务器,中心服务器将通过签名验证的加密模型数据分发给对应组中的评估服务器;
[0008]步骤S3,评估服务器在不知道数据来源的前提下对数据进行解密并评估。
[0009]本专利技术针对联邦学习过程中可能存在的推理攻击与毒化攻击,提供了一种高效安全的基于SM9算法的隐私保护的联邦学习方案。该方案在保护隐私的同时可以实现抗毒化
攻击。
[0010]为了达到上述专利技术目的,本专利技术采用以下技术方案实现:通过在联邦学习架构中增添评估服务器,将训练参与者发送的模型数据进行评估验证,剔除掉恶意参与者的毒化数据。并在其中结合SM9加密与签名算法保证整个联邦学习通信过程中的用户隐私的安全。训练参与者将自己训练好的模型M加密,并对模型进行签名,中心服务器通过签名验证算法确认训练参与者的身份合理性,然后将模型信息发送给评估服务器解密,评估服务器解密模型数据后对数据进行评估,将达到标准的模型数据聚合后返还给中心服务器。
[0011]与先用技术相比,本专利技术的有益效果是技巧性的将国密算法与可评估的联邦学习框架相结合,不仅节省了计算和通信成本,同时提供了针对推理攻击和毒化攻击充分的安全保障,具有机密性,不可否认性,抗毒化攻击和可扩展等性质。
[0012]为了更好地实现本专利技术,进一步地,所述步骤S1包括:
[0013]允许训练参与者针对特定某组的评估服务器公钥加密模型梯度数据,评估服务器获取加密梯度数据并利用自己的组私钥进行解密,以此对梯度数据进行评估从而剔除毒化数据,并且评估服务器不与训练参与者合谋;
[0014]训练参与者在加密模型数据时生成掩码,并通过加密掩码与模型数据的加和实现对模型梯度数据的加密;
[0015]训练参与者在上传更新的加密模型数据时需要对数据进行签名,中心服务器收到签名后对数据进行验证,通过验证后确认该参与者是合法参与者;
[0016]在一轮联邦学习结束时,只有合法参与者可以收到该轮的全局聚合模型,并参与下一轮的联邦学习。
[0017]为了更好地实现本专利技术,进一步地,所述步骤S2包括:
[0018]步骤S21,建立本地系统,本地系统生成必要的参数,使用加密密钥生成算法和签名密钥生成算法生成密钥并完成机器学习模型的参数初始化;
[0019]步骤S22,获取子模型,训练参与者将子模型发送给中心服务器,并由中心服务器分发给评估服务器的过程中剔除不合法训练参与者,;
[0020]步骤S23,评估服务器合法训练参与者模型进行评估计算权重;
[0021]步骤S24,加权聚合,完成联邦学习的一轮迭代。
[0022]为了更好地实现本专利技术,进一步地,所述步骤S21包括:
[0023]中心服务器在本地生成系统参数,密钥生成中心生成训练参与者ID以及评估服务器的组ID,训练参与者调用签名密钥生成算法SKG生成自己的签名私钥,训练参与者以及评估服务器调用加密密钥生成算法EKG生成各自的加密私钥;
[0024]中心服务器将机器学习模型初始化参数;
[0025]将机器学习模型参数信息发送给每个训练参与者与评估服务器,所述机器学习模型参数信息包括机器学习模型的学习率和本地系统的迭代次数。
[0026]为了更好地实现本专利技术,进一步地,所述步骤S22包括:
[0027]训练参与者利用本地数据对全局模型进行训练得到子模型,训练参与者将子模型发送给中心服务器,并由中心服务器分发给评估服务器;
[0028]使用SM9的加密算法在训练参与者端对训练后的本地模型数据进行隐私化处理来抵御联邦学习过程中的推理攻击;
[0029]在训练参与者发送信息的过程中添加SM9的签名与签名验证算法,训练参与者调用签名算法对发送至中心服务器的数据进行签名,中心服务器收到签名调用签名验证算法对训练参与者身份进行验证,从而剔除不合法训练参与者。
[0030]为了更好地实现本专利技术,进一步地,所述步骤S23包括:
[0031]通过评估服务器合法训练参与者模型进行评估,生成相应权重,通过加权聚合剔除毒化数据;
[0032]中心服务器在保证负载均衡的前提下为每个模型在组内随机分配评估服务器。
本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于SM9算法的隐私保护的联邦学习方法,其特征在于,包括以下步骤:步骤S1,在联邦学习架构中构建评估服务器,构建后的联邦学习架构中含有三个实体对象,分别为训练参与者,中心服务器以及评估服务器;步骤S2,将训练参与者发送的模型数据进行评估验证,剔除掉恶意参与者的毒化数据,并将SM9标识密码算法嵌入联邦学习的框架之中;训练参与者针对指定组的评估服务器ID进行模型加密,并将签名后的加密数据连同签名一起发送给中心服务器,中心服务器将通过签名验证的加密模型数据分发给对应组中的评估服务器;步骤S3,评估服务器在不知道数据来源的前提下对数据进行解密并评估。2.根据权利要求1所述的一种基于SM9算法的隐私保护的联邦学习方法,其特征在于,所述步骤S1包括:允许训练参与者针对特定某组的评估服务器公钥加密模型梯度数据,评估服务器获取加密梯度数据并利用自己的组私钥进行解密,以此对梯度数据进行评估从而剔除毒化数据,并且评估服务器不与训练参与者合谋;训练参与者在加密模型数据时生成掩码,并通过加密掩码与模型数据的加和实现对模型梯度数据的加密;训练参与者在上传更新的加密模型数据时需要对数据进行签名,中心服务器收到签名后对数据进行验证,通过验证后确认该参与者是合法参与者;在一轮联邦学习结束时,只有合法参与者可以收到该轮的全局聚合模型,并参与下一轮的联邦学习。3.根据权利要求2所述的一种基于SM9算法的隐私保护的联邦学习方法,其特征在于,所述步骤S2包括:步骤S21,建立本地系统,本地系统生成必要的参数,使用加密密钥生成算法和签名密钥生成算法生成密钥并完成机器学习模型的参数初始化;步骤S22,获取子模型,训练参与者将子模型发送给中心服务器,并由中心服务器分发给评估服务器的过程中剔除不合法训练参与者,;步骤S23,评估服务器合法训练参与者模型进行评估计算权重;步骤S24,加权聚合,完成联邦学习的一轮迭代。4.根据权利要求3所述的一种基于SM...

【专利技术属性】
技术研发人员:曹潆方熊虎张敏姜毅刘韬
申请(专利权)人:成都安恒信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1