一种在隐私保护下的去中心化联邦机器学习方法技术

技术编号：25446116 阅读：253 留言：0更新日期：2020-08-28 22:32

本发明专利技术公开了一种在隐私保护下的去中心化联邦学习方法，包括系统初始化步骤，请求模型与本地并行训练步骤，模型参数加密与模型发送步骤，模型接收与恢复步骤，系统更新步骤。通过使用随机选取参与者作为参数聚合者的策略实现去中心化，解决了现有联邦学习易受DoS攻击、参数服务器单点故障等缺点；结合PVSS可验证秘密分发协议保护参与者模型参数免受模型反演攻击、数据成员推理攻击。同时保证了在每一次训练任务由不同的参与者来进行参数聚合，当出现不信任的聚合者或者其遭受攻击时，可自行恢复正常，增加了联邦学习的鲁棒性；本发明专利技术在实现以上功能的同时，保证了联邦学习的性能，有效地改善了联邦学习的安全训练环境，具有广泛地应用前景。

全部详细技术资料下载

【技术实现步骤摘要】
一种在隐私保护下的去中心化联邦机器学习方法
本专利技术属于机器学习与信息安全交叉领域，特别是涉及一种在隐私保护下的中心化的联邦学习方法。
技术介绍
机器学习技术在诸如人脸、语音识别，还有自然语言处理等人工智能应用场景中取得了非凡的成就，但是，如何保证机器学习在安全的环境下运作仍是一个待解决的问题。机器学习的实质就是用大量的数据对算法模型进行训练，从其中得到一个能够对新的输入数据进行准确预测的算法模型(以下简称模型)。机器学习所用的数据集包含用户大量的隐私数据，如个人图片、医保记录、输入法记录等等。然而，进行机器学习需要强大的算力支持，个人计算机算力的局限性导致了人们不得不将自己的数据集上传到诸如BigML,AmazonMachineLearning，MicrosoftAzureMachineLearning等中心化的云计算平台进行训练，但是这些由第三方控制的云计算平台极易泄露用户的数据和已经训练好的模型。为了保护用户的信息以免泄露，Google公司学者提出联邦学习(Federatedlearning,FL)。谷歌输入法(Gboard)是一个利用联邦学习的具体应用。Gboard对用户的键盘输入词条记录进行训练，得到训练参数后上传到中心化的参数服务器。参数服务器进行聚合，最后，用户获取最新的模型并使用。此过程服务器不需要收集用户的输入词条记录，只需要进行参数交换即可。但是即便如此，联邦学习过程还是需要在安全的通讯通道中进行，并且，使用安全多方计算(MPC)的形式实现参数服务器配置代价非常昂贵。另外，联邦学习实质上...

【技术保护点】
1.一种在隐私保护下的去中心化联邦学习方法，其特征在于，该方法包括系统初始化步骤，请求模型与本地并行训练步骤，模型参数加密与模型发送步骤，模型接收与恢复步骤，系统更新步骤，其中：/n(1)系统初始化步骤：/n(1.1)联邦学习的参与者P

【技术特征摘要】
1.一种在隐私保护下的去中心化联邦学习方法，其特征在于，该方法包括系统初始化步骤，请求模型与本地并行训练步骤，模型参数加密与模型发送步骤，模型接收与恢复步骤，系统更新步骤，其中：
(1)系统初始化步骤：
(1.1)联邦学习的参与者Pi注册用于加密和解密的密钥对<ski，pki>，所述的密钥对中ski为其私钥，由参与者Pi从一个模q的环中选择获得，q是素数，由基于q的运算生成；pki为其公钥，h是素数，q阶环的生成元。所述参与者相互交换其公钥用于加密信息，而其私钥用于解密信息；参与者们承认系统指定的初始随机值R1，R1将用于选举参数聚合者；
(1.2)参与者运行PVSS协议，每个参与者Pi在中选择一个初始秘密值并做出承诺Com(sli)，将秘密值sli按照总参与者数量n切分成n个秘密分片。然后用其他参与者的公钥分别对秘密分片进行加密，并相应分发。在此步骤中，每个参与者都收到了其他参与者发来的已加密的n-1个分片；其中，PVSS协议中，设置不诚实的参与者最多有f个，总参与者数量n＝3f+1，PVSS协议的阈值为f+1。
(1.3)判断参与者是否诚实。每个参与者在收集了其他参与者分发的秘密分片后，利用PVSS协议的验证功能对加密的正确性进行检验。如果某个分片没有被正确加密，HydRand共识机制则向外界发出此分片不合法、加密者不诚实。该加密者将被HydRand共识机制禁止在f+1轮内被选为聚合者；
(1.4)HydRand共识机制根据初始随机值R0选举出第一位参数聚合者l0，若聚合者在规定的时间内未执行相应步骤则被视为不诚实，系统将发出重构指令，重置系统参数，重新选举参数聚合者。
(2)参与者请求模型与本地并行训练步骤:用于从参数聚合者处获取模型，参与者在其本地设备利用其敏感数据输入模型并训练可得到该参与者的模型参数。
(3)模型参数加密与模型发送步骤：用于加密所述子步骤(2)中产生的本地模型参数Wfi，完成加密后发送给参数聚合者。具体包括下述子步骤：
(3.1)每个参与者利用其秘密值sli生成一个秘密
(3.2)参与者Pi利用生成的秘密对其本地最终模型参数Wfi进行加密生成密文
(3.3)各参与者向步骤(1.4)所选举出来的参数聚合者直接发送(3.2)中的
(4)模型接收与恢复步骤：参数聚合者接受其他参与者的加密模型，发出恢复模型指令，具体子步骤如下：
(4...

【专利技术属性】
技术研发人员：陈泯融，陈锦华，曾国强，翁健，翁嘉思，初萍，
申请(专利权)人：华南师范大学，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人