【技术实现步骤摘要】
一种基于能够验证的可信服务器的联邦学习系统及方法
[0001]本申请涉及属于数据安全保护领域,尤其涉及一种基于能够验证的可信服务器的联邦学习系统及方法。
技术介绍
[0002]现有技术中,联邦学习是一种分布式机器学习的框架,联邦学习的一个主要应用方向就是能够实现多个客户端在一个可信服务器的协调下,协作解决机器学习的问题,可信服务器通常由一个知名组织来操作,如医疗辅助诊断场景下,中心化服务器可由卫健委来进行操作;为了保证客户端隐私,客户端的用户数据是不离开本地存储设备的,客户端在本地进行训练后,将模型参数或梯度发送给可信服务器,这样能帮助多个参与者联合进行机器学习建模。
[0003]而随着大数据的进一步发展,用户信息等隐私泄露事件频发,数据隐私和安全已经成为世界性的趋势。已有一些研究表明,虽然联邦学习可以保障用户的原始数据不离开本地,但攻击者可以截获用户上传的梯度或模型参数,这样就导致原始的训练数据泄露等安全问题。而目前联邦学习系统想要解决这方面的问题,通常采用通过在本地客户端和服务器中同时加入噪声,同步进行差分隐私的 ...
【技术保护点】
【技术特征摘要】
1.一种基于能够验证的可信服务器的联邦学习系统,包括可信服务器以及参与训练的客户端;其中,所述可信服务器包括初始化模块、安全聚合模块、差分隐私模块以及生成证明模块;所述初始化模块用于获得初始的模型和模型参数,将所述初始的模型和模型参数发送到参与训练的客户端;所述安全聚合模块用于将参与训练的客户端发送到可信服务器的本地模型参数进行安全聚合,得到聚合后的模型参数;所述差分隐私模块用于聚合后的模型参数上根据隐私预算添加噪声,得到差分隐私后的模型参数,同时更新模型,将更新的模型和模型参数发送到参与训练的客户端;所述生成证明模块用于生成可验证证明,将可验证证明发送到客户端;所述客户端包括本地训练模块和验证模块;所述本地训练模块用于对客户端收到初始的或者更新的模型和模型参数在本地进行训练和优化,将得到的优化模型参数发送到可信服务器;所述验证模块用于对服务器发来的可验证证明进行验证,当验证成功时,本地训练模块进行训练,当验证不成功时,停止训练。2.一种使用如权利要求1所述的基于能够验证的可信服务器的联邦学习系统的方法,步骤包括:S10,所述可信服务器获得初始化的模型以及模型参数,将所述初始化的模型以及模型参数发送至参与训练的客户端;S20,所述参与训练的客户端将收到的模型和模型参数在本地进行训练,生成本地模型参数,对所述本地模型参数进行优化,得到优化模型参数;所述参与训练的客户端将所述优化模型参数以及用于验证的本地生成元参数发送至所述可信服务器;其中,所述本地生成元参数为公开的有限循环群G的生成元;S30,所述可信服务器对所述优化模型参数进行安全聚合,得到聚合后的模型参数;可信服务器根据预先设定的隐私预算,在聚合后的模型参数上添加相应的噪声,得到差分隐私后的模型参数,并对模型进行更新;S40,所述可信服务器通过zk
‑
snark协议,使用所述参与训练的客户端发来的本地生成元参数,计算生成可验证证明;S50,将更新后的模型和模型参数以及所述可验证证明发送至下一轮参加训练的客户端;S60,下一轮参加训练的客户端对所述服务器发来的可验证证明进行验证,若验证通过,则转入步骤S20,若验证不通过,则退出训练。3.如权利要求2所述的基于能够验证的可信服务器的联邦学习系统的方法,其中,在步骤S20中,对所述本地模型参数进行优化时采用剪枝操作,设本地模型参数为经过剪...
【专利技术属性】
技术研发人员:于婧悦,
申请(专利权)人:北京启明星辰信息安全技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。