一种联邦学习数据保护方法技术

技术编号:37160815 阅读:23 留言:0更新日期:2023-04-06 22:25
本发明专利技术公开了一种联邦学习数据保护方法,所述方法包括用户在本地客户端使用深度神经网络将待保护数据训练成客户端模型;对所述模型的参数执行多密钥同态加密得到加密后的密文,并将所述密文上传中央服务器;中央服务器对所述密文进行基于证据理论的非线性多源密文信息聚合;将聚合计算结果返回到所述用户。本发明专利技术能够在不共享客户端真实隐私数据的前提下,实现数据的高效利用与机器模型的共同训练。练。练。

【技术实现步骤摘要】
一种联邦学习数据保护方法


[0001]本专利技术属于信息安全
,尤其涉及一种联邦学习数据保护方法。

技术介绍

[0002]现阶段国内外人工智能的重心仍在于利用以人工智能为代表的新一代信息技术解决各领域功能、应用、服务的数字化和智能化,还未充分考虑隐私数据安全利用与共享。为解决数据孤岛问题,同时保护数据隐私,研究者提出了联邦学习。联邦学习允许多个参与者在不共享数据的情况下构建一个通用的、健壮的机器学习模型,从而解决数据被集中所带来的隐私泄露问题,已成为目前应用最广泛的隐私数据保护方案。
[0003]现有的联邦学习研究大多采用单密钥同态加密方案,即各客户端共享同一密钥对,当某一客户端主动截取其它客户端发送的加密数据时,可直接利用自身密钥解密,导致被截获客户端的模型及本地隐私数据泄露。当前也有少部分基于多密钥的联邦学习方案,但仍然存在密文结构复杂导致密文规模随参与方数量增多呈指数级增长,且参与方数量需要提前设定,无法满足灵活的多跳需求的问题。已有联邦学习方案若客户端被敌手攻击,可能会故意发送错误的数据信息给中央服务器,诱导中央服务器聚合本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种联邦学习数据保护方法,其特征在于,所述方法包括:用户在本地客户端使用深度神经网络将待保护数据训练成客户端模型;对所述模型的参数执行多密钥同态加密得到加密后的密文,并将所述密文上传中央服务器;中央服务器对所述密文进行基于证据理论的非线性多源密文信息聚合;将聚合计算结果返回到所述用户。2.如权利要求1所述的联邦学习数据保护方法,其特征在于,所述深度神经网络包括卷积神经网络,所述模型的参数包括模型的梯度参数,所述将待保护数据训练成客户端模型具体包括:对卷积神经网络进行梯度参数的初始化;将待保护数据输入经过卷积层、下采样层、全连接层的前向传播得到输出值;计算所述输出值与目标值之间的误差,当误差等于或小于期望值时结束训练,当误差大于期望值时,根据误差计算下一步的更新梯度。3.如权利要求2所述的联邦学习数据保护方法,其特征在于,所述对所述模型的参数执行多密钥同态加密得到加密后的密文具体包括:用户使用自己的带错误学习私钥调用多密钥同态加密算法中的加密函数对所述梯度参数进行加密。4.如权利要求3所述的联邦学习数据保护方法,其特征在于,所述带错误学习私钥的生成方法具体包括:根据用户选定的安全参数,调用带错误学习算法和环上容错学习算法的参数设置函数生成公共参数;用户分别独立调用带错误学习算法和环上容错学习算法的密钥生成函数生成带错误学习私钥、环上容错学习私钥和公开的密钥三元组,所述密钥三元组包括公钥、自举密钥和转换密钥。5.如权利要求4所述的联邦学习...

【专利技术属性】
技术研发人员:田波孟金桃赵越桑佩瑶向宏桑军夏晓峰胡希付皓玥
申请(专利权)人:中国电子科技集团公司第三十研究所
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1