车联网中基于MePC-F模型的实时强化联邦学习数据隐私安全方法技术

技术编号:35512508 阅读:36 留言:0更新日期:2022-11-09 14:27
本发明专利技术公开了一种车联网中基于MePC

【技术实现步骤摘要】
车联网中基于MePC

F模型的实时强化联邦学习数据隐私安全方法


[0001]本专利技术涉及联网车辆用户协同处理实时安全行为分析
,尤其涉及一种车联网中基于MePC

F模型的实时强化联邦学习数据隐私安全方法。

技术介绍

[0002]随着车联网支持各种实时通信和服务的发展,通过车载单元等互联设备生成的数据量空前巨大,面向车辆用户的大量异构性数据和设备计算能力的差异性,联邦学习为满足网络模型实时训练过程中数据安全保护要求提供了一种有效的解决方案,它可以让不同的边缘设备在不暴露原始数据的情况下协同训练机器学习模型。
[0003]边缘计算海量数据与用户个人隐私联合紧密,例如,用户的轨迹、信用卡、账单等数据,切实关系到用户隐私安全,如发生数据泄露,将给用户带来重大安全隐患。联邦学习可以在一定程度上保护数据,但依旧存在信息泄露的风险,主要有四种类型:1)成员泄露,2)非预期特征泄露,3)代表原始数据泄露的类,4)原始数据泄露。最后一种类型的数据泄漏对于隐私敏感的参与者来说是最不可接受的。
[0004]为了保护移动用户的数据隐私性,解决上述原始数据泄露问题,研究者们在基于密码学的数据安全保护进行了大量的研究:差分隐私、同态加密、多方安全计算。差分隐私通常使用三种噪声添加机制:分别为拉普拉斯机制、高斯机制和指数机制。通过添加噪声来干扰上下文信息,以保护数据的隐私,但如果噪声增加过多则会影响模型训练的性能。同态加密中常用的是加法和乘法同态加密:研究表明,使用Paillier加法同态加密计算时,噪声会增加一倍,而使用El Gamal乘法同态加密计算时,噪声呈二次增长。为了增加数据的可用性并克服噪声问题,研究者引入bootstrapping,通过设定阈值进行加密解密降低噪声,从而允许该方案计算无限次的操作。还可以进行批处理,或者进行并行同态计算或删除对的压缩来解决噪声问题。安全多方计算是指在无可信第三方的条件下多方参与者安全地计算一个约定函数的问题,主要目的是在计算过程中必须保证各方私密输入独立,计算时不泄露任何本地数据。有研究证明使用安全多方计算可以解决联邦学习中的梯度泄露问题,并证明只需对第一隐藏层进行信息交换就可在保证精确度的同时进行数据安全保护。但它的信息交互的过程是P2P的,所以会出现通信开销大的问题。
[0005]大部分基于密码学的数据安全保护研究都是集中式解决方法,为了在数据安全保护的同时解决时间开销问题:联邦学习可以让边缘设备在不暴露原始数据的情况下协同训练机器学习模型。联邦学习通常采用参数服务器架构,其中客户端由参数服务器同步局部模型训练。通常使用同步方法实现,即中央服务器将全局模型同步发送给多个客户机,多个客户机基于本地数据训练模型后同步将更新后的模型返回中央服务器。这可能会因为掉队而变得缓慢。由于计算能力和电池时间有限,可用性和完成时间因设备而异,因此全局同步非常困难,尤其是在联合学习场景中。有人提出了一种新的联合优化异步算法来解决正则化局部问题以保证收敛,使得多个设备和服务器能够在不泄露隐私的情况下协同高效地训
练模型。
[0006]尽管在数据安全方面有很多的研究。但大多数都限制于解决原始数据安全问题,如何在复杂车联网空间中,同时满足移动用户大数据隐私性和可用性为目标,设计一个有效的联邦学习算法来减少通信开销的同时防止梯度泄露后导致数据被恢复的问题依旧是开放的。
[0007]首先,联邦学习中数据都存储在本地节点中,可以减少数据传输中原始数据泄露的风险问题。但仅仅只传输梯度信息,依旧会出现原始数据被恢复的可能性。安全多方计算中数据交互可以使得多方拥有数据,降低梯度信息被泄露后样本被信息恢复的可能性。但现有的安全多方计算中用户交互信息的方式是所有用户都发送给其他用户,简单讲就是使用单播的方式,这样就会带来较高的时间开销。所以在应对车辆用户的数据安全和实时性需求时,找到一个合适的解决方案降低数据被攻击和被恢复的风险,并降低传输时延就很重要。其次,由于不同边缘服务器的数据和设备差异性,在训练过程中有针对性的提高整个模型训练精度也是很有必要的。采用典型的联邦平均同步方式进行全局参数聚合会出现掉队现象而变得缓慢。在平衡计算通信时间开销的同时,多个模型个性化训练来保障全局精度也是很重要。然而,大多数基于数据安全的联邦学习算法依赖于同步聚合算法会带来高时延对满足车联网的实时性需求具有挑战性。因此一个基于强化学习的联邦学习算法来降低时延提高精确度并保障数据安全是有必要的。

技术实现思路

[0008]本专利技术要解决的技术问题在于针对现有技术中的缺陷,提供一种车联网中基于MePC

F模型的实时强化联邦学习数据隐私安全方法。
[0009]本专利技术解决其技术问题所采用的技术方案是:
[0010]本专利技术提供一种车联网中基于MePC

F模型的实时强化联邦学习数据隐私安全方法,该方法包括以下步骤:
[0011]S1、构建多个边缘服务器E
i
和一个云服务器CS;获取车辆数据D={D1,D2,

,D
i
},边缘服务器E
i
获取对应车辆数据D
i

[0012]S2、在第k轮联邦任务中,边缘服务器E
i
从云服务器CS中下载初始A型梯度并解密为随机初始化B型梯度边缘服务器E
i
根据其车辆数据D
i
的最小化损失函数来计算本地网络模型训练中的梯度,边缘服务器E
i
完成T轮本地训练完后的梯度信息记为
[0013]S3、边缘服务器E
i
通过解码函数从中获取需要保留的部分梯度信息并将剩余的梯度信息经同态加密为再通过MePC算法广播发送给其它所有的边缘服务器E
j
;边缘服务器E
i
根据解码函数获取来自其它边缘服务器E
j
的对应部分梯度信息所有边缘服务器更新共享后的A类梯度信息分别为
i∈[1,n],n为边缘服务器的总数;
[0014]S4、所有边缘服务器将上传到云服务器CS,云服务器CS通过PreFLa算法聚合全局参数,PreFLa算法通过强化学习获得最大化回报来选择边缘服务器E
i
的最优参数权重比a
i,k
,全局梯度参数根据a
i,k
进行聚合;参数的上传和下载过程是并行的,所有参数都经过HE加密;
[0015]S5、重复步骤S2

S4,直到达到终止条件,云服务器CS计算最终的全局梯度参数,下发给各边缘服务器,边缘服务器根据多个车辆数据的特征提取,计算MePC

F模型的精确度和最优损失函数,得到训练好的MePC

F模型,完成整个训练过程,实时输出给车联网对应的服务。。
[0016]进一步地,本专利技术的所述步骤S2中,本地网络模型训练的具体方法为:<本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种车联网中基于MePC

F模型的实时强化联邦学习数据隐私安全方法,其特征在于,该方法包括以下步骤:S1、构建多个边缘服务器E
i
和一个云服务器CS;获取车辆数据D={D1,D2,

,D
i
},边缘服务器E
i
获取对应车辆数据D
i
;S2、在第k轮联邦任务中,边缘服务器E
i
从云服务器CS中下载初始A型梯度并解密为随机初始化B型梯度边缘服务器E
i
根据其车辆数据D
i
的最小化损失函数来计算本地网络模型训练中的梯度,边缘服务器E
i
完成T轮本地训练完后的梯度信息记为S3、边缘服务器E
i
通过解码函数从中获取需要保留的部分梯度信息并将剩余的梯度信息经同态加密为再通过MePC算法广播发送给其它所有的边缘服务器E
j
;边缘服务器E
i
根据解码函数获取来自其它边缘服务器E
j
的对应部分梯度信息所有边缘服务器更新共享后的A类梯度信息分别为i∈[1,n],n为边缘服务器的总数;S4、所有边缘服务器将上传到云服务器CS,云服务器CS通过PreFLa算法聚合全局参数,PreFLa算法通过强化学习获得最大化回报来选择边缘服务器E
i
的最优参数权重比a
i,k
,全局梯度参数根据a
i,k
进行聚合;参数的上传和下载过程是并行的,所有参数都经过HE加密;S5、重复步骤S2

S4,直到达到终止条件,云服务器CS计算最终的全局梯度参数,下发给各边缘服务器,边缘服务器根据多个车辆数据的特征提取,计算MePC

F模型的精确度和最优损失函数,得到训练好的MePC

F模型,完成整个训练过程,实时输出给车联网对应的服务。2.根据权利要求1所述的车联网中基于MePC

F模型的实时强化联邦学习数据隐私安全方法,其特征在于,所述步骤S2中,本地网络模型训练的具体方法为:采用深度神经网络DNN模型,DNN通过将不同车辆数据作为原始输入来执行端到端的特征学习和分类器训练,使用随机梯度下降作为子程序来最小化每个本地训练中损失值;E
i
在第k轮通信中从云服务器CS下载基础层参数,即解密前的初始A型梯度并解密为A型梯度随机初始化B型梯度其中,k∈[1,K],K表示联邦任务的总轮数;若为第一轮联邦任务,CS随机初始化在本地训练之前,E
i
通过使用同态加密对解密为并记为局部模型的损失函数设置如下:L(w
i
)=l(w
i
)+λ(w
i,t

w
i,t+1
)2其中,l()表示网络的损失,第二项是L2正则化项,λ是正则化系数;w
i
表示局部模型中的总权重信息,w
i,t
是局部模型在t时刻的权重信息,w
i,t+1
是局部模型在t+1时刻的权重信息;E
i
更新G
k
并替换模型的权重参数w
i
,通过最小化损失函数继续进行局部模型训练如下:
w
i
=w
i

ηG
k
其中,η是学习率,G
k
是和的总表示,这里的随机初始化;边缘服务器E
i
在达到T轮本地训练后,此时会得到每个局部模型的准确率aCC
i,k
和3.根据权利要求1所述的车联网中基于MePC

F模型的实时强化联邦学习数据隐私安全方法,其特征在于,所述步骤S3中,MePC算法的具体方法为:第k轮联邦任务中,所有的边缘服务器使用MePC来交换基础层梯度其中,表示第k轮联邦任务中第n个边缘服务器的A类加密数据,表示第k轮联邦任务中第i个边缘服务器的A类加密数据,表示第k轮联邦任务中第i个边缘服务器广播发给其他边缘服务器的A类加密数据,即为去除了自己保留的那一份后的加密数据;为了避免数据被破解的风险,在每个网络中取随机比例χ的梯度即为并保持同一轮联邦的随机比例χ相同,再将加密为在不同轮的联邦任务中,随机比例χ是变化的,χ∈[1,1/n];剩下的梯度通过同态加密为被均分为n

1份的值划分为:只有被保留在E
i
中,其它部分和随机参数χ将会以密文的形式广播发送给其它E
j
;通过这种方式,即使部分传输内容被攻击,最初的数据也不会泄露;共享给其它E
j
的梯度信息是的梯度信息是当E
i
接收到由其它服务器发送的数据包它在本地执行数据验证。4.根据权利要求3所述的车联网中基于MePC

F模型的实时强化联邦学习数据隐私安全方法,其特征在于,所述步骤S3中,在本地执行数据验证的具体方法为:在第k轮联邦任务中,使用相应的“乘法”方法进行验证,每个边缘服务器自己设计两个解码函数,如下:解码函数,如下:其中,L0是的长度,L

是的长度;解码函数的下标k,表示第k轮联邦任务中的解码函数;
L0=χ
·
L其中,L是的长度,与的长度相等;要求满足所有边缘服务器的解码函数对同一个数据包执行“并”操作得到全0,并执行“交”操作得到全1,即:操作得到全1,即:首先,初始化解码函数如下:将数据包与其它服务器中相应的解码函数相乘;由于中0的二进制位被乘得0,所以E
i
保证只得到它自己的部分数据包;当中的二进制位为1时,得到对应位置的梯度信息的密文,如下:E
i
将从其它边缘服务器E
j
获取的所有数据包数组添加到对应位置,得到所有密文数据,并更新为最后即:每次进行安全多方计算时,随着k的增加,将每个E
i
中的解码函数的二进制向左循环移动m个单位,以保证共享的动态性,并将它们平均划分到E1,E2,

,E
n
中,且每个部分的数据信息不重复。5.根据权利要求1所述的车联网中基于MePC

F模型的实时强化联邦学习数据隐私安全方法,...

【专利技术属性】
技术研发人员:朱容波李梦瑶刘浩
申请(专利权)人:华中农业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1