System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种可验证隐私保护分层联邦学习数据通信方法及系统技术方案_技高网
当前位置: 首页 > 专利查询>济南大学专利>正文

一种可验证隐私保护分层联邦学习数据通信方法及系统技术方案

技术编号:41317954 阅读:4 留言:0更新日期:2024-05-13 14:58
本公开提供了一种可验证隐私保护分层联邦学习数据通信方法及系统,涉及数据隐私保护安全技术领域,包括对用户设备进行分组,构建可验证隐私保护分层联邦学习架构,每个用户对本地数据进行训练并与云端的边缘设备协同训练获取机器学习模型;获取机器学习模型时,将上传的参数在整个数据交互过程中使用用户公钥进行加密;卫星节点将用户传输的加密数据发送给中心服务器进行有效梯度聚合,得到聚合结果后会对其进行加密和签名然后返回给用户。本公开不仅可以容许用户的动态变化,而且允许卫星节点的动态变化,多个卫星节点共同分担单一节点变化导致的压力,从而提高了系统灵活性和稳定性。

【技术实现步骤摘要】

本公开涉及数据隐私保护安全,具体涉及一种可验证隐私保护分层联邦学习数据通信方法及系统


技术介绍

1、本部分的陈述仅仅是提供了与本公开相关的
技术介绍
信息,不必然构成在先技术。

2、如今,在很多行业内,各大企业的数据逐渐积累但是难以共享,成为了很多数据孤岛,限制了这些数据进一步产生价值;另一个是数据隐私保护和数据安全问题。当时数据中心化是一种普遍的机器学习训练模式。在这种模式下,各个节点或设备必须将本地数据上传至中心服务器进行模型训练,这种做法不仅增加了数据传输的成本和时间,还引发了一系列关于数据隐私和安全性的问题。例如,用户数据可能会受到第三方攻击,或被用于未经授权的目的。

3、联邦学习的概念首次在2016年提出,目的是在防止数据泄露的前提下利用分布在多个设备上的数据集进行模型训练。联邦学习或联邦机器学习是实现在本地原始数据不流出平台的前提下,通过对中间加密数据的流通和处理来完成多方联合的机器学习训练与预测,其设计目标是在保障大数据联合价值开发时的数据安全、保护终端数据和个人数据隐私,保证合法合规的前提下,在参与多方或者多计算节点之间开展高效率的机器学习,实现数据的可用不可见。

4、定义n个数据提供方fi,i∈{0,1,…,n},他们都想联合所有人的自有数据集di,i∈{0,1,…,n}来训练机器学习模型。一个朴素的方法是对所有自有数据集求并集d=∪di,i∈{0,1,…,n}去训练一个模型msum。一个联邦学习过程是所有数据提供方合作训练一个模型mfed,任何一个数据提供方fi都不会将自有数据集di暴露给其他人。此外,联邦训练模型mfed的准确率定义为vfed,其应与msum的准确率vsum非常接近。一般地,定义为δ非负实数,如果|vfed-vsum|<δ,则称联邦学习算法会产生δ-准确率损耗。

5、尽管联邦学习实现了数据隐私的保护和通信效率的提升,但它也存在诸多不足:1)数据分布不均衡:在一个联邦学习系统中,不同的设备或节点可能拥有不同分布的数据,这可能导致模型的全局性能下降。2)通信开销大:尽管联邦学习减少了数据传输,但模型参数和梯度的频繁更新仍可能导致不小的通信负担。3)异构性问题:联邦网络中的设备可能在计算能力、存储、电池寿命等方面有很大差异,这些因素都可能影响联邦学习的效率和可行性。4)安全性与隐私泄露问题:虽然联邦学习在设计时就考虑了数据隐私,但恶意节点可能仍然通过复杂的攻击手段来推断其他参与者的数据。5)模型和算法复杂性高:联邦学习需要设计更复杂的优化算法来处理多节点、分布式数据和可能出现的通信延迟或数据丢失。


技术实现思路

1、本公开为了解决上述问题,提出了一种可验证隐私保护分层联邦学习数据通信方法及系统,包括中心服务器、卫星节点(satellite nodes)以及若干用户,通过vphfl框架,每个用户利用自己的个人终端对本地数据进行训练并与云服务器协同训练进而获得更为精准的机器学习模型,解决联邦学习模型训练过程中用户动态高效自分组的技术问题。

2、根据一些实施例,本公开采用如下技术方案:

3、一种可验证隐私保护分层联邦学习数据通信方法,包括:

4、初始化用户设备,对用户设备进行分组,构建可验证隐私保护分层联邦学习架构,每个用户对本地数据进行训练并与云端的边缘设备协同训练获取机器学习模型;

5、获取机器学习模型时,将上传的参数在整个数据交互过程中使用用户公钥进行加密;

6、其中,每个用户通过一致性哈希算法进行定位,连接到同一个卫星节点的用户自成一组,组内的所有用户设备与同一个云端的边缘设备进行数据交换,对卫星节点采用虚拟化技术,每一个卫星节点通过一致性哈希算法对应哈希环上的一个或多个位置,所述卫星节点将用户传输的加密数据发送给中心服务器进行有效梯度聚合,得到聚合结果后会对其进行加密和签名然后返回给用户。

7、根据一些实施例,本公开采用如下技术方案:

8、一种可验证隐私保护分层联邦学习数据通信系统,包括:

9、初始化模块,初始化用户设备,对用户设备进行分组,构建可验证隐私保护分层联邦学习架构,每个用户对本地数据进行训练并与云端的边缘设备协同训练获取机器学习模型;

10、验证共享模块,获取机器学习模型时,将上传的参数在整个数据交互过程中使用用户公钥进行加密;

11、其中,每个用户通过一致性哈希算法进行定位,连接到同一个卫星节点的用户自成一组,组内的所有用户设备与同一个云端的边缘设备进行数据交换,对卫星节点采用虚拟化技术,每一个卫星节点通过一致性哈希算法对应哈希环上的一个或多个位置;

12、模型聚合模块,所述卫星节点将用户传输的加密数据发送给中心服务器进行有效梯度聚合,得到聚合结果后会对其进行加密和签名然后返回给用户。

13、根据一些实施例,本公开采用如下技术方案:

14、一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质用于存储计算机指令,所述计算机指令被处理器执行时,实现所述的一种可验证隐私保护分层联邦学习数据通信方法。

15、根据一些实施例,本公开采用如下技术方案:

16、一种电子设备,包括:处理器、存储器以及计算机程序;其中,处理器与存储器连接,计算机程序被存储在存储器中,当电子设备运行时,所述处理器执行所述存储器存储的计算机程序,以使电子设备执行实现所述的一种可验证隐私保护分层联邦学习数据通信方法。

17、与现有技术相比,本公开的有益效果为:

18、本公开提供了一种可验证隐私保护分层联邦学习数据通信方法,构建一种可验证隐私保护分层联邦学习架构vphfl,vphfl系统架构中涉及三类不同的实体,包括中心服务器、卫星节点(satellite nodes)以及若干用户。在vphfl框架中,每个用户都可以利用自己的个人终端(如手机和电脑)对本地数据进行训练并与云服务器协同训练进而获得更为精准的机器学习模型。为确保安全,上传的参数在整个数据交互过程中使用用户公钥进行加密;本公开在实体设计层面,vphfl在用户与中心服务器之间设有云端的边缘节点,即卫星节点,其优势在于:1)对于用户来说,卫星节点相较于中心服务器来说距离较近,通信延迟较小;2)对于中心服务器来说,除了通信延迟的优势之外,卫星节点有效分担了中心服务器的计算成本,提高了用户数据聚合的效率。

19、本公开在系统架构层面,vphfl基于一致性哈希算法将不同实体组织成环状拓扑结构,其优势在于:1)实现了用户与卫星节点之间的自动分组,提高了协议执行效率;2)卫星节点的虚拟化防止了分组过程中的用户倾斜问题——即某一些卫星节点承担了大量的用户数据计算任务,而其余节点算力过剩;3)系统不仅可以容许用户的动态变化,而且允许卫星节点的动态变化,多个卫星节点共同分担单一节点变化导致的压力,从而提高了系统灵活性和稳定性。

本文档来自技高网...

【技术保护点】

1.一种可验证隐私保护分层联邦学习数据通信方法,其特征在于,包括:

2.如权利要求1所述的一种可验证隐私保护分层联邦学习数据通信方法,其特征在于,每个用户拥有一个私有数据集,用来进行本地的模型训练,当完成本地训练后,用户对本地梯度向量进行盲化后加密上传到对应的卫星节点上,在收到中心服务器下发的加密聚合梯度后,用户更新本地模型,并使用本地数据集进行新一轮的模型训练。

3.如权利要求1所述的一种可验证隐私保护分层联邦学习数据通信方法,其特征在于,卫星节点接收用户上传的加密数据并校验数据完整性和用户身份真实性,在可验证隐私保护分层联邦学习架构中,对卫星节点采用虚拟化技术,每一个卫星节点通过一致性哈希算法对应哈希环上的一个或多个位置,每个卫星节点在环上有一个虚拟节点,所有的虚拟节点在哈希环上均匀分布。

4.如权利要求3所述的一种可验证隐私保护分层联邦学习数据通信方法,其特征在于,当有新的用户进入时,使用相同的哈希函数确定它在哈希环上的位置,然后找到离该位置最近的虚拟节点,并将数据或请求分配给该虚拟节点,然后将其映射到相关联的真实节点。

5.如权利要求4所述的一种可验证隐私保护分层联邦学习数据通信方法,其特征在于,当某个卫星节点发生故障或者主动进行弹性伸缩时,该节点对应的多个虚拟节点均会移除,原本由这些虚拟节点所负责的用户会按顺时针方向请求到下一个虚拟节点,从而对应不同的其他卫星节点。

6.如权利要求2所述的一种可验证隐私保护分层联邦学习数据通信方法,其特征在于,中心服务器接收到卫星节点传输的用户加密数据后,只能获得局部梯度和随机数的总和,中心服务器进行有效梯度聚合,获取聚合结果后,中心服务器会对聚合结果进行加密和签名,然后再发送给用户。

7.如权利要求1所述的一种可验证隐私保护分层联邦学习数据通信方法,其特征在于,用户在完成本地训练后,用户对本地梯度数据进行盲化和加密并上传到卫星节点,可验证隐私保护分层联邦学习架构包括三个实体,分别是用户、卫星节点以及中心服务器。

8.一种可验证隐私保护分层联邦学习数据通信系统,其特征在于,包括:

9.一种非暂态计算机可读存储介质,其特征在于,所述非暂态计算机可读存储介质用于存储计算机指令,所述计算机指令被处理器执行时,实现如权利要求1-7任一项所述的一种可验证隐私保护分层联邦学习数据通信方法。

10.一种电子设备,其特征在于,包括:处理器、存储器以及计算机程序;其中,处理器与存储器连接,计算机程序被存储在存储器中,当电子设备运行时,所述处理器执行所述存储器存储的计算机程序,以使电子设备执行实现如权利要求1-7任一项所述的一种可验证隐私保护分层联邦学习数据通信方法。

...

【技术特征摘要】

1.一种可验证隐私保护分层联邦学习数据通信方法,其特征在于,包括:

2.如权利要求1所述的一种可验证隐私保护分层联邦学习数据通信方法,其特征在于,每个用户拥有一个私有数据集,用来进行本地的模型训练,当完成本地训练后,用户对本地梯度向量进行盲化后加密上传到对应的卫星节点上,在收到中心服务器下发的加密聚合梯度后,用户更新本地模型,并使用本地数据集进行新一轮的模型训练。

3.如权利要求1所述的一种可验证隐私保护分层联邦学习数据通信方法,其特征在于,卫星节点接收用户上传的加密数据并校验数据完整性和用户身份真实性,在可验证隐私保护分层联邦学习架构中,对卫星节点采用虚拟化技术,每一个卫星节点通过一致性哈希算法对应哈希环上的一个或多个位置,每个卫星节点在环上有一个虚拟节点,所有的虚拟节点在哈希环上均匀分布。

4.如权利要求3所述的一种可验证隐私保护分层联邦学习数据通信方法,其特征在于,当有新的用户进入时,使用相同的哈希函数确定它在哈希环上的位置,然后找到离该位置最近的虚拟节点,并将数据或请求分配给该虚拟节点,然后将其映射到相关联的真实节点。

5.如权利要求4所述的一种可验证隐私保护分层联邦学习数据通信方法,其特征在于,当某个卫星节点发生故障或者主动进行弹性伸缩时,该节点对应的多个虚拟节点均会移除,原本由这些虚拟节点所负...

【专利技术属性】
技术研发人员:赵川魏宇楠林宇成埃尔加内·阿米娜赵圣楠荆山
申请(专利权)人:济南大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1