面向联邦学习的数据遗忘验证方法和系统技术方案

技术编号：41407752 阅读：6 留言：0更新日期：2024-05-20 19:34

本发明专利技术提供的面向联邦学习的数据遗忘验证方法和系统，应用于目标客户端，通过针对目标数据向服务器发出数据遗忘请求以使服务器通知其他客户端重新进行联邦学习；在本地删除目标数据后进行重训练并根据重训练过程生成第一证明；确定重训练得到的新模型的参数所对应的梯度向量并将梯度向量发送至服务器；接收其他客户端发送的第二证明和签名；根据第一证明和第二证明以及第一预设规则对重训练过程进行验证，在验证通过后基于第二预设规则对签名进行验证，在验证通过后接收参数聚合结果，基于第三预设规则对参数聚合结果进行验证，确保信息的完整性和保密性，通过参数聚合让目标客户端不必对每一个证明进行验证提高了验证效率。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术属于信息安全，具体涉及一种面向联邦学习的数据遗忘验证方法和系统。

技术介绍

1、随着数据安全相关法律的逐步完善和实施，用户的“遗忘权”已正式纳入法律框架，进一步保障了用户对个人信息的控制权和隐私安全。数据遗忘要求数据拥有者完全删除特定数据，实现模型对数据的遗忘。对于模型拥有者来说，进行数据遗忘训练不仅会消耗大量的计算资源，还可能意味着丢失特定数据所蕴含的知识，这有时可能导致模型拥有者出于成本考虑而不正确执行数据遗忘。对于提供数据的普通用户来说，他们很难通过观察模型参数的变化来判断数据是否被遗忘。因此，为普通用户提供一个验证数据遗忘的方法变得尤为重要。现有的通过注入后门或其他特征值来验证遗忘的方法在联邦学习下使用会存在一定风险。在联邦学习环境中，数据分布在不同的节点上，每个节点只能访问自己的数据集。如果在这样的环境下使用注入后门或特征值的方法，可能会暴露节点间的敏感信息，且这个风险要由所有参与的节点共同承担。因此，亟需提出一种在保证各联邦节点隐私数据安全的同时有效验证数据遗忘的方法。

2、现有与本专利技术最接近的方案针对联邦学习下数据遗忘和验证问题，gao等人提出了一个联邦学习下的非入侵数据遗忘验证方法verifi。在verifi框架中，使用了独特记忆标记方法来验证全局模型对离开数据的遗忘效果。这些独特记忆包括可遗忘记忆(vfm)和错误记忆(vem)，它们作为标记来观察模型在数据遗忘前后的表现。通过测量这些标记在全局模型上的准确性、损失、影响函数和kl散度等指标的变化判断遗忘的程度。

3、然而，verifi技术具有以下缺点：

4、1)准确性、损失、影响函数和kl散度等指标对于被标记的数据集具有较强的依赖性，如果标记的数据集不能准确地代表遗忘的数据，那么结果可能不全面或具有误导性。且当使用不同的数据集和模型时，使用这些指标可能会给出不同的结果，导致评估不具有一致性。

5、2)深度学习模型中的权重调整引发的连锁反应，局部最优解之间的转移，以及优化算法的随机性，都为参数更新带来不确定性。这种不确定性造成的结果是，性能指标可能无法即时准确地反映遗忘效果，因此评估遗忘效果具有一定的不确定性。

6、3)verifi技术是在假设服务器是可信的前提下使用的，没有对服务器的运算进行验证，在不可信的条件下无法使用。

技术实现思路

1、为了解决现有技术中存在的上述问题，本专利技术提供了一种面向联邦学习的数据遗忘验证方法和系统。包括：

2、第一方面，本专利技术提供了一种面向联邦学习的数据遗忘验证方法，应用于目标客户端，包括：

3、针对目标数据，向服务器发出数据遗忘请求以使服务器通知其他客户端重新进行联邦学习；

4、在本地删除目标数据并进行重训练，并根据重训练过程生成第一证明；

5、确定重训练得到的新模型的参数所对应的梯度向量，并将梯度向量发送至服务器；

6、接收其他客户端基于相应的重训练情况所发送的第二证明和签名；

7、根据第一证明和第二证明，以及第一预设规则对重训练过程进行验证，并在重训练过程验证通过后，基于第二预设规则对各其他客户端所发送的签名进行验证，并在签名验证通过后，接收服务器发送的参数聚合结果，并基于第三预设规则对参数聚合结果进行验证，以确定目标数据是否被成功遗忘，参数聚合结果为服务器对接收到的相应客户端发送的梯度向量执行聚合处理所得到的聚合结果。

8、第二方面，本专利技术还提供了一种面向联邦学习的数据遗忘验证方法，应用于任一其他客户端，包括：

9、若接收到服务器发送的针对目标数据的重训练通知消息则执行重训练；

10、确定重训练得到的新模型的参数所对应的梯度向量，并将梯度向量发送至服务器，以使服务器根据新模型的参数得到参数聚合结果；

11、根据相应的重训练过程确定第二证明，并将第二证明发送至目标客户端，以使目标客户端根据第二证明对重训练过程进行验证；

12、确定新模型的参数对应的签名，并将签名发送至目标客户端，以使目标客户端根据签名进行签名验证。

13、第三方面，本专利技术还提供了一种面向联邦学习的数据遗忘验证方法，应用于服务器，包括：

14、若接收到目标客户端发送的针对目标数据的数据遗忘请求，则向其他客户端发送针对目标数据的重训练通知消息，以使各其他客户端根据针对目标数据的重训练通知消息进行重训练；

15、对接收到的目标客户端和各其他客户端发送的模型参数对应的梯度向量执行聚合处理，得到参数聚合结果，并向目标客户端发送参数聚合结果，以使目标客户端通过对参数聚合结果进行验证，确定出目标数据是否被成功遗忘。

16、第四方面，本专利技术还提供了一种面向联邦学习的数据遗忘验证系统，包括：

17、目标客户端、服务器和至少一个其他客户端；

18、服务器分别与目标客户端和各其他客户端连接；

19、目标客户端，用于针对目标数据向服务器发出数据遗忘请求，在本地删除目标数据并进行重训练，并根据重训练过程生成第一证明，确定重训练得到的新模型的参数所对应的梯度向量，并将相应梯度向量发送至服务器；

20、服务器，用于响应于数据遗忘请求向各其他客户端发送针对目标数据的重训练通知消息；

21、各其他客户端，用于响应于重训练通知消息执行重训练，并确定重训练得到的新模型的参数所对应的梯度向量，将相应梯度向量发送至服务器，根据相应的重训练过程确定第二证明并将第二证明发送至目标客户端，确定新模型的参数对应的签名，并将签名发送至目标客户端；

22、服务器，还用于对接收到的目标客户端和各其他客户端发送的梯度向量执行聚合处理，得到参数聚合结果，并向各个客户端发送参数聚合结果；

23、目标客户端，还用于根据第一证明和第二证明，以及第一预设规则对重训练过程进行验证，并在重训练过程验证通过后，基于第二预设规则对各其他客户端所发送的签名进行验证，并在签名验证通过后，接收服务器发送的参数聚合结果，并基于第三预设规则对参数聚合结果进行验证，以确定目标数据是否被成功遗忘。

24、本专利技术的有益效果：

25、本专利技术提供的面向联邦学习的数据遗忘验证方法和系统，在实现遗忘训练的同时，确保联邦学习过程中敏感信息的完整性和保密性；同时通过参数聚合，让目标客户端不必对每一个证明进行验证，只需将证明聚合后进行批量验证即可，提高了验证效率；通过对服务器的聚合结果进行验证，确保聚合结果的准确性，使本专利技术可以用于存在不诚实的服务器场景中，扩大了应用范围。

26、以下将结合附图及实施例对本专利技术做进一步详细说明。

本文档来自技高网...

【技术保护点】

1.一种面向联邦学习的数据遗忘验证方法，其特征在于，应用于目标客户端，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述根据所述第一证明和所述第二证明，以及第一预设规则对重训练过程进行验证，包括：

3.根据权利要求1或2所述的方法，其特征在于，所述第二预设规则表示为：

4.根据权利要求3所述的方法，其特征在于，所述第三预设规则表示为：

5.一种面向联邦学习的数据遗忘验证方法，其特征在于，应用于任一其他客户端，包括：

6.根据权利要求5所述的方法，其特征在于，所述根据相应的重训练过程确定第二证明，包括：

7.根据权利要求6所述的方法，其特征在于，所述分别确定基于所述QAP算数电路的Groth16算法所对应的第一公共参数、基于所述QPP算数电路的Groth16算法所对应的第二公共参数、基于所述QAP算数电路和所述QPP算数电路的CP-SNARK算法所对应的第三公共参数，包括：

8.根据权利要求5-7任一所述的方法，其特征在于，所述确定所述新模型的参数对应的签名，包括：

9.一种

10.一种面向联邦学习的数据遗忘验证系统，其特征在于，包括：

...

【技术特征摘要】

1.一种面向联邦学习的数据遗忘验证方法，其特征在于，应用于目标客户端，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述根据所述第一证明和所述第二证明，以及第一预设规则对重训练过程进行验证，包括：

3.根据权利要求1或2所述的方法，其特征在于，所述第二预设规则表示为：

4.根据权利要求3所述的方法，其特征在于，所述第三预设规则表示为：

5.一种面向联邦学习的数据遗忘验证方法，其特征在于，应用于任一其他客户端，包括：

6.根据权利要求5所述的方法，其特征在于，所述根据相应的重训练过程确定第二...

【专利技术属性】
技术研发人员：马鑫迪，张颖，张俊英，赵帅，王祥宇，姜奇，马卓，张俊伟，沈玉龙，马建峰，
申请(专利权)人：西安电子科技大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人