数据处理方法技术

技术编号：39755334 阅读：9 留言：0更新日期：2023-12-17 23:54

本申请实施例公开了一种数据处理方法

全部详细技术资料下载

【技术实现步骤摘要】
数据处理方法、装置、电子设备及存储介质

[0001]本申请属于联邦学习训练领域，具体涉及一种数据处理方法
、
装置
、
电子设备及存储介质
。

技术介绍

[0002]联邦学习是一种新兴的分布式学习框架，可以实现成千上万，甚至数以百万计的大规模分布式合作学习
。
在联邦学习中数据无需上传到中心服务器，既保证了数据隐私，又缓解了数据孤岛带来的棘手问题
。
联邦学习现在已经被广泛应用在金融，医疗，保险等隐私敏感领域中
。
最近，一些严格的数据法案已明确规定了用户享有数据“被遗忘权”，例如通用数据保护法规
(GDPR)
和加州消费者隐私法
(CCPA)
等
。
从隐私和安全的角度来看，遗忘权至关重要
。
它不仅可以保护单个用户的隐私，及时删除关于该用户的相关记忆，还可以清除在实际的联邦学习部署中某些可能中毒的恶意客户
。
但相关的数据处理方式，在遗忘数据的过程中，可能会出现灾难性遗忘
。

技术实现思路

[0003]鉴于上述问题，本申请提出了一种数据处理方法
、
装置
、
电子设备以及存储介质，以实现改善上述问题
。
[0004]第一方面，本申请实施例提供了一种数据处理方法，所述方法包括：响应于数据遗忘请求，获取待训练模型和待遗忘数据；生成所述待遗忘数据对应的随机标签；通过所述随机标签对所述...

【技术保护点】

【技术特征摘要】
1.
一种数据处理方法，其特征在于，所述方法包括：响应于数据遗忘请求，获取待训练模型和待遗忘数据；生成所述待遗忘数据对应的随机标签；通过所述随机标签对所述待训练模型进行训练，直至满足训练结束条件，得到目标模型
。2.
根据权利要求1所述的方法，其特征在于，所述生成所述待遗忘数据对应的随机标签，包括：将所述待遗忘数据输入到记忆生成器中，获取所述记忆生成器输出的所述待遗忘数据对应的随机标签；所述通过所述随机标签对所述待训练模型进行训练，直至满足训练结束条件，得到目标模型，包括：基于所述随机标签，构建随机记忆；通过所述随机记忆对所述待训练模型进行训练，直至满足训练结束条件，得到所述目标模型
。3.
根据权利要求2所述的方法，其特征在于，所述通过所述随机记忆对所述待训练模型进行训练，直至满足训练结束条件，得到所述目标模型，包括：获取预设损失函数，其中，所述预设损失函数为知识保护器基于待遗忘数据和非遗忘数据进行构建；通过所述预设损失函数和所述随机记忆对所述待训练模型进行训练，直至满足训练结束条件，得到目标模型
。4.
根据权利要求2所述的方法，其特征在于，所述记忆生成器中包括多个教师模型；所述将所述待遗忘数据输入到记忆生成器中，获取所述记忆生成器输出的所述待遗忘数据对应的随机标签，包括：获取所述待遗忘数据对应的数据特征；将所述数据特征输入到所述多个教师模型中，获取所述多个教师模型输出的所述待遗忘数据对应的多个预测标签，其中，所述多个预测标签为去偏教师标签；基于所述多个预测标签，确定所述待遗忘数据对应的随机标签
。5.
根据权利要求4所述的方法，其特征在于，所述多个教...

【专利技术属性】
技术研发人员：王俊，孟丹，瞿祥谋，齐越，傅致晖，裴瑞光，
申请(专利权)人：浙江大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人