模型生成方法、装置以及电子设备制造方法及图纸

技术编号：39405515 阅读：5 留言：0更新日期：2023-11-19 15:57

本申请实施例公开了一种模型生成方法、装置以及电子设备，方法包括：从多个第一分组中获取目标分组，目标分组为目标数据所对应的第一分组，目标数据为请求遗忘的数据；基于模型集合中除参考模型以外的模型，进行模型聚合以得到目标模型，其中，模型集合中的每个模型为基于多个第一分组中所对应的第一分组的数据预先训练得到，且参考模型为基于目标分组对应的数据训练得到。从而使得可以避免在需要对目标数据进行遗忘时需要完全重新进行训练以得到目标模型，以降低遗忘学习过程的耗时，并降低了遗忘学习的成本。低了遗忘学习的成本。低了遗忘学习的成本。

全部详细技术资料下载

【技术实现步骤摘要】
模型生成方法、装置以及电子设备

[0001]本申请涉及计算机
，更具体地，涉及一种模型生成方法、装置以及电子设备。

技术介绍

[0002]遗忘学习是一种用在机器学习过程中消除数据对模型影响的技术。机器遗忘学习能够保证数据拥有者“被遗忘的权力”，保障用户数据安全与隐私。但是，相关的遗忘学习过程还存在耗时长的缺陷。

技术实现思路

[0003]鉴于上述问题，本申请提出了一种模型生成方法、装置以及电子设备，以改善上述问题。
[0004]第一方面，本申请提供了一种模型生成方法，所述方法包括：从多个第一分组中获取目标分组，所述目标分组为目标数据所对应的第一分组，所述目标数据为请求遗忘的数据；基于模型集合中除参考模型以外的模型，进行模型聚合以得到目标模型，其中，所述模型集合中的每个模型为基于所述多个第一分组中所对应的第一分组的数据预先训练得到，且所述参考模型为基于所述目标分组对应的数据训练得到。
[0005]第二方面，本申请提供了一种模型生成装置，所述装置包括：分组定位单元，用于从多个第一分组中获取目标分组，所述目标分组为目标数据所对应的第一分组，所述目标数据为请求遗忘的数据；模型生成单元，用于基于模型集合中除参考模型以外的模型，进行模型聚合以得到目标模型，其中，所述模型集合中的每个模型为基于所述多个第一分组中所对应的第一分组的数据预先训练得到，且所述参考模型为基于所述目标分组对应的数据训练得到。
[0006]第三方面，本申请提供了一种电子设备，所述电子设备至少包括处理器、以及存储器；...

【技术保护点】

【技术特征摘要】
1.一种模型生成方法，其特征在于，所述方法包括：从多个第一分组中获取目标分组，所述目标分组为目标数据所对应的第一分组，所述目标数据为请求遗忘的数据；基于模型集合中除参考模型以外的模型，进行模型聚合以得到目标模型，其中，所述模型集合中的每个模型为基于所述多个第一分组中所对应的第一分组的数据预先训练得到，且所述参考模型为基于所述目标分组对应的数据训练得到。2.根据权利要求1所述的方法，其特征在于，所述模型集合包括第一模型集合以及第二模型集合，所述第一模型集合包括之前用于进行模型聚合的模型，所述第二模型集合包括之前未用于进行模型聚合的模型，所述基于模型集合中除参考模型以外的模型，进行模型聚合以得到目标模型，包括：基于所述第一模型集合中除第一参考模型以外的模型，获取第一待聚合模型，所述第一参考模型为第一模型集合中与所述目标分组对应的模型；基于所述第二模型集合中除第二参考模型以外的模型，获取第二待聚合模型，所述第二参考模型为第二模型集合中与所述目标分组对应的模型；基于所述第一待聚合模型和所述第二待聚合模型，进行模型聚合以得到目标模型。3.根据权利要求2所述的方法，其特征在于，所述基于所述第一待聚合模型和所述第二待聚合模型，进行模型聚合以得到目标模型，包括：若所述第二模型集合中除第二参考模型以外的模型的数量，大于或者等于所述第一参考模型的数量，基于所述第一待聚合模型和所述第二待聚合模型，进行模型聚合以得到目标模型。4.根据权利要求2所述的方法，其特征在于，所述基于所述第一待聚合模型和所述第二待聚合模型，进行模型聚合以得到目标模型，包括：若所述第二模型集合中除第二参考模型以外的模型的数量，小于所述第一参考模型的数量，获取待处理模型在训练过程中的目标中间状态，所述待处理模型包括第一参考模型和/或所述第二参考模型，所述目标中间状态为根据首次基于所述目标数据对所述待处理模型进行训练之前，所述待处理模型对应的训练状态确定；对所述目标中间状态对应的模型进行继续训练，以得到第三待聚合模型；基于从所述第二待聚合模型以及第三待聚合模型中选择的模型，以及所述第一待聚合模型进行模型聚合，以得到目标模型。5.根据权利要求4所述的方法，其特征在于，所述模型集合中的每个模型为基于所述多个第一分组中所对应的第一分组的数据，进行多轮训练得到，且同一个第一分组在多轮训练过程中用于进行模型训练的数据不尽相同，所述获取待处理模型在训练过程中的目标中间状态，包括：若获取到待处理模型在训练过程中的中间状态有多个，所述中间状态为首次基于使用所述目标数据进行训练之前所述待处理模型对应的训练状态；将多个中间状态中，训练轮次最大的中间状态作为目标中间状态。6.根据权利要求1所述的方法，其特征在于，所述从多个第一分组中获取目标分组，所述目标分组为目标数据所对应的第一分组，所述目标数据为请求遗忘的数据之前还包括：将第一用户集合中的用户进行分组，以得到多个第一分组；
基于多个第一分组中的数据分别对初始模型进行训练，以得到多个第一分组分别对应的模型，以基于所述多个第一分组分别对应的模型得到模型集合，其中，第一分组中的数据包括第一分组中多个用户所对应的数据。7.根据权利要求6所述的方法，其特征在于，所述基于多个第一分组中的数据分别对初始模型进行训练，以得...

【专利技术属性】
技术研发人员：瞿祥谋，王俊，孟丹，齐越，易兰军，徐杰，
申请(专利权)人：深圳市与飞科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人