基于隐私保护机器遗忘算法的推荐模型生成方法及装置制造方法及图纸

技术编号：38340806 阅读：13 留言：0更新日期：2023-08-02 09:21

本申请提供基于隐私保护机器遗忘算法的推荐模型生成方法及装置，其中所述基于隐私保护机器遗忘算法的推荐模型生成方法包括：获取多个模型，其中，多个模型基于多个样本集对初始推荐模型训练获得，多个样本集通过划分待训练样本集获得；基于待遗忘数据的数据信息，在多个样本集中确定待更新样本集，并删除待更新样本集中的待遗忘数据，确定第一样本集；基于第一样本集，训练初始推荐模型，获得第一推荐模型；聚合第一推荐模型的模型参数和第二推荐模型的模型参数，其中，第二推荐模型为除待更新样本集以外的其他样本集训练的模型；基于聚合后的模型参数生成目标推荐模型，不仅节省了模型的算力资源，还能提高模型使用性能。还能提高模型使用性能。还能提高模型使用性能。

全部详细技术资料下载

【技术实现步骤摘要】
基于隐私保护机器遗忘算法的推荐模型生成方法及装置

[0001]本申请涉及计算机
，特别涉及基于隐私保护机器遗忘算法的推荐模型生成方法。本申请同时涉及项目推荐方法，基于隐私保护机器遗忘算法的推荐模型生成装置，一种计算设备，以及一种计算机可读存储介质。

技术介绍

[0002]推荐模型被广泛应用于不同的场景，如在线购物、音乐推荐、电影推荐等。为了能够准确高效地为用户进行推荐，推荐模型需要使用用户真实的数据作为训练集，以提高模型的可用性，但这种方式用户真实数据会一直保存在服务器端，增加了用户隐私数据泄露的风险。
[0003]为了能够删除用户真实数据，或者是过滤掉具有噪音且应用于模型训练效果差的数据，模型需要执行遗忘的操作，但目前推荐模型的结构不支持部分数据的机器遗忘，只能通过完全重新训练模型来实现，这将带来较大的计算量，同时也会导致推荐模型性能低。

技术实现思路

[0004]有鉴于此，本申请实施例提供了基于隐私保护机器遗忘算法的推荐模型生成方法。本申请同时涉及项目推荐方法，基于隐私保护机器遗忘算法的推荐模型生成装置，一种计算设备，以及一种计算机可读存储介质，以解决现有技术中存在的重新训练模型计算量大、模型性能低的问题。
[0005]根据本申请实施例的第一方面，提供了一种基于隐私保护机器遗忘算法的推荐模型生成方法，包括：获取多个模型，其中，所述多个模型基于多个样本集对初始推荐模型训练获得，所述多个样本集通过划分待训练样本集获得；基于待遗忘数据的数据信息，在所述多个样本集中确定待更新样本集，...

【技术保护点】

【技术特征摘要】
1.一种基于隐私保护机器遗忘算法的推荐模型生成方法，其特征在于，包括：获取多个模型，其中，所述多个模型基于多个样本集对初始推荐模型训练获得，所述多个样本集通过划分待训练样本集获得；基于待遗忘数据的数据信息，在所述多个样本集中确定待更新样本集，并删除所述待更新样本集中的待遗忘数据，确定第一样本集；基于所述第一样本集，训练所述初始推荐模型，获得第一推荐模型；聚合所述第一推荐模型的模型参数和第二推荐模型的模型参数，其中，所述第二推荐模型为除所述待更新样本集以外的其他样本集训练的模型；基于聚合后的模型参数生成目标推荐模型。2.根据权利要求1所述的方法，其特征在于，所述基于待遗忘数据的数据信息，在所述多个样本集中确定待更新样本集，包括：响应于数据遗忘指令，获取待遗忘数据的数据信息；基于所述数据信息在所述多个样本集中，确定所述待遗忘数据所在的样本集为待更新样本集。3.根据权利要求1所述的方法，其特征在于，所述获取多个模型之前，还包括：获取待训练样本集；基于所述待训练样本集中的用户信息，划分所述待训练样本集，获得多个样本集；基于所述多个样本集分别对初始推荐模型进行训练，获得多个模型。4.根据权利要求3所述的方法，其特征在于，所述基于所述待训练样本集中的用户信息，划分所述待训练样本，获得多个样本集，包括：对所述待训练样本集中的数据内容进行格式转换，确定交互矩阵向量；基于所述待训练样本集中的用户信息，对所述交互矩阵向量进行聚类处理，获得多个样本集；其中，所述样本集中包括用户信息向量、项目信息向量、所述用户信息向量与所述项目信息向量之间的关联信息向量。5.根据权利要求1所述的方法，其特征在于，所述聚合所述第一模型参数和所述第二推荐模型中的第二模型参数，包括：提取所述第二推荐模型中的模型参数，获得第二模型参数；基于注意力机制，聚合所述第一模型参数和所述第二模型参数。6.根据权利要求5所述的方法，其特征在于，所述基于注意力机制，聚...

【专利技术属性】
技术研发人员：郑小林，陈超超，李宇渊，刘俊麟，
申请(专利权)人：杭州金智塔科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人