推荐模型更新方法、推荐模型训练方法及计算设备技术

技术编号：35024052 阅读：22 留言：0更新日期：2022-09-24 22:54

本说明书实施例提供一种推荐模型更新方法、推荐模型训练方法及计算设备，其中，推荐模型更新方法包括：获取数据删除请求；获取基于多个训练分组进行分别训练得到的多个推荐模型；根据数据标志，从多个训练分组中确定包括特定数据的第一训练分组；从第一训练分组中删除特定数据，得到更新分组，并利用更新分组对第一推荐模型再次进行训练；利用再次训练后的第一推荐模型和第二推荐模型，针对用户进行对象推荐。在获取到数据删除请求时，只需从第一训练分组中删除特定数据，然后利用更新分组对相应的第一推荐模型再次进行训练，根据再次训练后的第一推荐模型和其他推荐模型，针对用户进行对象推荐，提高了推荐模型更新的效率。提高了推荐模型更新的效率。提高了推荐模型更新的效率。

全部详细技术资料下载

【技术实现步骤摘要】
推荐模型更新方法、推荐模型训练方法及计算设备

[0001]本说明书实施例涉及人工智能
，特别涉及一种推荐模型更新方法和推荐模型训练方法。

技术介绍

[0002]随着互联网技术的飞速发展，整个社会都被推入“大数据”时代。不管人们是否愿意，我们的个人数据正在不经意间被搜集并使用。个人数据的网络化和透明化已经成为不可阻挡的大趋势。企业可以通过数据挖掘和机器学习从中获得大量有价值的信息。而推荐系统，在互联网服务中就是依赖于学习大量的用户数据，用户兴趣爱好的精准建模，从而提供个性化的服务。然而，随着最近一些数据隐私保护法案的推进，赋予了用户“被删除的权力”，要求系统能够消除数据所有者要求删除的数据及其带来的影响。在一些场景下，推荐系统也需要能够删除某些敏感数据以及从这些数据中学到的参数。
[0003]一般情况下，为了消除某一部分数据，最直接的方法是在推荐模型中用去除要删除数据后的训练集重新训练模型。然而在大规模显示数据下，重训模型需要巨大的计算开销。因此，亟需一种高效的推荐模型更新的方案。

技术实现思路

[0004]有鉴于此，本说明书实施例提供了一种推荐模型更新方法，一种推荐模型训练方法。本说明书一个或者多个实施例同时涉及一种推荐模型更新装置，一种推荐模型训练装置，一种计算设备以及一种计算机可读存储介质，以解决现有技术中存在的技术缺陷。
[0005]根据本说明书实施例的第一方面，提供了一种推荐模型更新方法，包括：
[0006]获取数据删除请求，其中，数据删除请求携带特定数据的数据标...

【技术保护点】

【技术特征摘要】
1.一种推荐模型更新方法，包括：获取数据删除请求，其中，所述数据删除请求携带特定数据的数据标志；获取多个推荐模型，其中，所述多个推荐模型是基于多个训练分组进行分别训练得到的，所述多个训练分组中的每一个包括基于用户行为数据的特征信息聚类得到的用户行为数据集合；根据所述数据标志，从所述多个训练分组中确定包括所述特定数据的第一训练分组，其中，所述第一训练分组用于训练所述多个推荐模型中的第一推荐模型；从所述第一训练分组中删除所述特定数据，得到更新分组，并利用所述更新分组对所述第一推荐模型再次进行训练；利用再次训练后的所述第一推荐模型和第二推荐模型，针对用户进行对象推荐，其中，所述第二推荐模型为所述多个推荐模型中除所述第一推荐模型以外的推荐模型。2.根据权利要求1所述的方法，在所述获取数据删除请求之前，还包括：获取训练数据集，其中，所述训练数据集包括多个用户行为数据；根据所述多个用户行为数据的特征信息，聚类得到多个用户行为数据集合；根据所述多个用户行为数据集合，对所述训练数据集进行分组，得到多个训练分组；针对任一训练分组，利用该训练分组训练得到对应的推荐模型。3.根据权利要求2所述的方法，所述获取训练数据集，包括：根据用户标识，从用户行为日志中提取各用户对应的用户行为数据，其中，所述用户行为日志中记录了用户标识与用户行为数据的对应关系；基于所述用户行为数据，构建训练数据集。4.根据所述权利要求2或3所述的方法，所述根据所述多个用户行为数据的特征信息，聚类得到多个用户行为数据集合，包括：根据所述多个用户行为数据的特征信息，计算各用户行为数据之间的距离；根据所述各用户行为数据之间的距离，使用中心聚类方法，对所述多个用户行为数据进行聚类，得到多个用户行为数据集合。5.根据权利要求4所述的方法，所述特征信息包括用户向量表示和行为对象向量表示；所述根据所述多个用户行为数据的特征信息，计算各用户行为数据之间的距离，包括：根据第一用户行为数据的用户向量表示和第二用户行为数据的用户向量表示，计算所述第一用户行为数据和所述第二用户行为数据的用户向量距离，其中，所述第一用户行为数据和所述第二用户行为数据为任意两个不同的用户行为数据；根据所述第一用户行为数据的行为对象向量表示和所述第二用户行为数据的行为对象向量表示，计算所述第一用户行为数据和所述第二用户行为数据的行为对象向量距离；根据所述用户向量距离和所述行为对象向量距离，确定所述第一用户行为数据和所述第二用户行为数据之间的距离。6.根据权利要求4所述的方法，所述根据所述各用户行为数据之间的距离，使用中心聚类方法，对所述多个用户行为数据进行聚类，得到多个用户行为数据集合，包括：确定多个用户...

【专利技术属性】
技术研发人员：孙飞，丁博麟，
申请(专利权)人：阿里巴巴中国有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人