推荐模型更新方法、推荐模型训练方法及计算设备技术

技术编号:35024052 阅读:22 留言:0更新日期:2022-09-24 22:54
本说明书实施例提供一种推荐模型更新方法、推荐模型训练方法及计算设备,其中,推荐模型更新方法包括:获取数据删除请求;获取基于多个训练分组进行分别训练得到的多个推荐模型;根据数据标志,从多个训练分组中确定包括特定数据的第一训练分组;从第一训练分组中删除特定数据,得到更新分组,并利用更新分组对第一推荐模型再次进行训练;利用再次训练后的第一推荐模型和第二推荐模型,针对用户进行对象推荐。在获取到数据删除请求时,只需从第一训练分组中删除特定数据,然后利用更新分组对相应的第一推荐模型再次进行训练,根据再次训练后的第一推荐模型和其他推荐模型,针对用户进行对象推荐,提高了推荐模型更新的效率。提高了推荐模型更新的效率。提高了推荐模型更新的效率。

【技术实现步骤摘要】
推荐模型更新方法、推荐模型训练方法及计算设备


[0001]本说明书实施例涉及人工智能
,特别涉及一种推荐模型更新方法和推荐模型训练方法。

技术介绍

[0002]随着互联网技术的飞速发展,整个社会都被推入“大数据”时代。不管人们是否愿意,我们的个人数据正在不经意间被搜集并使用。个人数据的网络化和透明化已经成为不可阻挡的大趋势。企业可以通过数据挖掘和机器学习从中获得大量有价值的信息。而推荐系统,在互联网服务中就是依赖于学习大量的用户数据,用户兴趣爱好的精准建模,从而提供个性化的服务。然而,随着最近一些数据隐私保护法案的推进,赋予了用户“被删除的权力”,要求系统能够消除数据所有者要求删除的数据及其带来的影响。在一些场景下,推荐系统也需要能够删除某些敏感数据以及从这些数据中学到的参数。
[0003]一般情况下,为了消除某一部分数据,最直接的方法是在推荐模型中用去除要删除数据后的训练集重新训练模型。然而在大规模显示数据下,重训模型需要巨大的计算开销。因此,亟需一种高效的推荐模型更新的方案。

技术实现思路

[0004]有鉴于此,本说明书实施例提供了一种推荐模型更新方法,一种推荐模型训练方法。本说明书一个或者多个实施例同时涉及一种推荐模型更新装置,一种推荐模型训练装置,一种计算设备以及一种计算机可读存储介质,以解决现有技术中存在的技术缺陷。
[0005]根据本说明书实施例的第一方面,提供了一种推荐模型更新方法,包括:
[0006]获取数据删除请求,其中,数据删除请求携带特定数据的数据标志;
[0007]获取多个推荐模型,其中,多个推荐模型是基于多个训练分组进行分别训练得到的,多个训练分组中的每一个包括基于用户行为数据的特征信息聚类得到的用户行为数据集合;
[0008]根据数据标志,从多个训练分组中确定包括特定数据的第一训练分组,其中,第一训练分组用于训练多个推荐模型中的第一推荐模型;
[0009]从第一训练分组中删除特定数据,得到更新分组,并利用更新分组对第一推荐模型再次进行训练;
[0010]利用再次训练后的第一推荐模型和第二推荐模型,针对用户进行对象推荐,其中,第二推荐模型为多个推荐模型中除第一推荐模型以外的推荐模型。
[0011]根据本说明书实施例的第二方面,提供了一种推荐模型训练方法,包括:
[0012]获取训练数据集,其中,训练数据集包括多个用户行为数据;
[0013]根据多个用户行为数据的特征信息,聚类得到多个用户行为数据集合;
[0014]根据多个用户行为数据集合,对训练数据集进行分组,得到多个训练分组;
[0015]针对任一训练分组,利用该训练分组训练得到对应的推荐模型。
[0016]根据本说明书实施例的第三方面,提供了一种推荐模型更新装置,包括:
[0017]第一获取模块,被配置为获取数据删除请求,其中,数据删除请求携带特定数据的数据标志;
[0018]第二获取模块,被配置为获取多个推荐模型,其中,多个推荐模型是基于多个训练分组进行分别训练得到的,多个训练分组中的每一个包括基于用户行为数据的特征信息聚类得到的用户行为数据集合;
[0019]确定模块,被配置为根据数据标志,从多个训练分组中确定包括特定数据的第一训练分组,其中,第一训练分组用于训练多个推荐模型中的第一推荐模型;
[0020]数据删除模块,被配置为从第一训练分组中删除特定数据,得到更新分组,并利用更新分组对第一推荐模型再次进行训练;
[0021]推荐模块,被配置为利用再次训练后的第一推荐模型和第二推荐模型,针对用户进行对象推荐,其中,第二推荐模型为多个推荐模型中除第一推荐模型以外的推荐模型。
[0022]根据本说明书实施例的第四方面,提供了一种推荐模型训练装置,包括:
[0023]第三获取模块,被配置为获取训练数据集,其中,训练数据集包括多个用户行为数据;
[0024]聚类模块,被配置为根据多个用户行为数据的特征信息,聚类得到多个用户行为数据集合;
[0025]分组模块,被配置为根据多个用户行为数据集合,对训练数据集进行分组,得到多个训练分组;
[0026]训练模块,被配置为针对任一训练分组,利用该训练分组训练得到对应的推荐模型。
[0027]根据本说明书实施例的第五方面,提供了一种计算设备,包括:
[0028]存储器和处理器;
[0029]存储器用于存储计算机可执行指令,处理器用于执行计算机可执行指令,该计算机可执行指令被处理器执行时实现上述推荐模型更新方法或者推荐模型训练方法。
[0030]根据本说明书实施例的第六方面,提供了一种计算机可读存储介质,其存储有计算机可执行指令,该计算机可执行指令被处理器执行时实现上述推荐模型更新方法或者推荐模型训练方法。
[0031]本说明书一个实施例通过获取数据删除请求;获取多个推荐模型,其中,多个推荐模型是基于多个训练分组进行分别训练得到的;根据数据标志,从多个训练分组中确定包括特定数据的第一训练分组;从第一训练分组中删除特定数据,得到更新分组,并利用更新分组对第一推荐模型再次进行训练;利用再次训练后的第一推荐模型和第二推荐模型,针对用户进行对象推荐。在获取到数据删除请求时,只需从第一训练分组中删除特定数据,然后利用更新分组对相应的第一推荐模型再次进行训练,根据再次训练后的第一推荐模型和其他推荐模型,针对用户进行对象推荐,提高了推荐模型更新的效率。
附图说明
[0032]图1a是本说明书一个实施例提供的一种应用推荐模型更新方法的系统交互流程图;
[0033]图1b是本说明书一个实施例提供的一种推荐模型更新方法的前端显示示意图;
[0034]图2是本说明书一个实施例提供的一种推荐模型更新方法的流程图;
[0035]图3是本说明书一个实施例提供的一种推荐模型更新方法的框架示意图;
[0036]图4是本说明书一个实施例提供的一种推荐模型训练方法的流程图;
[0037]图5是本说明书一个实施例提供的一种推荐模型更新装置的结构示意图;
[0038]图6是本说明书一个实施例提供的一种推荐模型训练装置的结构示意图;
[0039]图7是本说明书一个实施例提供的一种计算设备的结构框图。
具体实施方式
[0040]在下面的描述中阐述了很多具体细节以便于充分理解本说明书。但是本说明书能够以很多不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本说明书内涵的情况下做类似推广,因此本说明书不受下面公开的具体实施的限制。
[0041]在本说明书一个或多个实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本说明书一个或多个实施例。在本说明书一个或多个实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本说明书一个或多个实施例中使用的术语“和/本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种推荐模型更新方法,包括:获取数据删除请求,其中,所述数据删除请求携带特定数据的数据标志;获取多个推荐模型,其中,所述多个推荐模型是基于多个训练分组进行分别训练得到的,所述多个训练分组中的每一个包括基于用户行为数据的特征信息聚类得到的用户行为数据集合;根据所述数据标志,从所述多个训练分组中确定包括所述特定数据的第一训练分组,其中,所述第一训练分组用于训练所述多个推荐模型中的第一推荐模型;从所述第一训练分组中删除所述特定数据,得到更新分组,并利用所述更新分组对所述第一推荐模型再次进行训练;利用再次训练后的所述第一推荐模型和第二推荐模型,针对用户进行对象推荐,其中,所述第二推荐模型为所述多个推荐模型中除所述第一推荐模型以外的推荐模型。2.根据权利要求1所述的方法,在所述获取数据删除请求之前,还包括:获取训练数据集,其中,所述训练数据集包括多个用户行为数据;根据所述多个用户行为数据的特征信息,聚类得到多个用户行为数据集合;根据所述多个用户行为数据集合,对所述训练数据集进行分组,得到多个训练分组;针对任一训练分组,利用该训练分组训练得到对应的推荐模型。3.根据权利要求2所述的方法,所述获取训练数据集,包括:根据用户标识,从用户行为日志中提取各用户对应的用户行为数据,其中,所述用户行为日志中记录了用户标识与用户行为数据的对应关系;基于所述用户行为数据,构建训练数据集。4.根据所述权利要求2或3所述的方法,所述根据所述多个用户行为数据的特征信息,聚类得到多个用户行为数据集合,包括:根据所述多个用户行为数据的特征信息,计算各用户行为数据之间的距离;根据所述各用户行为数据之间的距离,使用中心聚类方法,对所述多个用户行为数据进行聚类,得到多个用户行为数据集合。5.根据权利要求4所述的方法,所述特征信息包括用户向量表示和行为对象向量表示;所述根据所述多个用户行为数据的特征信息,计算各用户行为数据之间的距离,包括:根据第一用户行为数据的用户向量表示和第二用户行为数据的用户向量表示,计算所述第一用户行为数据和所述第二用户行为数据的用户向量距离,其中,所述第一用户行为数据和所述第二用户行为数据为任意两个不同的用户行为数据;根据所述第一用户行为数据的行为对象向量表示和所述第二用户行为数据的行为对象向量表示,计算所述第一用户行为数据和所述第二用户行为数据的行为对象向量距离;根据所述用户向量距离和所述行为对象向量距离,确定所述第一用户行为数据和所述第二用户行为数据之间的距离。6.根据权利要求4所述的方法,所述根据所述各用户行为数据之间的距离,使用中心聚类方法,对所述多个用户行为数据进行聚类,得到多个用户行为数据集合,包括:确定多个用户...

【专利技术属性】
技术研发人员:孙飞丁博麟
申请(专利权)人:阿里巴巴中国有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1