基于用户表现公平性训练推荐模型的方法及装置制造方法及图纸

技术编号:38316425 阅读:12 留言:0更新日期:2023-07-29 08:58
本说明书提供基于用户表现公平性训练推荐模型的方法及装置,其中基于用户表现公平性训练推荐模型的方法包括:确定目标用户,以及与目标用户相似的关联用户;基于目标用户的目标行为数据和关联用户的关联行为数据生成差异信息,并基于差异信息构建第一损失函数;利用目标用户对应的推荐模型对目标行为数据和关联行为数据进行处理,根据处理结果和第一损失函数计算第一损失值,以及根据处理结果和推荐模型对应的第二损失函数计算第二损失值;根据第一损失值和第二损失值对推荐模型进行调参,直至获得满足训练停止条件的目标推荐模型。对推荐模型进行训练时,考虑目标用户和关联用户之间的差异性,提高为用户进行推荐的公平性。平性。平性。

【技术实现步骤摘要】
基于用户表现公平性训练推荐模型的方法及装置


[0001]本说明书涉及计算机
,特别涉及一种基于用户表现公平性训练推荐模型的方法。本说明书同时涉及一种基于用户表现公平性训练推荐模型的装置,一种基于用户表现公平性训练商品推荐模型的方法,一种基于用户表现公平性训练商品推荐模型的装置,一种计算设备,以及一种计算机可读存储介质。

技术介绍

[0002]随着计算机技术的发展,电商进入人们的视野,逐渐成为了人们工作和生活中不可获取的一部分。然而为了提高用户的购物体验,通常会根据用户的喜好为用户进行商品推荐。在音视频应用程序中,也会根据用户的偏好为用户推荐音视频。
[0003]现有技术中,通过会基于用户的行为数据训练推荐模型,从而精准的为用户推荐用户可能会喜欢的商品、音视频。然而针对行为数据较少的新用户或活跃度地的用户,则无法完成推荐任务。推荐模型会偏向于行为数据丰富以及活跃度较高的用户,为此类用户进行推荐的准确度较高,无法保证推荐的公平性,无法为不同用户提供平等质量的推荐结果。因此,亟需一种较为有效的方法以解决上述问题。

技术实现思路

[0004]有鉴于此,本说明书实施例提供了一种基于用户表现公平性训练推荐模型的方法。本说明书同时涉及一种基于用户表现公平性训练推荐模型的装置,一种基于用户表现公平性训练商品推荐模型的方法,一种基于用户表现公平性训练商品推荐模型的装置,一种计算设备,以及一种计算机可读存储介质,以解决现有技术中存在的技术缺陷。
[0005]根据本说明书实施例的第一方面,提供了一种基于用户表现公平性训练推荐模型的方法,包括:确定目标用户,以及与所述目标用户相似的关联用户;基于所述目标用户的目标行为数据和所述关联用户的关联行为数据生成差异信息,并基于所述差异信息构建第一损失函数;利用所述目标用户对应的推荐模型对所述目标行为数据和所述关联行为数据进行处理,根据处理结果和所述第一损失函数计算第一损失值,以及根据处理结果和所述推荐模型对应的第二损失函数计算第二损失值;根据所述第一损失值和所述第二损失值对所述推荐模型进行调参,直至获得满足训练停止条件的目标推荐模型。
[0006]可选地,所述确定目标用户,以及与所述目标用户相似的关联用户,包括:确定推荐业务对应的用户集合;在所述用户集合中选择行为数据量小于预设的行为数据量阈值的用户,作为目标用户;在所述用户集合中选择与所述目标用户匹配的用户,作为关联用户,其中,所述关
联用户的行为数据量大于等于所述行为数据量阈值。
[0007]可选地,所述在所述用户集合中选择与所述目标用户匹配的用户,作为关联用户,包括:确定所述目标用户的目标行为数据;在所述用户集合中选择用户数据量大于所述行为数据量阈值的待选择用户组;分别计算所述待选择用户组中每个待选择用户的用户行为数据和所述目标行为数据之间的相似度分值;基于每个待选择用户对应的相似度分值在所述待选择用户组中确定与所述目标用户匹配的关联用户。
[0008]可选地,所述基于所述目标用户的目标行为数据和所述关联用户的关联行为数据生成差异信息,并基于所述差异信息构建第一损失函数,包括:构建所述目标用户的目标行为数据对应的目标向量,以及构建所述关联用户的关联行为数据对应的关联向量;计算所述目标向量和所述关联向量之间的向量差异,并基于所述向量差异生成差异信息;基于所述差异信息和所述目标用户的数量构建第一损失函数。
[0009]可选地,所述差异信息通过下述公式生成:其中,表示目标用户;表示与目标用户相似的关联用户组成的关联用户集合;表示目标用户的目标行为数据的嵌入特征表示;表示关联用户集合中任意一个关联用户;表示关联用户集合中关联用户的关联行为数据的嵌入特征表示;表示对给定向量集合进行按位平均计算;所述第一损失函数通过下述公式构建:其中,表示至少一个目标用户组成的目标用户集合中目标用户的数量;表示第一损失函数。
[0010]可选地,所述利用所述目标用户对应的推荐模型对所述目标行为数据和所述关联行为数据进行处理,根据处理结果和所述第一损失函数计算第一损失值,以及根据处理结果和所述推荐模型对应的第二损失函数计算第二损失值,包括:对所述目标行为数据和所述关联行为数据进行组合,根据组合结果确定行为数据集合;在所述行为数据集合中选择目标样本,并确定所述目标样本的样本标签;将所述目标样本输入所述目标用户对应的推荐模型,获得预测数据;基于所述预测数据、所述样本标签和所述第一损失函数计算第一损失值;基于所述预测数据、所述样本标签和所述第二损失函数计算第二损失值。
[0011]可选地,所述根据所述第一损失值和所述第二损失值对所述推荐模型进行调参,直至获得满足训练停止条件的目标推荐模型,包括:
根据所述第一损失值和所述第二损失值对所述推荐模型进行调参;在调参后的推荐模型不满足所述训练停止条件的情况下,执行所述在所述行为数据集合中选择目标样本的步骤;在调参后的推荐模型满足所述训练停止条件的情况下,将调参后的推荐模型作为目标推荐模型。
[0012]可选地,所述根据所述第一损失值和所述第二损失值对所述推荐模型进行调参,包括:确定所述第一损失函数对应的超参数;基于所述超参数、所述第一损失值和所述第二损失值确定目标损失值,并基于所述目标损失值对所述推荐模型进行调参。
[0013]可选地,所述方法,还包括:确定商品推荐任务关联的待推荐用户;将所述待推荐用户对应的推荐行为数据输入至所述目标推荐模型,获得所述待推荐用户的推荐商品信息。
[0014]根据本说明书实施例的第二方面,提供了一种基于用户表现公平性训练推荐模型的装置,包括:确定模块,被配置为确定目标用户,以及与所述目标用户相似的关联用户;生成模块,被配置为基于所述目标用户的目标行为数据和所述关联用户的关联行为数据生成差异信息,并基于所述差异信息构建第一损失函数;处理模块,被配置为利用所述目标用户对应的推荐模型对所述目标行为数据和所述关联行为数据进行处理,根据处理结果和所述第一损失函数计算第一损失值,以及根据处理结果和所述推荐模型对应的第二损失函数计算第二损失值;训练模块,被配置为根据所述第一损失值和所述第二损失值对所述推荐模型进行调参,直至获得满足训练停止条件的目标推荐模型。
[0015]根据本说明书实施例的第三方面,提供了一种推荐方法,包括:获取待推荐用户提交的浏览请求;根据所述浏览请求确定所述待推荐用户的对象行为数据,将所述对象行为数据输入至目标推荐模型进行处理,获得对象推荐信息;根据所述对象推荐信息生成对象推荐页面,作为所述浏览请求的响应。
[0016]根据本说明书实施例的第四方面,提供了一种推荐装置,包括:获取模块,被配置为获取待推荐用户提交的浏览请求;处理模块,被配置为根据所述浏览请求确定所述待推荐用户的对象行为数据,将所述对象行为数据输入至目标推荐模型进行处理,获得对象推荐信息;生成模块,被配置为根据所述对象推荐信息生成对象推荐页面,作为所述浏览请求的响应。
[0017]根据本说明书实施例的第五方面,提供了一本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于用户表现公平性训练推荐模型的方法,其特征在于,包括:确定目标用户,以及与所述目标用户相似的关联用户;基于所述目标用户的目标行为数据和所述关联用户的关联行为数据生成差异信息,并基于所述差异信息构建第一损失函数;利用所述目标用户对应的推荐模型对所述目标行为数据和所述关联行为数据进行处理,根据处理结果和所述第一损失函数计算第一损失值,以及根据处理结果和所述推荐模型对应的第二损失函数计算第二损失值;根据所述第一损失值和所述第二损失值对所述推荐模型进行调参,直至获得满足训练停止条件的目标推荐模型。2.根据权利要求1所述的方法,其特征在于,所述确定目标用户,以及与所述目标用户相似的关联用户,包括:确定推荐业务对应的用户集合;在所述用户集合中选择行为数据量小于预设的行为数据量阈值的用户,作为目标用户;在所述用户集合中选择与所述目标用户匹配的用户,作为关联用户,其中,所述关联用户的行为数据量大于等于所述行为数据量阈值。3.根据权利要求2所述的方法,其特征在于,所述在所述用户集合中选择与所述目标用户匹配的用户,作为关联用户,包括:确定所述目标用户的目标行为数据;在所述用户集合中选择用户数据量大于所述行为数据量阈值的待选择用户组;分别计算所述待选择用户组中每个待选择用户的用户行为数据和所述目标行为数据之间的相似度分值;基于每个待选择用户对应的相似度分值在所述待选择用户组中确定与所述目标用户匹配的关联用户。4.根据权利要求1所述的方法,其特征在于,所述基于所述目标用户的目标行为数据和所述关联用户的关联行为数据生成差异信息,并基于所述差异信息构建第一损失函数,包括:构建所述目标用户的目标行为数据对应的目标向量,以及构建所述关联用户的关联行为数据对应的关联向量;计算所述目标向量和所述关联向量之间的向量差异,并基于所述向量差异生成差异信息;基于所述差异信息和所述目标用户的数量构建第一损失函数。5.根据权利要求1

4任一项所述的方法,其特征在于,所述差异信息通过下述公式生成:其中,表示目标用户;表示与目标用户相似的关联用户组成的关联用户集合;表示目标用户的目标行为数据的嵌入特征表示;表示关联用户集合中任意一个关联用户;
表示关联用户集合中关联用户的关联行为数据的嵌入特征表示;表示对给定向量集合进行按位平均计算;所述第一损失函数通过下述公式构建:其中,
ꢀꢀ
表示至少一个目标用户组成的目标用户集合中目标用户的数量;表示第一损失函数。6.根据权利要求1所述的方法,其特征在于,所述利用所述目标用户对应的推荐模型对所述目标行为数据和所述关联行为数据进行处理,根据处理结果和所述第一损失函数计算第一损失值,以及根据处理结果和所述推荐模型对应的第二损失函数计算第二损失值,包括:对所述目标行为数据和所述关联行为数据进行组合,根据组合结果确定行为数据集合;在所述行为数据集合中选择目标样本,并确定所述目标样本的样本标签;将所述目标样本输入所述目标用户对应的推荐模型,获得预测数据;基于所述预测数据、所述样本标签和所述第一损失函数计算第一损失值;基于所述预测数据、所述样本标签和所述第二损失函数计算第二损失值。7.根据权利要求6所述的方法,其特征在于,所述根据所述第一损失值和所述第二损失值对所述推荐模型进行调参,直至获得满足训练停止条件的目标推荐模型,包括:根据所述第一损失值和所述第二损失值对所述推荐模型进行调参;在调参后的推荐模型不满足所述训练停止条件的情况下,执行所述在所述行为数据集合中选择目标样本的步骤;在调参后的推荐模型满足所述训练停止条件的情况下,将调参后的推荐模型作为目标推荐模型。8.根据权利要求1所述的方法,其特征在于,所述根据所述第一损失值和所述第二损失值对所述推荐模型进行调参,包括:确定所述第一损失函数对应的超参数;基于所述超参数、所述第一损失值和所述第二损失值确定目标损失值,并基于所述目标损失值对所述推荐模型进行调参。9.根据权利要求1所述的方法,其特征在于,所述方法,还包括:确定商品推荐任务关联的待推荐用户;将所述待推荐用户对应的推荐行为数据输入至所述目标推荐模型,获得所述待推荐用...

【专利技术属性】
技术研发人员:郑小林陈超超韩钟萱
申请(专利权)人:杭州金智塔科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1