【技术实现步骤摘要】
一种推荐模型的训练方法、介质、电子设备和推荐模型
本专利技术涉及数据处理
,具体来说涉及推荐
,更具体地说,涉及一种推荐模型的训练方法、介质、电子设备和推荐模型。
技术介绍
推荐系统是互联网发展的重要增长引擎,已被广泛应用于诸如电商推荐、电影推荐、新闻推荐、音乐推荐等众多场景。推荐系统为用户从海量的物品中推荐其可能感兴趣的物品,帮助用户在信息过载的情况下高效地做出决策。随着推荐系统的广泛应用,推荐系统的公平性逐渐引起关注。由于种种原因,现实中的用户与物品的历史交互数据不可避免地存在不均衡和偏置现象。例如,新用户和中老年人用户因过去在推荐系统中不活跃,商品交互记录数据稀疏;小众爱好者偏好的小众商品在大部分用户的交互记录中都未曾出现过等等。这种情况下,仅依靠一个总体目标损失的数据驱动训练策略,很有可能导致模型牺牲少数群体的推荐准确率以保证总体推荐准确率,从而产生不公平的推荐结果。然而,提升少数群体的用户体验满意度,尤其新用户以及中老年用户的推荐体验,对平台的扩展、用户留存等十分重要。构建公平的推荐系统 ...
【技术保护点】
1.一种推荐模型的训练方法,其特征在于,包括:/nA1、构建推荐模型、损失构建模块和多目标优化模块;/nA2、获取不同用户的商品交互记录,根据用户属性设置不同的用户组;/nA3、利用商品交互记录对推荐模型进行多次迭代训练至收敛,其中,每次训练包括:/nA31、用推荐模型从本次获取的商品交互记录中学习用户对商品的决策过程,获取用户对所有商品的偏好概率;/nA32、基于用户对所有商品的偏好概率,损失构建模块构建第一损失函数用于计算针对不同用户的推荐准确性损失以及构建连续可微的第二损失函数用于计算针对不同的用户组的推荐公平性损失;/nA33、多目标优化模块根据推荐准确性损失和推荐 ...
【技术特征摘要】
1.一种推荐模型的训练方法,其特征在于,包括:
A1、构建推荐模型、损失构建模块和多目标优化模块;
A2、获取不同用户的商品交互记录,根据用户属性设置不同的用户组;
A3、利用商品交互记录对推荐模型进行多次迭代训练至收敛,其中,每次训练包括:
A31、用推荐模型从本次获取的商品交互记录中学习用户对商品的决策过程,获取用户对所有商品的偏好概率;
A32、基于用户对所有商品的偏好概率,损失构建模块构建第一损失函数用于计算针对不同用户的推荐准确性损失以及构建连续可微的第二损失函数用于计算针对不同的用户组的推荐公平性损失;
A33、多目标优化模块根据推荐准确性损失和推荐公平性损失确定推荐模型的参数更新方向并据此更新推荐模型的参数。
2.根据权利要求1所述的推荐模型的训练方法,其特征在于,所述推荐模型包括信息获取模块、变分自编码器、重参数化模块和解码器,其中,所述步骤A31包括:
A311、用信息获取模块获取预先设置的用户的潜在偏好向量的先验分布、商品的簇隶属度矩阵的先验分布;
A312、用变分自编码器从本次获取的商品交互记录中学习用户对商品的决策过程,得到对先验分布通过变分推断修正后的用户的潜在偏好向量的后验分布、商品的簇隶属度矩阵的后验分布以及商品的潜在向量;
A313、用重参数化模块利用重参数化技巧对用户的潜在偏好向量的后验分布、商品的簇隶属度矩阵的后验分布分别进行采样,得到用户的潜在偏好向量和商品的簇隶属度矩阵;
A314、用解码器根据用户的潜在偏好向量和商品的簇隶属度矩阵以及商品的潜在向量获取用户对所有商品的偏好概率。
3.根据权利要求1所述的推荐模型的训练方法,其特征在于,步骤A33包括:
A331、根据推荐准确性损失计算推荐模型参数更新的第一梯度,根据推荐公平性损失计算推荐模型参数更新的第二梯度,基于第一梯度和第二梯度动态确定第一梯度的第一权重和第二梯度的第二权重;
A332、获取第一权重乘以第一梯度加上第二权重乘以第二梯度的加权和作为推荐模型的参数更新的方向。
4.根据权利要求1所述的推荐模型的训练方法,其特征在于,确定推荐模型是否训练至收敛的方式为:如果加权和的范数小于给定误差阈值或者迭代次数超过预定迭代次数上限,则推荐模型已训练至收敛。
5.根据权利要求1至4任一项所述的推荐模型的训练方法,其特征在于,第一损失函数为:
其中,u表示用户u,N表示用户数量,i表示商品i,xui=1表示用户u与商品i有正反馈,K表示簇的数量,D表示商品的潜在向量的维度,σuj表示正态分布的方差...
【专利技术属性】
技术研发人员:许倩倩,郝前秀,杨智勇,黄庆明,
申请(专利权)人:中国科学院计算技术研究所,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。