【技术实现步骤摘要】
一种推荐模型的训练方法、推荐方法及推荐系统
[0001]本专利技术涉及机器学习和数据挖掘领域,特别涉及一种推荐模型的训练方法、推荐方法、推荐系统、电子设备及计算机程序产品。
技术介绍
[0002]对于许多在线平台,包括电子商务、流媒体、社交网络等,推荐系统起到核心作用。现有的推荐模型大多遵循监督学习的范式,将用户的历史上的互动(隐式反馈如点击和购买)作为标记数据,通过拟合标记数据来学习用户
‑
物品的相关性。现有技术通常通过点损失和成对损失用于优化推荐模型的参数,然而这些标准的损失函数很容易受到观察数据中固有的偏差的影响。交互数据通常呈现出关于物品流行度的长尾分布,也就是说,少数流行物品占据了大多数交互。主流的损失函数只关注历史数据的恢复、不考虑偏差效应,当用这些损失函数构建推荐系统时,少数热门物品会占据越来越多的曝光机会,严重损害了小众物品的推荐质量。现有技术中,为了解决上述问题,通常的做法是利用反倾向性得分(Inverse Propensity Score,IPS),它通过倾向性得分(即曝光概率)对每个数 ...
【技术保护点】
【技术特征摘要】
1.一种推荐模型的训练方法,包括:获取训练样本数据,其中,所述训练样本数据包括用户
‑
物品对,所述用户
‑
物品对包括用户信息、物品信息以及用户和物品的交互信息;构建基于交叉配对排序算法的推荐模型并初始化所述推荐模型的参数;利用所述推荐模型处理所述训练样本数据,根据无偏性的损失函数优化所述推荐模型的参数,获得训练完成的推荐模型;其中,所述无偏性的损失函数由式(1)表示:其中,所述无偏性的损失函数由式(1)表示:其中,k表示所述训练样本数据中具有交互关系的用户
‑
物品对个数,u
k
表示第k个用户,i
k
表示第k个物品,表示第k个用户和第k个物品的相关性分值,是所述训练样本数据,σ是所述推荐模型的激活函数。2.根据权利要求1所述的方法,其中所述由式(2)表示:其中,表示第m个用户和第n个物品有交互关系,表示第m个用户和第n个物品没有交互关系。3.根据权利要求1所述的方法,其中,所述无偏的损失函数由式(3)和式(4)进行限定:P(Y
u,i
=1)=P(R
u,i
=1)P(O
u,i
=1|R
u,i
=1)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(3),P(Q
u,i
=1|R
u,i
=1)=p
u
·
p
i
·
P(R
u,i
=1)
α
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(4),其中,R
u,i
=1表示用户u喜欢物品i,O
u,i
=1表示用户u能够看见物品i,Y
u,i
=R
u,i
·
O
u,i
,P(R
u,i
=1)是相关性概率,P(O
u,i
=1|R
u,i
=1)是曝光率;α是一个正常数。4.根据权利要求3所述的方法,其中,所述曝光...
【专利技术属性】
技术研发人员:何向南,万琪,王翔,吴剑灿,
申请(专利权)人:中国科学技术大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。