面向隐式反馈推荐系统的负样本采样及训练方法技术方案

技术编号:33425999 阅读:29 留言:0更新日期:2022-05-19 00:17
本发明专利技术公开了面向隐式反馈推荐系统的负样本采样及训练方法,该方法从未交互的物品集合中采样作为负样本,并基于采样的中间结果,估计正样本在模型中的排序,设计全新的损失函数,加快模型的收敛,提升模型的效果。提升模型的效果。

【技术实现步骤摘要】
面向隐式反馈推荐系统的负样本采样及训练方法


[0001]本专利技术涉及机器学习及推荐系统
,具体地,涉及一种面向隐式反馈推荐系统的负样本采样及训练方法。

技术介绍

[0002]推荐系统在解决信息过载问题中起到了非常重要的作用,它能够帮助用户快速找到感兴趣的物品。其中,根据用户反馈形式的不同,推荐系统可以被分为显式反馈推荐系统和隐式反馈推荐系统。当用户的反馈是打分行为时,即为显式反馈;当用户的反馈是点击、购买等行为时,即为隐式反馈。在实际场景中,后者会更加普遍。
[0003]然而,在隐式反馈的推荐场景下,用户交互过的物品可以作为正样本,但是缺少负样本。针对此种情况,一种解决方式是从用户所有未交互过的物品中进行采样并将其作为负样本。在此过程中,不同的采样方法会极大地影响模型的训练效果和收敛速度。因此,如何设计一种高效的负样本采样方法是亟需解决的一个研究问题。
[0004]围绕这个研究问题,现有技术提供了多种方式。其中,一种有效的方法是基于两阶段的采样方法。首先,从均匀分布中采样一定数量的物品作为物品池;然后,从物品池中挑选出推本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种面向隐式反馈推荐系统的负样本采样及训练方法,其特征在于,所述方法包括:设用户集合物品集合用户与物品的交互数据集合用表示,数据集中每一条数据都是一条正样本,由一个二元组(c,i)组成,其中对于一个用户c和一个物品i,一个具有参数θ的推荐模型对他们的打分用r
ci
表示;步骤1、针对用户c,首先从一个静态分布Q(
·
)中采样一部分物品,组成一个物品池并为物品池中的每一个物品计算重要性重采样的权重:其中,Q(i)和Q(j)分别表示物品i和物品j被采样的概率;其次,根据该权重组成的分布从物品池中进行有放回的重采样得到一个新的物品池且新物品池的大小与原物品池的大小一致,即最后,通过两次采样后,物品池中的物品被采样的概率近似为:当物品池中物品的数量趋于无穷时,即采样的概率等于步骤2、在模型训练的过程中,设上一轮采样得到的物品池为当前轮采样得到的物品池为将它们合并...

【专利技术属性】
技术研发人员:连德富陈恩红陈矜金斌斌
申请(专利权)人:中国科学技术大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1