【技术实现步骤摘要】
一种自适应噪声的数据协同对比推荐模型
[0001]本专利技术涉及计算机
,尤其是一种自适应噪声的数据协同对比推荐模型。
技术介绍
[0002]由于隐式反馈数据方便获取的特性,被广泛应用于推荐中。然而隐式反馈中存在大量的噪声数据,现有研究证明这些噪声数据不能反应用户的真实偏好,降低了用户体验感和满意度。
[0003]推荐系统中关于噪声的研究,根据去噪的方式可以将其分为基于辅助信息的去噪方法、重采样方法和重加权方法三类。基于辅助信息的去噪方法是:用户的隐式反馈数据中存在固有的噪声,在去噪的早期研究中,通过引入额外的边信息丰富用户和物品的嵌入,降低噪声对模型的影响。重采样方法的核心是如何有效区分干净样本和真正的负样本,即通过有效地采样器对负样本进行采样。为了缓解重采样方法中依赖数据质量的问题,研究者提出了重加权方法,重加权方法在模型训练过程中区分干净样本和噪声样本,从而降低噪声样本对模型的影响。重加权的方法在训练模型时为具有高损失的样本赋予较低的权重,模型会更少的学习到噪声数据的特征,其推荐列表会更加符合用户的偏好。 ...
【技术保护点】
【技术特征摘要】
1.一种自适应噪声的数据协同对比推荐模型,其特征在于,包括信息量物品抽取模块、对比推荐模块和噪声自适应模块;所述信息量物品抽取模块在模型训练之前进行样本选择;信息量物品是指在模型训练过程中对于学习用户偏好具有大贡献的样本;所述对比推荐模块由信息量物品集和原始数据集协同训练;所述噪声自适应模块通过信息量物品集BPR损失和对比损失更新权重函数,学习监督信号,使原始数据集中噪声的权重减小。2.如权利要求1所述的自适应噪声的数据协同对比推荐模型,其特征在于,所述信息量物品抽取模块,具体方法如下:首先引入信息量物品量化指标,与密切相关的是用户访问率和物品点击率两个概念;从用户和物品两个角度来量化该物品是否为信息量物品;物品i的信息量化值表示为:式中,表示数据集中所有的物品数量,表示数据集中所有的用户数量,表示点击的物品的所有用户集合;表示所有用户的数据集;表示与物品i交互的用户数量;计算用户点击的所有物品的信息量平均量化值,将其作为判断用户交互的物品是否为信息量物的阈值;否为信息量物的阈值;表示用户点击的物品集合,表示用户点击的物品集合中所有的物品数量;表示物品i的信息量化值;给阈值加一个参数,即对于用户点击的每个物品,将的物品交互定义为信息量物品集,并将其余物品作为用户的难负样本集来训练模型:来训练模型:式中,代表原始数据集;表示物品i的信息量化值;表示用户点击的物品集合。3.如权利要求1所述的自适应噪声的数据协同对比推荐模型,其特征在于,所述对比推荐模块中同时利用信息量物品集和原始数据集训练模型,根据输入数据的不同将其分为基础推荐模块和对比增强器模块两个部分;所述基础推荐模块的输入是未经处理过的原始数据集,用户交互的物品为正样本,负样本从所有未交互的物品中随机采样,表示为;用嵌入模型获得用户和正负物品样本的嵌入后,通过BPR加权损失函数训练模型,为用户提供推荐候选集;所述对比增强器模块的输入数据为用户信息量物品集和难负样本集,从和中采样正负样本,对比增强模块中得到用户和物品的嵌入方法与基础推荐模块中的相同,只是邻接矩阵不同,信息量物品集中的邻接矩阵表示为。4.如权利要求3所述的自适应噪声的数据协同对比推荐模型,其特征在于,所述基础推荐模块中,用户和物品的嵌入采用因子分解机FM、神经网络方法或图卷积的方法中的一种推荐模型获得。5.如权利要求4所述的自适应噪声的数据协同对比推荐模型,其特征在于,所述基础推
【专利技术属性】
技术研发人员:琚生根,赵容梅,孙思雨,彭舰,夏欣,
申请(专利权)人:四川大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。