当前位置: 首页 > 专利查询>北京大学专利>正文

基于非随机缺失数据处理结局测量误差的推荐方法和系统技术方案

技术编号:40660682 阅读:21 留言:0更新日期:2024-03-18 18:53
本发明专利技术涉及一种基于非随机缺失数据处理结局测量误差的推荐方法和系统,属于物品推荐技术领域,解决了现有技术在收集到的数据同时具有MNAR和OME时推荐准确性低的问题。方法包括以下步骤:获取用户数据、物品数据,以及观测到的用户对物品的评分,构建训练样本集;构建噪声预测模型,基于训练样本集训练噪声预测模型;构建去噪误差插补模型和去噪预测模型,基于所述训练样本集和训练好的噪声预测模型对所述去噪误差插补模型和去噪预测模型进行联合训练,得到训练好的去噪预测模型;基于训练好的去噪预测模型对未观测到的用户对物品的评分进行去噪预测,基于用户对物品的评分进行推荐。实现了同时具有MNAR和OME时的准确推荐。

【技术实现步骤摘要】

本专利技术涉及物品推荐,尤其涉及一种基于非随机缺失数据处理结局测量误差的推荐方法和系统


技术介绍

1、推荐系统(rs)旨在为用户集合生成他们可能感兴趣的物品或产品的有意义的推荐,近年来已经取得了许多重大进展。然而,在现实世界中直接使用这些先进的模型时,如果忽略了所收集数据中存在的大量偏差,就会导致评级预测模型的性能达不到最优。其中,数据缺失问题尤为普遍,因为用户可以自由选择物品进行评分,而评分值较低的物品更有可能缺失,从而导致rs中收集到的数据总是非随机缺失(mnar)。mnar评分对预测模型的无偏评估和学习提出了严峻的挑战,因为观察到的数据可能无法代表全体用户-物品对。

2、为了解决这个问题,以前的研究通过定义预测不准确度来评估预测模型的性能,即预测误差(如预测评分与潜在观察评分之间的平方差的平均值)。为了通过观测到的评分无偏估计预测误差,以前的研究提出了三种典型的方法,包括:(1)基于误差填补(eib)的方法,为每个缺失的评分计算估算误差。(2)逆倾向得分法(ips),这种方法将每个观察到的评分的预测误差与观察到该评分的概率进行反向加权。本文档来自技高网...

【技术保护点】

1.一种基于非随机缺失数据处理结局测量误差的推荐方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的基于非随机缺失数据处理结局测量误差的推荐方法,其特征在于,基于所述训练样本集和训练好的噪声预测模型对所述去噪误差插补模型和去噪预测模型进行联合训练,包括:

3.根据权利要求1所述的基于非随机缺失数据处理结局测量误差的推荐方法,其特征在于,采用以下公式计算去噪预测模型的损失:

4.根据权利要求1所述的基于非随机缺失数据处理结局测量误差的推荐方法,其特征在于,采用以下公式计算去噪误差插补模型的损失:

5.根据权利要求4所述的基于非随机缺失数...

【技术特征摘要】

1.一种基于非随机缺失数据处理结局测量误差的推荐方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的基于非随机缺失数据处理结局测量误差的推荐方法,其特征在于,基于所述训练样本集和训练好的噪声预测模型对所述去噪误差插补模型和去噪预测模型进行联合训练,包括:

3.根据权利要求1所述的基于非随机缺失数据处理结局测量误差的推荐方法,其特征在于,采用以下公式计算去噪预测模型的损失:

4.根据权利要求1所述的基于非随机缺失数据处理结局测量误差的推荐方法,其特征在于,采用以下公式计算去噪误差插补模型的损失:

5.根据权利要求4所述的基于非随机缺失数据处理结局测量误差的推荐方法,其特征在于,采用以下公式计算代理损失:

6.根据权利要求2所述的基于非随机缺失数据处理结局测量误差...

【专利技术属性】
技术研发人员:周晓华李昊轩郑淳元
申请(专利权)人:北京大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1