一种基于用户好奇心的贝叶斯个性化排序推荐方法技术

技术编号:24169343 阅读:41 留言:0更新日期:2020-05-16 02:26
本发明专利技术公开了一种基于用户好奇心的贝叶斯个性化排序推荐方法,包括步骤:使用有好友关系的数据集,遍历数据集中每一个用户的历史数据,对于数据集中的每一个用户u,构建用户u的正向物品集合P

A Bayesian personalized ranking recommendation method based on user curiosity

【技术实现步骤摘要】
一种基于用户好奇心的贝叶斯个性化排序推荐方法
本专利技术涉及个性化推荐
,尤其涉及一种基于用户好奇心的贝叶斯个性化排序推荐方法。
技术介绍
随着信息技术的发展和互联网的普及,用户能够更方便地接触到更多的信息,但用户在享受信息技术带来便利的同时,也遇到了“信息过载”的问题,导致用户无法从海量的数据中找到自己想要的信息。一般来说,用户接触信息主要靠两种方式,一种是用户在互联网上手动地进行搜索,此时搜索引擎会返回一系列用户可能想要的答案;另一种就是个性化推荐,互联网会根据用户的兴趣、历史记录去为用户推荐用户感兴趣的信息。个性化推荐技术大大的降低了用户面对信息过载时的选择问题。目前的推荐技术中,应用最广泛的当属协同过滤算法,这类算法充分利用用户的历史记录,比如评分数据、点击记录和购买记录去挖掘用户的兴趣偏好从而进行推荐,该类方法一般推荐与用户历史记录相似度比较高的物品,以寻求准确率上的提升,但是在实际应用中,总是给用户推荐与用户过去喜欢的物品一样的物品,最终会让用户产生乏味的感觉,从而对推荐的物品再也不感兴趣。此时我们需要为用户提供更具有多样性的推荐列表,从而去吸引用户注意。心理学研究表明,好奇心可以激发起一个人的兴趣并且驱使人去做出探索行为。研究还表明,人的好奇心可以被以下特质所引起,包括新颖性(Novelty)、不确定性(uncertainty)、冲突性(conflict)和复杂性(complexity)刺激等。所以本专利技术的目的是在不损失一定准确率的情况下,考虑用户的好奇心,多多地提升推荐列表的多样性。
技术实现思路
本专利技术的目的在于克服现有技术的不足,提供一种基于用户好奇心的贝叶斯个性化排序推荐方法。本专利技术将用户的好奇心融入到经典的贝叶斯个性化排序中,在保证一定准确率的前提下,大大提升了推荐列表的多样性。本专利技术的目的能够通过以下技术方案实现:一种基于用户好奇心的贝叶斯个性化排序推荐方法,包括步骤:使用有好友关系的数据集,遍历数据集中每一个用户u的历史数据,根据用户u有过正向反馈的物品构建该用户的正向物品集合(positiveuser-itemset),用字母Pu表示;对于数据集中的每一个用户,构建令用户u感到好奇的物品集合(curiosityuser-itemset),用字母Cu表示;构建用户u的负向物品集合(negativeuser-itemset),用字母Nu表示。提出优化排序准则,获取用户矩阵P和物品矩阵Q;对于每一个用户,随机从Nu、Pu、Cu中选择物品组成物品对(positive,negative)和(curiosity,negative)进行训练,在每一次的训练迭代中不断地更新用户矩阵P和物品矩阵Q。对用户u所有没有过反馈的物品进行预测评分,选取分数最高的TopN个物品进行推荐。具体地,所述使用有好友关系的数据集里面包括两种类型的数据;一个是用户对物品的评分数据,一个是用户与用户之间的关系数据,第二个数据可以直接表示朋友关系,因此能够获得朋友的打分行为。具体地,所述“有过正向反馈”表示该行为记录可以显示出用户的偏好,包括显性反馈数据集和隐性反馈数据集。对于显性反馈数据集,通过用户的评分可以表示出用户的喜好,规定超过某个阈值分数的反馈可以认为用户u对此物品i有正向反馈。比如,如果是评分范围为1-5分,则规定5分才算是用户的正向反馈。对于隐性反馈数据集,用户对某一物品产生的行为次数可以表示出用户的喜好,规定超过某个阈值次数的反馈可以认为用户u对此物品i有正向反馈。比如,如果次数无上限,则规定用户u对物品i有过2次以上的行为记录为用户对该物品有正向反馈。本专利技术使用显性反馈数据。具体地,所述对于数据集中的每一个用户,构建令用户u感到好奇的物品集合Cu的步骤中,包括:构建会令用户u产生新颖性感觉的物品集合C1;构建会令用户u产生不确定性感觉的物品集合C2;构建会令用户u产生冲突性感觉的物品集合C3;构建会令用户u产生复杂性感觉的物品集合C4。具体地,所述“会令用户u感到好奇的物品集合”表示会让用户u产生新颖性、不确定性、冲突性或者复杂性感觉的物品集合,表示为:Cu=C1∩C2∩C3∩C4其中,Cu是C1、C2、C3、C4的并集。具体地,对于构建集合C1,使用现有的基于准确率提升的方法,比如MF算法,可以得到用户u的朋友对所有评过分的物品i的预测分数,比较预测分数与用户u的朋友对物品i打的实际分数的差值,如果差值达到一定阈值,则把物品i归为会令用户u产生新颖性感觉的物品集合C1。所述物品i不包括用户对其有过正向反馈的物品。具体地,对于构建集合C2,统计用户u的所有朋友对物品i的评分个数,所述物品i不包括用户u对其有过正向反馈的物品,使用来表示用户u的朋友对物品i打分为k分的朋友个数,通过以下公式得到用户u的朋友对物品i的打分落在k分数段的概率p(u,i,k)为:例如,用户u有10个朋友,其中有5个朋友打了5分,3个朋友打了4分,2个朋友打了1分,则用户u的朋友中,对物品i的打分是5分的概率是1/2,对物品i的打分是4分的概率是3/10,对物品i的打分是1分的概率是1/10。根据香浓熵公式计算出用户u对朋友们对物品i打分给用户u产生的不确定性感觉entropy(u,i)的大小,公式为:根据Dempster–Shafer理论来支撑计算得到的entropy(u,i)表达‘不确定’的能力,使用符号DS(u,i)来进行表示:其中,r表示打分分数段的最高分数值。(比如1-5分中,r=5)则用户u对物品i产生的总不确定性感觉Uncertainty(u,i)可以通过下面的公式来进行计算:得到用户i对所有物品的不确定感觉之后,选择前TopN个物品组成会令用户u产生不确定性感觉的物品集合C2。对于构建集合C3,统计用户u的所有朋友对物品i产生正向反馈和产生负向反馈的比例P1和P2,两者相乘的值为用户u对物品i产生的冲突性强度,选择前TopN个物品归为会令用户u产生冲突性感觉的物品集合C3。所述物品i不包括用户对其有过正向反馈的物品。对于构建集合C4,用户u对物品i产生的复杂性感觉可以根据该物品和用户以往有过正反馈的物品的相似度差别是否大来进行衡量,物品i和用户历史记录中的物品越不相似,则给用户带来的复杂性感觉越大。所述物品i不包括用户对其有过正向反馈的物品。具体地,计算两个物品之间的相似度,直接利用现有的MF算法得到的物品矩阵Q。Q矩阵中的每一列都代表一个物品,所以两列元素的余弦值可以表示这两个物品的相似度值,从而可以求得物品i与用户历史记录里面的所有物品的相似度平均值sui。对于所有的物品,按照从低到高进行排序,选择前TopN个物品组成会令用户u产生复杂性感觉的物品集合C4。具体地,所述构建用户u的负向物品集合的步骤中,把用户u有过负向反馈本文档来自技高网
...

【技术保护点】
1.一种基于用户好奇心的贝叶斯个性化排序推荐方法,其特征在于,包括步骤:/n使用有好友关系的数据集,遍历数据集中每一个用户的历史数据,对于数据集中的每一个用户u,根据用户u有过正向反馈的物品构建该用户的正向物品集合P

【技术特征摘要】
1.一种基于用户好奇心的贝叶斯个性化排序推荐方法,其特征在于,包括步骤:
使用有好友关系的数据集,遍历数据集中每一个用户的历史数据,对于数据集中的每一个用户u,根据用户u有过正向反馈的物品构建该用户的正向物品集合Pu;
构建令用户u感到好奇的物品集合Cu;
构建用户u的负向物品集合Nu;
提出优化排序准则,获取用户矩阵P和物品矩阵Q;
对于每一个用户,随机从Pu、Cu、Nu中选择物品组成物品对(positive,negative)和(curiosity,negative)进行训练,在每一次的训练迭代中不断地更新用户矩阵P和物品矩阵Q;
对用户u所有没有过反馈的物品进行预测评分,选取分数最高的TopN个物品进行推荐。


2.根据权利要求1所述的方法,其特征在于,所述对于数据集中的每一个用户,构建令用户感到好奇的物品集合Cu的步骤中,包括:
构建会令用户产生新颖性感觉的物品集合C1;
构建会令用户产生不确定性感觉的物品集合C2;
构建会令用户产生冲突性感觉的物品集合C3;
构建会令用户产生复杂性感觉的物品集合C4。


3.根据权利要求2所述的方法,其特征在于,对于构建集合C1,使用现有的MF算法,得到用户u的朋友对所有评过分的物品i的预测分数,比较预测分数与用户u的朋友对物品i打的实际分数的差值,如果差值达到一定阈值,则把物品i归为会令用户u产生新颖性感觉的物品集合C1;所述物品i不包括用户对其有过正向反馈的物品。


4.根据权利要求2所述的方法,其特征在于,对于构建集合C2,统计用户u的所有朋友对物品i的评分个数,所述物品i不包括用户对其有过正向反馈的物品,使用来表示用户u的朋友对物品i打分为k分的朋友个数,通过以下公式得到用户u的朋友对物品i的打分落在k分数段的概率p(u,i,k)为:



根据香浓熵公式计算出用户u对朋友们对物品i打分给用户u产生的不确定性感觉entropy(u,i)的大小,公式为:



根据Dempster-Shafer理论来支撑计算得到的entropy(u,i)表达‘不确定’的能力,使用DS(u,i)来进行表示:



其中,r表示打分分数段的最高分数值;
则用户u对物品i产生的总不确定性感觉Uncertainty(u,i)可以通过下面的公式来进行计算:



得到用户i对所有物品的不确定感觉,选择前TopN个物品组成会令用户u产生不确定性感觉的物品集合C2。


5.根据权利要求2所述的方法,其特征在于,对于构建集合C3,统计用户u的所有朋友对物品i产生正向反馈和产生负向反馈的比例P1和P2,两者相乘的值为用户u对物品i产生的冲突性强度,选择前TopN个物品归为会令用户u产生冲突性感觉的物品集合C3;所述物品i不包括用户对其有过正向反馈的物品;
对于构建集合C4,用户u对物品i产生的复杂性感觉可以根据该物品和用户以往有过正反馈的物品的相似度差别是否大来进行衡量,物品i和用...

【专利技术属性】
技术研发人员:蔡毅丁琪琪
申请(专利权)人:华南理工大学
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1