一种基于混合兴趣相似度的协同过滤推荐方法技术

技术编号:18783867 阅读:24 留言:0更新日期:2018-08-29 06:59
本发明专利技术提出一种新的混合用户兴趣相似度计算方法。通过建立用户对所用项目的评分矩阵,当发现用户评分矩阵为空,计算用户特征属性相似性寻找相似用户进行预测评分。当目标用户与其他用户之间共同评分物品个数比较少时,通过计算物品相似度,间接计算出用户兴趣相似度。用户兴趣相似度计算主要分成三个部分:直接计算用户评分的距离值、求出一组评分的贡献值以及这组评分在整个评分系统中是否为奇异值。最后,将三个计算用户兴趣相似度的方法通过sigmoid函数实现冷启动状态下根据用户属性计算相似度到根据用户评分信息的平滑过渡得到最终用户兴趣相似度。根据用户兴趣相似度计算目标用户未评分项目的预测评分,选取其中预测评分最高的N个项目推荐,本发明专利技术可以有效缓解冷启动问题、数据稀疏性问题并有效地提高预测推荐的准确度。

【技术实现步骤摘要】
一种基于混合兴趣相似度的协同过滤推荐方法(一)
本专利技术涉及个性化推荐
,具体涉及一种基于混合兴趣相似度的协同过滤推荐的方法。(二)
技术介绍
推荐系统是一种解决信息过载的智能系统。协同过滤是现今推荐技术的方法之一,直接根据用户的历史行为预测其可能喜欢的物品,被广泛的应用于几乎所有的大型电子商务网站中。而当用户刚进入系统时没有任何评分记录,并且用户之间共同评分的物品数量过少导致数据稀疏性问题,通过传统的相似度计算出用户相似度不够准确,此时通过基于用户兴趣的混合相似度则可以解决数据稀疏性和提取用户兴趣问题。用户兴趣相似度的关键技术包括对用户兴趣相似性的计算方式,不准确的相似性计算将导致用户兴趣提出不够精确,进而产生大量的错误推荐。传统的相似度计算方式在遇到系统日志中数据稀疏问题时会导致预测结果精度下降。最新研究针对这一问题提出从物品相似度上间接提取用户兴趣相似度,通过全面考虑用户评分信息计算用户相似性。但是忽略物品从稀疏到密集的过渡问题。据此进行用户兴趣相似性计算可能存在一定的偏差。因此本文提出一种基于混合兴趣相似度的协同过滤的方法,根据用户之间对物品评分绝对距离、贡献值和奇异值三个因素综合考虑用户评分信息计算用户之间的兴趣相似性。然后将用户兴趣相似性分为初始阶段、数据稀疏性阶段和最终阶段,根据用户对物品评分的个数进行对三个阶段进行混合。该方法有效提高获取用户兴趣准确率,保证推荐质量。(三)
技术实现思路
本专利技术的目的是提供一种基于混合兴趣相似度协同过滤的推荐方法。该方法通过将用户兴趣相似度分为三个阶段,首先用户刚进入系统根据用户属性进行相似度计算,然后用户之间共同评分数目较少时根据物品相似度间接计算用户相似度,最后目标用户与相似用户共同评分数目不稀疏时根据用户之间共同评分的物品计算出用户兴趣相似度。此方法更准确提取用户兴趣,有效解决冷启动、数据稀疏性问题,实现推荐系统的有效推荐。为了达到上述目的,本专利技术采用如下方案实现:首先提取用户特征属性以及物品特征属性。推荐系统新加入的用户数据为空,根据用户特征属性计算出用户相似性进行推荐,随着用户对物品评分数量上升,此时用户与用户之间共同评分物品数量过少,则根据物品相似性间接求得用户兴趣相似性,当用户之间共同评分物品数量增加到一定数量时则可以直接根据用户之间共同评分的物品进行计算用户相似性。通过使用sigmoid函数融合三种用户兴趣相似性寻找目标用户的相似用户从而预测出用户对为评分物品的评分,选取TOP-N物品列表完成推荐。本专利技术中涉及到如下参数:用户特征属性向量Attruser=(au1,au2,...,aun),rui表示用户u给物品i的评分;物品特征属性向量表示为Attritem=(ai1,ai2,...,ain);ru,p表示用户v给物品p的评分;μp表示所有用户给物品P进行评分的平均值;rmed表示系统中对评分值的中值;sim(i,j)表示物品i和j之间的相似度;Cuv表示用户u和v共同评分物品的集合;rup表示预测用户u对物品p的评分;rkp表示用户k对物品p的评分;其具体方法步骤为:(1)通过日志数据系统,获取用户对各个物品的兴趣信息,根据设定的评分原则,建立各用户对所有物品的评分矩阵;(2)根据评分矩阵计算每个用户对物品的平均评分,将用户特征属性和物品特征属性用向量表示;(3)新用户进入系统时没有历史数据,获取用户属性特征向量计算用户之间相似度simattr(u,v);(4)根据两个用户对物品的评分求出两者在评分上的距离值,计算公示如下(5)根据两个用户对物品评分与评级系统中间值的差距得出一组评分的贡献值,计算公式如下:(6)为判断一组评分是否为奇异值,根据这组评分与所有评分的平均值进行对比,计算公式如下:(7)结合步骤(4)(5)(6)三个因素得到用户兴趣相似度,计算公式如下:sim(u,v)1PSS=∑p∈Iproximity(ru,p,rv,p)×significance(ru,p,rv,p)×singularity(ru,p,rv,p);(8)新用户进入系统中,由于没有任何数据,采取步骤(3)寻找相似用户;(9)当目标用户与其他用户之间共同评分物品的数目较少时,通过计算物品之间的相似度结合步骤(7)得到稀疏时用户之间的兴趣相似度sim2;(10)随着用户之间共同评分数目增多,此时通过主要通过用户之间共同评分的物品进行用户相似性计算;(11)步骤(7)(8)(9)通过用户对评分物品的数目和用户之间共同评分物品个数进行过度;(12)将三种相似度进行融合得到最终混合相似度,计算公式如下:simfinal(u,v)=αsimattr(u,v)+βsim1+λsim2;λ=1-α-β;(13)由步骤13得到用户兴趣相似度最后预测出用户对未评分的物品的评分,如下:(14)选取预测评分最高的前N个物品给推荐用户,算法结束。本专利技术所阐述的基于混合用户兴趣相似度协同过滤的推荐方法,。本方法的创新性在于:1.当用户刚进进入系统没有任何数据根据用户属性相似性解决用户冷启动问题。2.根据用户评分相似度和用户倾向相似度获取用户兴趣相似度分别从用户行为相似性和用户对某一物品的倾向相似性求得用户兴趣相似性。3.当用户之间共同评分物品个数较少时根据物品,通过物品特征属性相似性间接计算出用户相似性解决数据稀疏性问题。4.从用户属性相似性到用户兴趣相似性计算分成三个阶段根据用户评级物品个数进行平滑,更准确获取到用户兴趣相似度。(四)附图说明图1、本文所述方法的示意图图2、混合兴趣相似度协同过滤推荐方法流程图(五)具体实施方式下面结合附图举例对本专利技术做更详细地描述:本专利技术所述方法的特征在于:根据用户之间共同评价物品的个数是否超过置信度分别计算用户兴趣相似度,当用户之间共同评价物品的个数稀疏时,根据用户评价的物品的相似性进行相似性的间接计算,当个数不在稀疏时,则根据用户评分相似度和兴趣倾向度混合计算用户兴趣相似度。如果一个新用户进入系统时没有对任何物品进行评分,通过计算用户属性相似性选择相似用户进行推荐。(1)通过日志数据系统,获取用户对各个物品的兴趣信息,根据设定的评分原则,建立各用户对所有物品的评分矩阵;(2)根据评分矩阵计算每个用户对物品的平均评分,将用户特征属性和物品特征属性用向量表示;(3)新用户进入系统时没有历史数据,获取用户属性特征向量计算用户之间相似度simattr(u,v);(4)根据两个用户对物品的评分求出两者在评分上的距离值,计算公示如下(5)根据两个用户对物品评分与评级系统中间值的差距得出一组评分的贡献值,计算公式如下:(6)为判断一组评分是否为奇异值,根据这组评分与所有评分的平均值进行对比,计算公式如下:(7)结合步骤(4)(5)(6)三个因素得到用户兴趣相似度,计算公式如下:sim(u,v)1PSS=∑p∈Iproximity(ru,p,rv,p)×significance(ru,p,rv,p)×singularity(ru,p,rv,p);(8)新用户进入系统中,由于没有任何数据,采取步骤(3)寻找相似用户;(9)当目标用户与其他用户之间共同评分物品的数目较少时,通过计算物品之间的相似度结合步骤(7)得到稀疏时用户之间的兴趣相似度si本文档来自技高网...

【技术保护点】
1.一种基于混合兴趣相似度的协同过滤推荐方法,本专利技术是这样实现的:在系统中记录用户的历史评分记录,首先提取用户特征属性以及物品特征属性。推荐系统新加入的用户数据为空,根据用户特征属性计算出用户相似性进行推荐,随着用户对物品评分数量上升,此时用户与用户之间共同评分物品数量过少,则根据物品相似性间接求得用户兴趣相似性,当用户之间共同评分物品数量增加到一定数量时则可以直接根据用户之间共同评分的物品进行计算用户相似性。用户兴趣相似性根据全面考虑用户对物品的评分从评分距离值、贡献值和奇异值三个因素进行计算。最后通过使用sigmoid函数融合三种用户兴趣相似性寻找目标用户的相似用户从而预测出用户对为评分物品的评分,选取TOP‑N物品列表完成推荐。本专利技术中涉及到如下参数:用户特征属性向量Attruser=(au1,au2,...,aun),rui表示用户u给物品i的评分;物品特征属性向量表示为Attritem=(ai1,ai2,...,ain);ru,p表示用户v给物品p的评分;μp表示所有用户给物品P进行评分的平均值;rmed表示系统中对评分值的中值;sim(i,j)表示物品i和j之间的相似度;Cuv表示用户u和v共同评分物品的集合;rup表示预测用户u对物品p的评分;rkp表示用户k对物品p的评分;其具体方法步骤为:(1)通过日志数据系统,获取用户对各个物品的兴趣信息,根据设定的评分原则,建立各用户对所有物品的评分矩阵;(2)根据评分矩阵计算每个用户对物品的平均评分,将用户特征属性和物品特征属性用向量表示;(3)新用户进入系统时没有历史数据,获取用户属性特征向量计算用户之间相似度simattr(u,v);(4)根据两个用户对物品的评分求出两者在评分上的距离值,计算公示如下...

【技术特征摘要】
1.一种基于混合兴趣相似度的协同过滤推荐方法,本发明是这样实现的:在系统中记录用户的历史评分记录,首先提取用户特征属性以及物品特征属性。推荐系统新加入的用户数据为空,根据用户特征属性计算出用户相似性进行推荐,随着用户对物品评分数量上升,此时用户与用户之间共同评分物品数量过少,则根据物品相似性间接求得用户兴趣相似性,当用户之间共同评分物品数量增加到一定数量时则可以直接根据用户之间共同评分的物品进行计算用户相似性。用户兴趣相似性根据全面考虑用户对物品的评分从评分距离值、贡献值和奇异值三个因素进行计算。最后通过使用sigmoid函数融合三种用户兴趣相似性寻找目标用户的相似用户从而预测出用户对为评分物品的评分,选取TOP-N物品列表完成推荐。本发明中涉及到如下参数:用户特征属性向量Attruser=(au1,au2,...,aun),rui表示用户u给物品i的评分;物品特征属性向量表示为Attritem=(ai1,ai2,...,ain);ru,p表示用户v给物品p的评分;μp表示所有用户给物品P进行评分的平均值;rmed表示系统中对评分值的中值;sim(i,j)表示物品i和j之间的相似度;Cuv表示用户u和v共同评分物品的集合;rup表示预测用户u对物品p的评分;rkp表示用户k对物品p的评分;其具体方法步骤为:(1)通过日志数据系统,获取用户对各个物品的兴趣信息,根据设定的评分原则,建立各用户对所有物品的评分矩阵;(2)根据评分矩阵计算每个用户对物品的平均评分,将用户特征属性和...

【专利技术属性】
技术研发人员:姚文斌胡芳燚綦麟樊悦芹黄芬芬
申请(专利权)人:北京邮电大学
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1