一种基于WUDiff和RMF的混合协同推荐算法制造技术

技术编号:18400189 阅读:58 留言:0更新日期:2018-07-08 20:09
本发明专利技术利用WUDiff算法将用户、项目和标签抽象成三部图中的节点,利用隐藏在带权重的三部图中的信息,挖掘网络中基于评分和标签的深层潜在相似用户的关联,寻找与目标用户相似的近邻集合,其次,利用RMF模型将用户‑项目评分矩阵分解成为用户特征矩阵和项目特征矩阵,通过降维提高了数据密度,最后利用WUDiff算法所获得的近邻信息来规则化RMF模型。该方法可全局视角处理数据,善于发现原始数据中的主要结构模式,具有简单迭代、快速收敛等优点,同时以三部图的视角理解数据,利用物质扩散的方法寻找用户、项目和标签之间的两两关系,弥补了降维带来信息损失的影响,有效提高了预测的准确度及缓解数据稀疏性的问题。

A hybrid collaborative recommendation algorithm based on WUDiff and RMF

The invention uses the WUDiff algorithm to abstract the users, projects and tags into nodes in the three graph, and uses the information hidden in the three graphs with weight to excavate the association of the deep potential similar users based on the score and label in the network, and find a close neighbor set similar to the target user. Secondly, the RMF model is used to use the user's item. The score matrix is decomposed into user's characteristic matrix and project feature matrix, and the data density is improved by reducing dimension. Finally, the RMF model is normalized by using the nearest neighbor information obtained by the WUDiff algorithm. This method can deal with data from the global perspective, and is good at discovering the main structure patterns in the original data. It has the advantages of simple iteration and fast convergence. At the same time, the data is understood in the view of three graphs, and the 22 relationship between the user, the project and the label is found by the method of material diffusion, which makes up the shadow of information loss. It effectively improves the accuracy of prediction and alleviates the sparsity of data.

【技术实现步骤摘要】
一种基于WUDiff和RMF的混合协同推荐算法
本专利技术涉及一种信息推荐算法,具体涉及一种基于WUDiff和RMF混合协同推荐算法。
技术介绍
近年来,伴随互联网和大数据的高速发展,日益激增的网络信息,让人们遭遇了“信息过载”的困境。为了解决该问题,推荐系统应运而生,它主动地收集用户的各种信息数据(用户注册信息、用户浏览日志、历史评分记录和项目信息等),从中挖掘用户隐藏的兴趣和行为模式,根据分析结果和项目信息的变化,调整推荐内容和服务方式,为用户实现个性化的推荐服务,例如Last.fm的音乐评分推荐系统,亚马逊(Amazon)和京东(JD)的商品推荐系统及Netfilix电影网站的视频推荐等,越来越多的网站为用户提供了相关内容的推荐服务。现有的推荐算法主要分类为:基于内容的推荐算法、协同过滤推荐算法和混合的推荐算法。其中,协同过滤推荐算法(CF)是运用最为广泛的一种,其主要思想是根据用户与项目之间交互的信息来分析用户行为和爱好,它主要分为两种:基于最近邻的推荐算法和基于模型的推荐算法。常见的基于最近邻的推荐算法有基于用户近邻和基于项目近邻两种,主要是通过寻找与目标用户(或项目)相似的用户(或项目)集合,形成系统对该目标用户(或项目)的喜好程度预测,同时随着大量的新用户和新项目的快速增加,将加重数据稀疏、冷启动等问题,该算法的推荐质量和效率都将下降。基于模型的推荐算法是通过降低维数来有效保存信息内容,从而降低了计算的复杂度,但会忽略了局部的近邻信息,当数据稀疏时,推荐效果也会大受影响随着Web2.0网络技术的发展,社会化标签作为Web2.0的重要技术,它允许用户根据自己的需要和理解自由地对自己或其他用户上传的资源进行标签标注,同时多个用户对相同项目或同类项目进行标注,容易形成一些“热门标签”被大部分用户使用。标签作为用户和资源之间的重要桥梁,它不仅能反映出用户的兴趣偏好,同时也能体现出资源的主题信息。因此,利用标签信息来辅助个性化推荐成为了研究热点。目前,基于标签的协同推荐方法主要是将标签信息与基于近邻或基于模型的方法相结合。中国专利“CN102508870B一种结合评分数据与标签数据的个性化推荐方法”首先根据用户对项目的评分数据和项目被标记的标签数据来生成用户对标签的评分,然后通过结合评分数据和标签数据来计算用户间的相似度,生成近邻用户集,最后根据近邻用户集的评分来预测目标用户对项目的未知评分,从而实现个性化推荐。Wang等人在Tagsmeetratings:Improvingcollaborativefilteringwithtag-basedneighborhoodmethod[C].ProceedingsoftheWorkshoponSocialRecommenderSystems.2010:15-23提出利用标签数据产生潜在主题来改进基于近邻推荐方法。Gedikli等人在Improvingrecommendationaccuracybasedonitem-specifictagpreferences[J].ACMTransactionsonIntelligentSystemsandTechnology(TIST),2013,4(1):11提出通过项目的标签信息来改进基于项目的近邻方法。同时,以图论为基础,将用户、项目和标签看作是三部图上的节点,利用网络节点之间的关系进行推荐。中国专利“CN102376063B一种基于社会化标签的个性化推荐系统优化方法”提出了采用标签相似度和评分相似度来计算面向用户和项目的K近邻模型,从而提高预测评分。Zhang等人在Personalizedrecommendationviaintegrateddiffusiononuser-item-tagtripartitegraphs[J].PhysicaA:StatisticalMechanicsanditsApplications,2010,389(1):179-186提出了基于标签的物质扩散方法(ODiff),将用户-项目-标签三部图分解为“用户-项目”二部图和“项目-标签”二部图,再利用物质扩散原理进行项目之间的相似性计算。Shang等人在Collaborativefilteringwithdiffusion-basedsimilarityontripartitegraphs[J].PhysicaA:StatisticalMechanicsanditsApplications,2010,389(6):1259-1264中将三部图分解为“用户-项目”二部图和“用户-标签”二部图,利用物质扩散的方法来计算用户的相似性(UDiff)。Gan[8]等人Trinity:WalkingonaUser-Object-TagHeterogeneousNetworkforPersonalizedRecommendations[J].JournalofComputerScienceandTechnology,2016,31(3):577-594提出了Trinity模型,构造了一个对象-用户-标签的三层网络,考虑不同类型节点之间的互连同时也考虑相同类型节点之间的关系,基于这种异构网络,采用随机游走与重启模型来分配候选对象的关联强度,从而提高推荐的准确度。除了将标签信息与基于近邻相结合,当前常用的还有与基于模型相结合的方法,特别是矩阵分解技术(正则化矩阵分解(RMF),概率矩阵分解(PMF)和非负矩阵分解(NMF))。基于矩阵分解的推荐算法能以全局视角处理数据,善于发现原始数据中的主要结构模式,即使面对于新用户或新项目,都能找出其相似度,但容易忽视局部信息,例如近邻集合对用户或项目的关联影响。然而,当面对拥有丰富历史记录的用户时,通过结合近邻用户或项目的集合信息进行推荐,将有效提高预测的准确度。因此,Zhou等人在Tagrec:Leveragingtaggingwisdomforrecommendation.ComputationalScienceandEngineering[C],InternationalConferenceon.IEEE,2009,4:194-199提出了基于概率矩阵分解的TagRec模型,通过利用用户标签信息和评分信息来优化推荐效果。Wu等人在Leveragingtaggingforneighborhood-aware_probabilisticmatrixfactorization[C].Proceedingsofthe21stACMinternationalconferenceonInformationandknowledgemanagement.ACM,2012:1854-1858搭建了两阶段的推荐框架NHPMF,利用标签信息为用户或项目挑选近邻集合,然后将该近邻关系融入到PMF模型中。此外,从特征的角度出发,Zhang等人在AreFeaturesEquallyRepresentativeAFeature-CentricRecommendation[C].Twenty-NinthAAAIConferenceonArtificialIntelligence.2015中将标签作为项目的特征并提出了本文档来自技高网...

【技术保护点】
1.一种基于WUDiff和RMF的混合协同推荐算法,其特征在于,首先利用WUDiff算法将用户、项目和标签抽象成三部图中的节点,利用隐藏在带权重的三部图中的信息,挖掘网络中基于评分和标签的深层潜在相似用户的关联,寻找与目标用户相似的近邻集合,其次,利用RMF模型将用户‑项目评分矩阵分解成为用户特征矩阵和项目特征矩阵,通过降维提高了数据密度,最后利用WUDiff算法所获得的用户的近邻信息来规则化RMF模型。

【技术特征摘要】
1.一种基于WUDiff和RMF的混合协同推荐算法,其特征在于,首先利用WUDiff算法将用户、项目和标签抽象成三部图中的节点,利用隐藏在带权重的三部图中的信息,挖掘网络中基于评分和标签的深层潜在相似用户的关联,寻找与目标用户相似的近邻集合,其次,利用RMF模型将用户-项目评分矩阵分解成为用户特征矩阵和项目特征矩阵,通过降维提高了数据密度,最后利用WUDiff算法所获得的用户的近邻信息来规则化RMF模型。2.根据权利要求1所述的基于WUDiff和RMF的混合协同推荐算法,其特征在于,WUDiff算法中的“用户-项目-标签”可以采用图论中的三部图(TripartiteGraph)来表示,可以用G=(V,E)表示,其中节点V可以划分成互不相交的三个非空子集(U,I,T)分别表示用户、项目和标签集合,满足V=U∪I∪T,且3.根据权利要求2所述的基于WUDiff和RMF的混合协同推荐算法,其特征在于,通过WUDiff方法获得用户U的Top-k个近邻用户集合S(u),公式如下:用户集合为U,项目集合为I,k为近邻用户集合S(u)中用户数,uk为第k个...

【专利技术属性】
技术研发人员:陈洁敏李建国
申请(专利权)人:华南师范大学
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1