The invention relates to a method of weighted recommendation of heterogeneous information network based on the films, including the following steps: (1) the use of heterogeneous information network of semantic information and edge attribute information, calculate the similarity between users of different element based on path; (2) the similarity of different size were obtained based on the element applied to the collaborative filtering recommendation the algorithm based on the user, each user based on the similarity score; (3) using supervised learning algorithm to assign different weights for each user score, score fusion final value to fully consider the various meta path information users. Experimental results on extended MovieLens data sets show that the proposed algorithm significantly improves the accuracy of the proposed algorithm over traditional algorithms.
【技术实现步骤摘要】
本专利技术涉及一种基于加权异构信息网络的电影推荐方法,尤其涉及一种加权异构信息网络中基于元路径计算用户间相似度的新的协同过滤推荐方法,属于数据挖掘和机器学习的
技术介绍
协同过滤(CollaborativeFiltering)是推荐系统发展史上发展最快、应用最广的一类算法,其基本思想是相似的用户对商品的选取也是相似的,根据与目标用户最相似的K个邻居对目标项目的评分来进行推荐。其中,邻居用户是基于用户间的相似度得出的,最常用的相似度度量方式有Pearson相关系数和Cosine相似度。但是传统的相似度度量方式只考虑了用户评分这一个因素,评分矩阵是极其稀疏的,两个用户共同评价的项目非常少,在这种情况下得到的用户相似性是不准确的,最终推荐精度自然不高。近年来,随着数据库技术、机器学习技术以及网络科学的不断进步,社交网络朝异质性方向发展:网络中包含多种实体(Entity)、实体间存在多种关系(Relation),这种网络被称为异构信息网络(HeterogeneousInformationNetwork,HIN)。大数据时代的HIN包含丰富的语义信息,对其进行深度挖掘分析能够得到非常有意义的知识,而HIN中包含的更多的有效信息会带来更好地推荐效果,所以近年来在HIN上做推荐问题的研究开始兴起。以图1为例,HIN中不仅包含多种类型的实体(如:用户、电影和导演类型等),还包含着多种多样的边信息(如:用户对电影的评分、电影的各种属性和边的属性信息等)。为了更好地利用异构网络中所蕴含的多样性内容,可以用元路径(MetaPath)表示不同的关系,表示两个实体之间语 ...
【技术保护点】
一种基于加权异构信息网络的电影推荐方法,其特征在于,包括以下步骤:(1)对数据集构建加权异构信息网络,并提取出两用户间多种不同的元路径;(2)分别计算用户在对电影M、演员A、导演D、国家C、电影体裁G、电影标签T方面的偏好度;(3)分别针对用户在每一方面的偏好度,计算两用户间的相似度,若两用户在所有方面的偏好都相似,则两用户相似;否则,两用户偏好相差越大则两用户越不相似;(4)分别将受偏好度影响的6个相似度应用到协同过滤推荐算法中,预测用户对电影的评分;(5)应用经典的线性回归算法为每一个用户对电影的评分分配合适的权重,融合为最终的评分值;(6)将最终的评分值最高的几部电影推荐给该用户。
【技术特征摘要】
1.一种基于加权异构信息网络的电影推荐方法,其特征在于,包括以下步骤:(1)对数据集构建加权异构信息网络,并提取出两用户间多种不同的元路径;(2)分别计算用户在对电影M、演员A、导演D、国家C、电影体裁G、电影标签T方面的偏好度;(3)分别针对用户在每一方面的偏好度,计算两用户间的相似度,若两用户在所有方面的偏好都相似,则两用户相似;否则,两用户偏好相差越大则两用户越不相似;(4)分别将受偏好度影响的6个相似度应用到协同过滤推荐算法中,预测用户对电影的评分;(5)应用经典的线性回归算法为每一个用户对电影的评分分配合适的权重,融合为最终的评分值;(6)将最终的评分值最高的几部电影推荐给该用户。2.根据权利要求1所述的一种基于加权异构信息网络的电影推荐方法,其特征在于,所述数据集是指grouplens研究组发布的MovieLens10M扩展数据集,所述数据集包括实体类型、表示及数目,实体类型包括用户、电影、演员、导演、国家、体裁、标签;表示是指对每种实体类型的表示字符,字符U表示用户类型,字符M表示电影类型,字符A表示演员类型,字符D表示导演类型,字符C表示国家类型,字符G表示体裁类型,字符T表示标签类型;数目是指每种实体类型的个数;所述元路径包括P1、P2、P3、P4、P5、P6,P1=UMU,P2=UMAMU,P3=UMCMU,P4=UMDMU,P5=UMGMU,P6=UMTMU;P1的语义信息是指:与目标用户看过同一部电影的用户;P2的语义信息是指:与目标用户看过同一个演员演过的电影的用户;P3的语义信息是指:与目标用户看过在同一个国家上映的电影的用户;P4的语义信息是指:与目标用户看过由同一个导演执导的电影的用户;P5的语义信息是指:与目标用户看过属于同一个体裁的电影的用户;P6的语义信息是指:与目标用户看过被贴上同一个类型标签T的电影的用户。3.根据权利要求2所述的一种基于加权异构信息网络的电影推荐方法,其特征在于,所述步骤(2),用户ui对影响因素y的偏好度的求取公式如式(Ⅰ)所示:式(Ⅰ)中,ui表示用户,ui属于用户类型U;P为用户ui到影响因素y的元路径;为从ui到y的一个加权路径实例,w为该加权路径上的权重值;为ui到y的一个加权路径实例上的权重值;t(ui,y)为ui到y的所有加权路径实例上的权重值之和,即要求取的用户ui对影响因素y的偏好度;影响因素y包括电影、演员、导演、国家、体裁、标签;y属于影响因素y。4.根据权利要求3所述的一种基于加权异构信息网络的电影推荐方法,其特征在于,通过扩展交换矩阵快速计算用户在每一方面的偏好度,包括步骤如下:A、设定...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。