The invention relates to a combination of depth Bayesian model and collaborative heterogeneous information embedded in the movie recommendation method, including: (1) to construct weighted heterogeneous information network for data sets from various movies between any two different meta path; (2) calculating the similarity between the film of different meta path based on the similarity matrix (; 3) obtained by Bayesian SDAE low dimensional element film based on different paths that into probability matrix decomposition PMF model; (4) probability matrix decomposition results: potential to weight vector and the potential users of the film, the multiplication is the meta path users of the goods forecast score (; 5) using supervised learning algorithm to get different meta path users of the commodity value prediction score assigned different weights based on user final score; (6) the final score of the user Several high movies are recommended to users. The invention significantly improves the accuracy of the predicted user score.
【技术实现步骤摘要】
一种结合深度贝叶斯模型和协同异构信息嵌入的电影推荐方法
本专利技术涉及一种结合深度贝叶斯模型和协同异构信息嵌入的电影推荐方法,属于数据挖掘和机器学习的
技术介绍
移动互联网技术和数据存储技术的快速发展使得信息爆炸性增长,我们每天都要面对着纷繁复杂的信息,信息过载问题严重困扰着我们每一个人。推荐是解决信息过载的有效手段,也是最高效的信息过滤和发现技术之一。在不同的推荐技术中,协同过滤是应用最成功的推荐系统框架,它利用用户与商品之间的历史交互信息或用户对商品的偏好信息(比如用户对商品的评分)来做推荐。然而,传统的协同过滤的方法受数据稀疏性问题影响严重,用户与商品之间的交互近似服从幂律分布,也就是说绝大多数用户只对少量商品进行了评级,用户和商品之间的交互矩阵中含有大量的空值,严重影响着推荐的准确性。研究指出,在协同过滤推荐的基础上加入辅助信息可以提升推荐系统的推荐准确性,引入辅助信息也是缓解数据稀疏性问题的最普遍的方法。近年来,很多利用辅助信息改善协同过滤推荐性能的算法被提出,例如,TrustSVD算法将社交网络用户的信任关系与用户对商品的评分数据相结合,缓解 ...
【技术保护点】
一种结合深度贝叶斯模型和协同异构信息嵌入的电影推荐方法,其特征在于,包括以下步骤:(1)对数据集构建加权异构信息网络,并提取出任意两个电影之间多种不同的元路径;(2)计算基于某一元路径的两个电影之间的相似度,汇总得到基于不同元路径的任意两个电影之间的相似度矩阵,即基于元路径Pk的电影表示矩阵为Xc
【技术特征摘要】
1.一种结合深度贝叶斯模型和协同异构信息嵌入的电影推荐方法,其特征在于,包括以下步骤:(1)对数据集构建加权异构信息网络,并提取出任意两个电影之间多种不同的元路径;(2)计算基于某一元路径的两个电影之间的相似度,汇总得到基于不同元路径的任意两个电影之间的相似度矩阵,即基于元路径Pk的电影表示矩阵为Xc(k),k为整数,1≤k≤6,Pk表示6条不同的元路径中任意条元路径,将基于不同元路径的两个电影之间的相似度矩阵的每一行表示一个电影;(3)通过贝叶斯SDAE得到基于不同元路径的电影的低维表示,并将基于不同元路径的电影的低维表示融入到概率矩阵分解PMF模型中;(4)采用坐标下降法得到概率矩阵分解的结果:用户潜在向量矩阵和电影的潜在向量矩阵,两者的点乘即为当前元路径得到的用户对商品的预测评分值;(5)采用监督学习算法为步骤(4)求取的基于不同元路径得到的用户对商品的预测评分值分配不同的权重,融合为全面考虑多种元路径信息的用户最终评分值;(6)将用户最终评分值最高的几个电影推荐给用户;所述数据集为扩展MovieLens数据集,所述扩展MovieLens数据集是由grouplens研究组发布,所述数据集包括实体类型、表示及数目,实体包括用户、电影、演员、导演、国家、体裁、标签;实体类型包括用户类型、电影类型、演员类型、导演类型、国家类型、体裁类型、标签类型;表示是指对每种实体类型的表示字符,字符U表示用户类型,字符M表示电影类型,字符A表示演员类型,字符D表示导演类型,字符C表示国家类型,字符G表示体裁类型,字符T表示标签类型;数目是指每种实体类型的个数;所述元路径包括P1、P2、P3、P4、P5、P6,P1=MUM,P2=MAM,P3=MCM,P4=MDM,P5=MGM,P6=MTM;P1的语义信息是指:看过目标电影的用户观看过的电影;P2的语义信息是指:目标电影的主演演绎的电影;P3的语义信息是指:生产目标电影的国家生产的电影;P4的语义信息是指:指导目标电影的导演指导的电影;P5的语义信息是指:与目标电影有相同的体裁的电影;P6的语义信息是指:与目标电影有相同的标签的电影。2.根据权利要求1所述的一种结合深度贝叶斯模型和协同异构信息嵌入的电影推荐方法,其特征在于,所述步骤(1),对数据集构建加权异构信息网络,包括步骤如下:将数据集中的实体分别用节点表示,当两个实体之间存在某种联系时,则这两个实体对应的节点之间存在一条边,否则,不存在边,最终构建加权异构信息网络。3.根据权利要求1所述的一种结合深度贝叶斯模型和协同异构信息嵌入的电影推荐方法,其特征在于,所述步骤(2),采用HeteSim算法计算基于某一元路径的两个电影之间的相似度,汇总获取基于元路径Pk的相似度矩阵W(k),k为整数,1≤k≤6,Pk表示6条不同的元路径中任意一条元路径。4.根据权利要求1所述的一种结合深度贝叶斯模型和协同异构信息嵌入的电影推荐方法,其特征在于,所述步骤(2),计算基于不同元...
【专利技术属性】
技术研发人员:张舒,吴大雷,张秀真,
申请(专利权)人:济南浚达信息技术有限公司,
类型:发明
国别省市:山东,37
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。