当前位置: 首页 > 专利查询>武汉大学专利>正文

一种基于异构信息网络的电影推荐方法技术

技术编号:15437487 阅读:342 留言:0更新日期:2017-05-26 03:33
一种基于异构信息网络的电影推荐方法,包括链接建模,以用户、电影、电影类型三种类型的对象为结点构建用户‑电影异构网络,以电影类型结点为中心,对异构网络进行社团划分,筛选出符合要求的社团,提高其运算速度和效率,利用异构网络中的元路径,计算目标用户与社团中的每个用户之间的影响力,计算目标用户与电影类型的喜爱程度,特征建模,分析目标用户的每一个特征被划分到每种电影类型的概率,综合计算目标用户对每个电影类型的喜爱程度,对链接建模和特征建模的结果进行加权求和,分析目标用户对每一种电影类型的喜爱程度,按照目标用户对每一种电影类型的喜爱程度,选择电影类型,推荐评分高的电影。

A movie recommendation method based on heterogeneous information network

A recommended method of heterogeneous information network based on the films, including links to user modeling, object type, movie film, three types of users for the construction of film heterogeneous network nodes, the film type node as the center of community partitioning for heterogeneous network, select the conformity of society, improve the operation speed and efficiency the use of meta path, in heterogeneous network, the calculation between the target users and each user in the community's influence, calculate the affection degree, the target user and the type of film feature modeling, analysis of each target user characteristics is divided into the probability of each type of film, the comprehensive calculation target users love for each type of film the link of modeling and feature modeling results of weighted sum, analysis of target users love for each type of film, in accordance with the order The standard user's preference for each type of film, the type of film, and the high scoring movie.

【技术实现步骤摘要】
一种基于异构信息网络的电影推荐方法
本专利技术属于数据挖掘应用中个性化推荐
,特别是涉及一种基于异构信息网络的电影推荐方法。
技术介绍
(1)推荐系统随着互联网的迅速普及,大数据时代已经到来,随之而来的是信息过载问题,如何进行个性化的信息筛选和呈现是各类互联网应用领域中亟待解决的问题。采用科学的方法深度挖掘用户的兴趣并生成个性化推荐即构建个性化推荐系统,是解决这一问题的主要手段。个性化推荐系统基于用户特征、兴趣和历史行为数据构建用户信息模型,使用特定的推荐技术,进而挖掘用户个人偏好,生成对目标用户的推荐。目前,主要的推荐系统有协同过滤推荐,基于内容的推荐,基于网络的推荐等。1)协同过滤推荐协同过滤推荐的思想是,根据目标用户的历史偏好,为目标用户或项目找到相似项,根据相似项对项目进行评分并推荐给目标用户,即最近邻技术。协同过滤推荐是推荐系统中运用最成功的推荐技术之一,在各种环境下被广泛运用,许多不同领域算法和技术都相继用于改进和优化其性能。按照分析对象分类,协同过滤推荐有基于用户的最近邻推荐和基于项目的最近邻推荐。基于用户的最近邻推荐的基本思想:第一步,根据一个用户对项目的评分数据集,寻找与目标用户有相似偏好的其他用户,这些用户被称为最近邻;第二步,如果目标用户没有对某一项目评分,则依据最近邻过去对该项目的评分来预测目标用户对改项目的评分。基于项目的最近邻推荐的思想与此类似。协同过滤算法简单、高效且准确率高,然而协同过滤推荐是从用户历史数据出发的,对于没有评分过的用户和没有被评分过的项目,则永远无法被推荐,即冷启动问题,这就是协同过滤算法的固有缺点。另外,实际情况下,数据库中的评分数据往往是稀疏的,所以,也存在数据稀疏的问题。2)基于内容的推荐基于内容的推荐主要运用于信息过滤,与协同过滤不同的是,基于内容的推荐不以用户对项目的评分为依据,而是基于用户本身的特征来判断用户的偏好,匹配与用户偏好相似度高的项目,进行推荐。基于内容的推荐只需要项目和用户的特征信息,不需要大量的用户数量和历史评分数据,只需要对目标用户的特征信息进行提取分析,就可以进行项目匹配推荐,有效避免了由于数据稀松导致的误差,也避免了新用户或者新项目在没有历史评分记录的情况下存在的冷启动问题,另外,由于推荐是基于用户或者项目的特征产生的,方便向用户解释推荐理由。然而,现有的技术对于内容的分析也就是对于用户或者项目的特征的提取仅限于一些简单的文本内容,较为复杂的内容分析还存在一定的困难,所以基于内容的推荐对用户兴趣的挖掘深度有限,推荐准确度有限。而且用户对于项目的爱好会随着时间发生改变,基于内容的推荐很难向用户推荐一些新的可能会感兴趣的项目。3)基于网络的推荐典型复杂网络近年来在各个学科领域被广泛研究,逐渐成为一个独立的研究方向。随着复杂网络的研究技术逐渐走向成熟,越来越多的研究者正在尝试将复杂网络运用到推荐系统中,基于网络的推荐也就发展起来。相对于基于内容的推荐,基于网络的推荐不用用户或者项目的特征信息,而是使用用户和项目作为结点,使用用户和项目之间的关系作为边,构建一个网络图。一般而言,基于网络的推荐都是通过一些算法来挖掘网络路径中潜在的用户偏好,比如使用随即游走算法来计算用户之间的相似度,用户与用户之间的路径数量和路径长度就代表着用户之间的影响力。(2)异构网络由单一研究对象构成的网络称为同构网络,而与之相对应的则是由多种研究对象构成的异构网络。异构网络符合现实世界的关系模型,更容易包含用户之间、用户与项目之间的一些潜在的信息,因此,异构网络成为数据挖掘领域个性化推荐新兴的一种挖掘技术,尤其是面对多种研究对象的研究。一般,网络的表示形式是G=(V,E,W),其中V代表研究对象的集合,E代表研究对象之间的链接关系的集合,W代表研究对象之间链接关系的权重的集合。对于异构网络,|V|>1或者|E|>1,表示网络中有多种类型的对象或者多种链接关系。与同构网络相比,异构网络不仅可以体现同种类型对象之间的关系,也可以体现不同类型对象之间的关系,如果同种类型之间并无直接联系,还可以通过其他类型对象得到同种类型之间的间接联系,这是异构网络最大的特点,也是其被广泛运用于现实世界中的聚类、分类、预测等研究的根本原因。因此,如何充分利用异构网络的优势,深度挖掘出异构网络中潜在的用户偏好,提高异构网络运用时的计算速度和效率,是将异构网络运用于数据挖掘领域个性化推荐时面临的主要问题。
技术实现思路
针对现有的个性化推荐系统中普遍存在的冷启动、数据稀疏和文本特征分析技术有限等问题,本专利技术对现有的基于网络的推荐方法进行改进,基于用户特征信息建立子模型,结合异构网络元路径中潜在的信息,实现一种基于异构信息网络的电影推荐方法。在此基础之上,对异构网络进行社团划分和筛选,提高其运算速度和效率,充分发挥异构网络的优势。本专利技术提供的技术方案是一种基于异构信息网络的电影推荐方法,包括以下步骤:一种基于异构信息网络的电影推荐方法,其特征在于,包括以下步骤:步骤1,链接建模,以用户、电影、电影类型三种类型的对象为结点构建用户-电影异构网络,并计算用户与电影类型之间的权值,具体是:定义用户-电影异构网络模型G=(V,E,W),其中V=Vu∪Vm∪Vt,Vu表示用户集合,Vm表示电影集合,Vt表示电影类型集合,E=Euu∪Emm∪Ett∪Eum∪Eut∪Emt,其中,Euu表示用户与用户之间的链接关系,Emm表示电影与电影之间的链接关系,Ett表示电影类型与电影类型之间的链接关系,Eum表示用户与电影之间的链接关系,Eut用户与电影类型之间的链接关系,Emt表示电影与电影类型之间的链接关系;W表示所有链接关系的权重集合,所述链接关系分别为用户与用户之间的链接关系、电影类型之间的链接关系、用户与电影之间的链接关系。步骤2,以电影类型结点为中心,对异构网络进行社团划分,一种电影类型为一个社团,查找不同社团两两之间的共同结点,并计算电影类型之间的权值;具有包括:步骤2.1,利用元路径搜索将异构网络中不同类型的结点以电影类型为中心进行划分,具有相似特征的结点被划分到一个社团当中,划分的结果是社团内结点具有高内聚,社团间结点具有低耦合的特征。划分社团的个数就是电影类型的个数,每一个社团包含该电影类型以及对该电影类型相关的电影进行过评分的用户即喜爱改电影类型相关电影的用户群,一个社团可以包含多个用户,一个用户也可能存在多个社团中,实际实施时用户结点与相邻的电影类型结点的权值可以使用数组a[|Mtype|][|Mtypei|]来存储,|Mtype|表示电影类型种数,|Mtypei|表示属于第i中类型的用户的数量,a[i][j]表示第i种电影类型与该类型电影中第j个用户之间的权值,步骤2.2,基于计算电影类型之间的权值,其中Mi∩Mj表示这两种电影类型共同的电影集合,mk代表电影集合中的电影,而相应的gk,i代表用户i对于电影mk的评分;Mi∩Mj表示这两种类型电影的并集。步骤3,计算目标用户与每个社团即每个电影类型结点之间的相关程度,设置阀值,筛选出符合要求的社团;目标用户与每个社团之间的初始相关程度的计算与Dijkstra算法相似,唯一不同的在于,对于源点到其他结点的所有路径,Dijk本文档来自技高网
...
一种基于异构信息网络的电影推荐方法

【技术保护点】
一种基于异构信息网络的电影推荐方法,其特征在于,包括以下步骤:步骤1,链接建模,以用户、电影、电影类型三种类型的对象为结点构建用户‑电影异构网络,并计算用户与电影类型之间的权值,具体是:定义用户‑电影异构网络模型G=(V,E,W),其中V=V

【技术特征摘要】
1.一种基于异构信息网络的电影推荐方法,其特征在于,包括以下步骤:步骤1,链接建模,以用户、电影、电影类型三种类型的对象为结点构建用户-电影异构网络,并计算用户与电影类型之间的权值,具体是:定义用户-电影异构网络模型G=(V,E,W),其中V=Vu∪Vm∪Vt,Vu表示用户集合,Vm表示电影集合,Vt表示电影类型集合,E=Euu∪Emm∪Ett∪Eum∪Eut∪Emt,其中,Euu表示用户与用户之间的链接关系,Emm表示电影与电影之间的链接关系,Ett表示电影类型与电影类型之间的链接关系,Eum表示用户与电影之间的链接关系,Eut用户与电影类型之间的链接关系,Emt表示电影与电影类型之间的链接关系;W表示所有链接关系的权重集合,所述链接关系分别为用户与用户之间的链接关系、电影类型之间的链接关系、用户与电影之间的链接关系;步骤2,以电影类型结点为中心,对异构网络进行社团划分,一种电影类型为一个社团,查找不同社团两两之间的共同结点,并计算电影类型之间的权值;具有包括:步骤2.1,利用元路径搜索将异构网络中不同类型的结点以电影类型为中心进行划分,具有相似特征的结点被划分到一个社团当中,划分的结果是社团内结点具有高内聚,社团间结点具有低耦合的特征;划分社团的个数就是电影类型的个数,每一个社团包含该电影类型以及对该电影类型相关的电影进行过评分的用户即喜爱改电影类型相关电影的用户群,一个社团可以包含多个用户,一个用户也可能存在多个社团中,实际实施时用户结点与相邻的电影类型结点的权值可以使用数组a[|Mtype|][|Mtypei|]来存储,|Mtype|表示电影类型种数,|Mtypei|表示属于第i中类型的用户的数量,a[i][j]表示第i种电影类型与该类型电影中第j个用户之间的权值,步骤2.2,基于计算电影类型之间的权值,其中Mi∩Mj表示这两种电影类型共同的电影集合,mk代表电影集合中的电影,而相应的gk,i代表用户i对于电影mk的评分;Mi∩Mj表示这两种类型电影的并集;步骤3,计算目标用户与每个社团即每个电影类型结点之间的相关程度,设置阀值,筛选出符合要求的社团;目标用户与每个社团之间的初始相关程度的计算与Dijkstra算法相似,唯一不同的在于,对于源点到其他结点的所有路径,Dijkstra算法得到的是最短距离,而在此计算的是所有路径长度的和;其中结点之间权值的计算分为两种,一种是用户结点与电影类型结点的权值,一种是电影类型结点之间的权值;步骤4,对于每一个符合要求的社团,基于目标用户到电影类型结点的初始相关程度,计算目标用户与社团中的每个用户之间的影响力,其中,用户之间的影响力就是用户之间的相似性,其计算步骤为,确定与目标用户存在元路径的用户,计算元路径每一段路径的权值,根据元路径复合规则计算两用户之间的相似性;步骤5,计算目标用户与符合要求的社团所代表的电影类型的喜爱程度,用目标用户与社团中每一个用户之间的影响力的均值来表示,社团中各结点对目标用户影响力的平均值作为用户划分到该社团的概率,即目标用户对于改社团所代表的电影类型的喜爱程度,平均值越大,目标用户划分到该社团概率越大,喜爱对应类型电影可能性越高;令目标用户划分到社团ck的概率为P2(ck|u0),其计算过程如公式其中,uk属于社团ck中的用户结点,|ck|表示其中结点的个数,sim(u0,uk)表示目标用户u0和uk之间的相互影响力;步骤6,特征建模,基于经典朴树贝叶斯分类进行用户单个特征属性分类,分析目标用户的每一个特征被划分到每种电影类型的概率;步骤7,基于目标用户的每一个特征被划分的概率,综合计算目标用户对每个电影类型的喜爱程度;步骤8,结合步骤5与步骤7中分别得出的用户对每一种电影类型的喜爱程度,进行加权求和,分析目标用户对每一种电影类型的喜爱程度;步骤9,按照目标用户对每一种电影类型的喜爱程度,选择电影类型,推荐评分高的电影,具体是,选择用户喜爱程度最高的前k种电影类型,分别从这些电影类型中选择评分高于一定值的前m部电影推荐给目标用户。2.根据权利要求1所述的一种基于异构信息网络的电影推荐方法,其特征在于,所述步骤4具体包括:步骤4.1、两个电影用户之间的相互影响力计算依据用户间的元路径,用户之间的相互影响包括直接影响和间接影响;所述间接影响为用户之间存在一条路径,用户影响力依靠路径影响彼此相邻结点;所述直接影响为结点之间有链接关系,即彼此为相邻结点,那么彼此...

【专利技术属性】
技术研发人员:余啸刘进殷晓飞崔晓晖杨威井溢洋
申请(专利权)人:武汉大学
类型:发明
国别省市:湖北,42

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1