一种基于用户兴趣模型的电影个性化相似度计算方法技术

技术编号:11204530 阅读:267 留言:0更新日期:2015-03-26 12:37
本发明专利技术公开了一种基于用户兴趣模型的电影个性化相似度计算方法,该方法根据用户的历史行为,即通过个性化电影推荐系统平台,挖掘用户对电影资源库的各种搜索行为以及观影和收藏行为;充分挖掘和分析不同用户在电影的演员、导演、类型、地区、时间、内容简介这六个基本属性上的不同的偏爱程度,即得到用户模型的第一层六维空间向量表示;根据用户上述行为,通过关键字提取或者语义分析,分析不同用户在上述六个维度上各特征值所占的权重,即得到用户模型的第二层六维空间向量表示;用一个两层的多维空间向量表示用户的兴趣模型,基于用户的兴趣模型和电影的基本内容特征,针对不同用户生成不同的电影相似度列表,从而提高推荐的效果。

【技术实现步骤摘要】

本专利技术涉及一种基于老用户兴趣模型的电影个性化相似度计算方法、以及一种针对新用户的电影个性化相似度计算方法。
技术介绍
随着互联网的飞速发展,面对日益更新的海量电影资源,个性化推荐应用也就随机产生。当前主要流行的推荐算法有:基于关联规则的推荐、基于知识的推荐、基于内容的推荐、协同过滤推荐和组合推荐等。以上推荐算法均涉及到一个关键技术,即:计算物品间相似度,根据相似度找到物品的最近邻居。传统的计算电影相似度的方法都只跟电影自身的内容特征有关,没有考虑不同用户的兴趣偏好对电影的影响。按照现有的计算方法体现不出个性化的特点,这样的用户体验很难得到用户满意。在真正的个性化推荐系统中,用户兴趣模型是基础、个性化推荐算法是核心。个性化电影推荐应该充分考虑三个方面的信息来源:1)用户信息库,即用户的基本信息,包括年龄、性别、职业等;2)商品信息库,即电影的属性信息,包括演员、导演、类型、内容简介、地区、发布时间等;3)用户历史信息库,即用户使用过程中的历史记录,包括对演员、导演、类型、地区、发布时间、内容简介等各方面不同的偏爱程度。以上信息来源非常关键,只有充分利用此信息库建立用户兴趣模型,才能做到更好的推荐。
技术实现思路
针对现有技术中存在的上述技术问题,本专利技术提出了一种基于老用户兴趣模型的电影个性化相似度计算方法,通过充分挖掘和利用用户的历史数据,建立每个用户各自的用户兴趣模型,然后基于用户兴趣模型计算电影相似度,形成个性化的电影相似度列表。为了实现上述目的,本专利技术采用如下技术方案:一种基于老用户兴趣模型的电影个性化相似度计算方法,包括步骤:s1、基于某段时间T内的用户行为数据和该段时间内观影记录中评价最高的N部电影,建立用户动态行为信息库;s2、对上述用户动态行为信息库进行数据挖掘,得到用户对电影各维度的偏好、以及用户对电影中各维度上特征值的偏好,构建用户兴趣模型;其中,(1)用户对电影各维度的偏好采用空间向量可表示为一个六元组,即:V={V1:w1,V2:w2,V3:w3,V4:w4,V5:w5,,V6:w6本文档来自技高网...
一种<a href="http://www.xjishu.com/zhuanli/55/201410753644.html" title="一种基于用户兴趣模型的电影个性化相似度计算方法原文来自X技术">基于用户兴趣模型的电影个性化相似度计算方法</a>

【技术保护点】
一种基于老用户兴趣模型的电影个性化相似度计算方法,其特征在于,包括步骤:s1、基于某段时间T内的用户行为数据和该段时间内观影记录中评价最高的N部电影,建立用户动态行为信息库;s2、对上述用户动态行为信息库进行数据挖掘,得到用户对电影各维度的偏好、以及用户对电影中各维度上特征值的偏好,构建用户兴趣模型;其中,(1)用户对电影各维度的偏好采用空间向量可表示为一个六元组,即:V={V1:w1,V2:w2,V3:w3,V4:w4,V5:w5,,V6:w6}  (1.1)Vi表示电影的维度,wi表示用户对电影各个维度的权重,i∈[1,6],且通过对用户的搜索行为、条件查询行为的统计分析,以及对T段时间内用户高评分的N部电影的特征提取,挖掘用户在演员、导演、类型、地区、时间和内容简介六个维度不同的偏好程度,求得各维度权重wi;(2)用户对电影中各维度上特征值的偏好可表示为:Vi={Tij:Wij}  (1.2)式中,Tij为第i维度中的第j个特征值,Wij为第i维度中特征值j的权重,且通过用户的搜索行为,挖掘用户感兴趣的演员和导演信息,通过用户对类型、时间、地区不同条件下的筛选查看,挖掘用户对这三个维度上感兴趣的特征值信息;通过分析用户高评分的N条观影记录和收藏记录,提取电影各维度特征值信息;综合以上分析,计算各维度各特征值的权重,即:Vij=wi*Wij  (1.3)式中,Vij表示在第i维度中第j个特征值的兴趣度,i∈[1,6],j∈[1,n);s3、通过用户兴趣模型对电影六个维度的分析,根据公式(1.4)计算电影A和电影B之间各维度的相似度,生成个性化电影相似度表;sim(MiA,MiB)=Σj∈(MA∩MB)(VijA+VijB)2---(1.4)]]>式中,i∈[1,4],分别表示电影的演员、导演、类型、地区四个维度,j表示维度上特征值,Vij表示电影在第i个维度上第j个特征值的权重;电影A和电影B在时间维度上的相似度计算公式为:sim(M5A,M5B)=min(|Date-DA|,|Date-DB|)max(|Date-DA|,|Date-DB|)---(1.5)]]>式中,Date表示当前的时间,DA表示电影A的发布时间,DB表示电影B的发布时间,min()表示取最小值,max()表示取最大值;电影A和电影B在内容简介维度上的相似度计算公式为sim(M6A,M6B),利用Simhash算法计算得到;s4、根据s2和s3中得到的各维度权重及其各维度相似度,利用公式(1.6)计算电影相似度:Sim=Σi=1i=6wi·sim(MiA,MiB)---(1.6)]]>式中,wi表示对应各维度的权重,sim(MiA,MiB)表示对应各维度的相似度,i∈[1,6]。...

【技术特征摘要】
1.一种基于老用户兴趣模型的电影个性化相似度计算方法,其特征在于,包括步骤:
s1、基于某段时间T内的用户行为数据和该段时间内观影记录中评价最高的N部电影,
建立用户动态行为信息库;
s2、对上述用户动态行为信息库进行数据挖掘,得到...

【专利技术属性】
技术研发人员:赵建立张春升吴文敏孟芳
申请(专利权)人:山东科技大学
类型:发明
国别省市:山东;37

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1