一种电影推荐的冷启动解决方法技术

技术编号:18711465 阅读:39 留言:0更新日期:2018-08-21 22:46
本发明专利技术属于数据挖掘技术领域,设计了一种电影推荐的冷启动解决方法。该方法区别于已有方法的特色在于,将电影的各类属性信息结合到推荐过程中,并根据可靠性赋予相应权重,该方法能够有效的解决电影推荐过程中未评价电影的推荐问题,提高电影推荐的准确率与覆盖率。该方法通过非冷启动电影的评分数据来训练各类电影标签信息的可信度权重,然后通过训练后的结果再结合冷启动电影标签信息来计算冷启动电影的预测评分。该方法可以有效解决冷启动电影的评分预测问题,提高推荐结果的准确度。

A cold start solution for movie recommendation

The invention belongs to the field of data mining technology, and designs a solution for cold recommendation of movie recommendation. This method is different from the existing methods in that it combines all kinds of attribute information into the recommendation process and gives the corresponding weight according to the reliability. This method can effectively solve the problem of recommendation without evaluation in the process of film recommendation, and improve the accuracy and coverage of film recommendation. The method trains the credibility weights of all kinds of movie tag information by the score data of non-cold-start movies, and then calculates the predictive score of cold-start movies by combining the results of training with the cold-start movie tag information. This method can effectively solve the problem of score prediction in cold start movies and improve the accuracy of recommendation results.

【技术实现步骤摘要】
一种电影推荐的冷启动解决方法
本专利技术属于数据挖掘
,设计了一种电影推荐过程中冷启动问题的解决方法。该方法区别于已有方法的特色在于,将电影的各类属性信息结合到推荐过程中,并根据可靠性赋予相应权重,该方法能够有效的解决电影推荐过程中未评价电影的推荐问题,提高电影推荐的准确率与覆盖率。
技术介绍
电影推荐是数据挖掘领域一个重要应用,而在电影推荐领域应用范围最广的技术是协同过滤技术。协同过滤技术的基本核心思想是利用群体智慧,认为相似用户的喜好也是相似的,目前主要分为以下几类:基于用户(或项目)的协调过滤算法、基于模型的协同过滤算法、以及混合过滤算法等。协同过滤算法的基本过程是构建用户-项目评分矩阵,寻找用户相似邻居群体,根据邻居群体的对此用户未评价的项目的做出预测,然后根据结果对用户做出相应的推荐。目前协同过滤算法存在着冷启动、数据稀疏、推荐精度低等问题。其中冷启动问题在电影推荐过程中显得尤为突出,对于一些新上映的电影,由于没有评分记录,也就无法使用协同过滤算法寻找相似群体,进而无法进行推荐。
技术实现思路
本专利技术提出了一种电影推荐过程中冷启动问题的解决方法。目的在于解决没有评分记录电影的推荐问题。本专利技术的技术方案:一种电影推荐的冷启动解决方法,步骤如下:步骤1.构建评分矩阵的用户集合是U={u1,u2,...um};评分矩阵的电影集合I={i1,i2,...,in};电影类型标签集合T={t1,t2,t3...tx};电影导演标签集合D={d1,d2,d3...dy};电影演员标签集合A={a1,a2,a3...az};用户评分矩阵R(m×n),其中,m代表用户数,n代表电影个数;步骤2.计算非冷启动电影集合I(H)与冷启动电影集合I(C);其中,S(I)是电影集合中,电影评分记录数>阀值的电影集合;其中,Scold(I)是电影集合中,电影评分记录数为0的电影集合;步骤3.计算非冷启动电影评分矩阵R'R'={rk,j|ij∈I(H),rk,j∈R};其中rk,j是用户uk对电影ij的评分;步骤4.将非冷启动电影评分矩阵R'按照训练集Rt'rain是验证集Rt'estβ倍随机划分;步骤5.计算基于电影类型信息预测的预测平均绝对偏差值MAE(type);5.1)计算用户-电影类型评分矩阵Rtype(m×x)其中,是用户us对电影类型标签tw的评分;Tt'rain是训练集中电影的类型标签集合;Ut'rain是训练集中用户集合;I(tw)是训练集中电影类型为tw的电影集合;I(us)是训练集中用户us评分过的电影集合;是训练集中Rt'rain用户us对电影ib的评分;5.2)计算根据电影类型信息预测的预测绝对偏差值MAE(type)5.2.1)计算用户之间的相似度其中,simt(p,q)是用户up与用户uq在用户-电影类型评分矩阵Rtype(m×x)中的相似度;用户up∈Ut'rain;用户uq∈Ut'rain;T(p,q)是用户up与用户uq的共同评价过的电影类型标签集合。5.2.1)计算每个用户相似邻居集合S(uo)其中,S(uo)是与用户uo相似度最高的N1个用户组成的集合;用户uo∈Ut'rain;5.2.2)计算验证集Rt'est的预测评分矩阵R1其中,Ut'est是测试集中的用户集合;ug∈Ut'est;uh∈Ut'rain;S(ug)是用户ug的相似邻居集合;是训练集Rt'rain中用户uh对电影if的评分,是基于电影类别标签信息用户ug对电影if的预测评分;5.2.3)计算根据电影类型信息预测的预测绝对偏差值MAE(type)其中,是训练集Rt'rain中用户uz对电影iv的评分;是基于电影类别标签信息用户uz对电影iv的预测评分;步骤6.计算基于电影导演信息预测的预测绝对偏差值MAE(director),计算过程与步骤5一样;步骤7.计算基于电影演员信息预测的预测平均绝对偏差值MAE(actor),计算过程与步骤5一样。步骤8.计算电影类型信息权重αtype,电影导演信息权重αdirector,电影主演信息权重αactor8.1)计算三类电影信息偏差值的平均值8.2)计算三类电影信息偏差值的和sum(MAE)=MAE(type)+MAE(director)+MAE(actor)8.3)计算电影类型信息权重αtype,电影导演信息权重αdirector,电影主演信息权重αactor步骤9.计算冷启动电影的相似邻居集合9.1)计算冷启动电影的与非冷启动电影之间的相似度9.1.1)计算冷启动电影的与非冷启动电影之间的电影类别标签相似度其中,是电影电影类型标签集合;是电影电影类型标签集合;9.1.2)计算冷启动电影的与非冷启动电影之间的电影导演标签相似度其中,是电影电影导演标签集合;是电影电影类型导演标签集合。9.1.3)计算冷启动电影的与非冷启动电影之间的电影演员标签相似度其中,是电影演员标签集合;是电影演员标签集合。9.1.4)计算冷启动电影的与非冷启动电影之间的相似度9.2)计算冷启动电影的相似邻居群体其中,是冷启动电影的邻居群体,取与冷启动电影相似度最高的前N2个非冷启动电影作为其相似邻居群体;步骤10.计算冷启动电影的预测评分其中,是要预测的冷启动电影,是用户ut对未评分过电影的预测评分;rt,j是用户ut对非冷启动电影的评分;是待预测冷启动电影的相似电影集合。本专利技术的有益效果:该方法通过非冷启动电影的评分数据来训练各类电影标签信息(例如电影类型标签、电影演员标签、电影导演标签)的可信度权重,然后通过训练后的结果再结合冷启动电影标签信息来计算冷启动电影的预测评分。该方法可以有效解决冷启动电影的评分预测问题,提高推荐结果的准确度。附图说明图1是本专利技术所提出的电影推荐的冷启动解决方法的具体实施的程序流程图。具体实施方法下面结合附图对本专利技术的实施方式进行详细说明。本实施例以本专利技术技术方案为前提进行实施,给出了详细的实施方式和具体的操作过程,但本专利技术的保护范围不限于下述的实施例。步骤1.构建评分矩阵的用户集合是U={u1,u2,...um};评分矩阵的电影集合I={i1,i2,...,in};电影类型标签集合T={t1,t2,t3...tx};电影导演标签集合D={d1,d2,d3...dy};电影演员标签集合A={a1,a2,a3...az};用户评分矩阵R(m×n),其中,m代表用户数,n代表电影个数;步骤2.计算非冷启动电影集合I(H)与冷启动电影集合I(C);其中,S(I)是电影集合中,电影评分记录数>阀值的电影集合,阀值其中,Scold(I)是电影集合中,电影评分记录数为0的电影集合;步骤3.计算非冷启动电影评分矩阵R'R'={rk,j|ij∈I(H),rk,j∈R};其中,rk,j是用户uk对电影ij的评分;步骤4.将非冷启动电影评分矩阵R'按照训练集Rt'rain是验证集Rt'estβ倍随机划分,β=4;步骤5.计算基于电影类型信息预测的预测平均绝对偏差值MAE(type);5.1)计算用户-电影类型评分矩阵Rtype(m×x)其中,是用户us对电影类型标签tw的评分;Tt'rain是训练集中电影的类型标签集合;Ut'rain是训练集中用户集合;本文档来自技高网...

【技术保护点】
1.一种电影推荐的冷启动解决方法,其特征在于,步骤如下:步骤1.构建评分矩阵的用户集合是U={u1,u2,...um};评分矩阵的电影集合I={i1,i2,...,in};电影类型标签集合T={t1,t2,t3...tx};电影导演标签集合D={d1,d2,d3...dy};电影演员标签集合A={a1,a2,a3...az};用户评分矩阵R(m×n),其中,m代表用户数,n代表电影个数;步骤2.计算非冷启动电影集合I(H)与冷启动电影集合I(C);

【技术特征摘要】
1.一种电影推荐的冷启动解决方法,其特征在于,步骤如下:步骤1.构建评分矩阵的用户集合是U={u1,u2,...um};评分矩阵的电影集合I={i1,i2,...,in};电影类型标签集合T={t1,t2,t3...tx};电影导演标签集合D={d1,d2,d3...dy};电影演员标签集合A={a1,a2,a3...az};用户评分矩阵R(m×n),其中,m代表用户数,n代表电影个数;步骤2.计算非冷启动电影集合I(H)与冷启动电影集合I(C);其中,S(I)是电影集合中,电影评分记录数>阀值的电影集合;其中,Scold(I)是电影集合中,电影评分记录数为0的电影集合;步骤3.计算非冷启动电影评分矩阵R'R'={rk,j|ij∈I(H),rk,j∈R};其中rk,j是用户uk对电影ij的评分;步骤4.将非冷启动电影评分矩阵R'按照训练集R′train是验证集R′testβ倍随机划分;步骤5.计算基于电影类型信息预测的预测平均绝对偏差值MAE(type);5.1)计算用户-电影类型评分矩阵Rtype(m×x)其中,是用户us对电影类型标签tw的评分;T′train是训练集中电影的类型标签集合;U′train是训练集中用户集合;I(tw)是训练集中电影类型为tw的电影集合;I(us)是训练集中用户us评分过的电影集合;是训练集中R′train用户us对电影ib的评分;5.2)计算根据电影类型信息预测的预测绝对偏差值MAE(type)5.2.1)计算用户之间的相似度其中,simt(p,q)是用户up与用户uq在用户-电影类型评分矩阵Rtype(m×x)中的相似度;用户up∈U′train;用户uq∈U′train;T(p,q)是用户up与用户uq的共同评价过的电影类型标签集合;5.2.1)计算每个用户相似邻居集合S(uo)其中,S(uo)是与用户uo相似度最高的N1个用户组成的集合;用户uo∈U′train;5.2.2)计算验证集R′test的预测评分矩阵R1其中,U′test是测试集中的...

【专利技术属性】
技术研发人员:陈炳才刘杰王健余超姚念民卢志茂
申请(专利权)人:大连理工大学
类型:发明
国别省市:辽宁,21

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1