The invention belongs to the field of data mining technology, and designs a solution for cold recommendation of movie recommendation. This method is different from the existing methods in that it combines all kinds of attribute information into the recommendation process and gives the corresponding weight according to the reliability. This method can effectively solve the problem of recommendation without evaluation in the process of film recommendation, and improve the accuracy and coverage of film recommendation. The method trains the credibility weights of all kinds of movie tag information by the score data of non-cold-start movies, and then calculates the predictive score of cold-start movies by combining the results of training with the cold-start movie tag information. This method can effectively solve the problem of score prediction in cold start movies and improve the accuracy of recommendation results.
【技术实现步骤摘要】
一种电影推荐的冷启动解决方法
本专利技术属于数据挖掘
,设计了一种电影推荐过程中冷启动问题的解决方法。该方法区别于已有方法的特色在于,将电影的各类属性信息结合到推荐过程中,并根据可靠性赋予相应权重,该方法能够有效的解决电影推荐过程中未评价电影的推荐问题,提高电影推荐的准确率与覆盖率。
技术介绍
电影推荐是数据挖掘领域一个重要应用,而在电影推荐领域应用范围最广的技术是协同过滤技术。协同过滤技术的基本核心思想是利用群体智慧,认为相似用户的喜好也是相似的,目前主要分为以下几类:基于用户(或项目)的协调过滤算法、基于模型的协同过滤算法、以及混合过滤算法等。协同过滤算法的基本过程是构建用户-项目评分矩阵,寻找用户相似邻居群体,根据邻居群体的对此用户未评价的项目的做出预测,然后根据结果对用户做出相应的推荐。目前协同过滤算法存在着冷启动、数据稀疏、推荐精度低等问题。其中冷启动问题在电影推荐过程中显得尤为突出,对于一些新上映的电影,由于没有评分记录,也就无法使用协同过滤算法寻找相似群体,进而无法进行推荐。
技术实现思路
本专利技术提出了一种电影推荐过程中冷启动问题的解决方法。目的在于解决没有评分记录电影的推荐问题。本专利技术的技术方案:一种电影推荐的冷启动解决方法,步骤如下:步骤1.构建评分矩阵的用户集合是U={u1,u2,...um};评分矩阵的电影集合I={i1,i2,...,in};电影类型标签集合T={t1,t2,t3...tx};电影导演标签集合D={d1,d2,d3...dy};电影演员标签集合A={a1,a2,a3...az};用户评分矩阵R(m×n),其 ...
【技术保护点】
1.一种电影推荐的冷启动解决方法,其特征在于,步骤如下:步骤1.构建评分矩阵的用户集合是U={u1,u2,...um};评分矩阵的电影集合I={i1,i2,...,in};电影类型标签集合T={t1,t2,t3...tx};电影导演标签集合D={d1,d2,d3...dy};电影演员标签集合A={a1,a2,a3...az};用户评分矩阵R(m×n),其中,m代表用户数,n代表电影个数;步骤2.计算非冷启动电影集合I(H)与冷启动电影集合I(C);
【技术特征摘要】
1.一种电影推荐的冷启动解决方法,其特征在于,步骤如下:步骤1.构建评分矩阵的用户集合是U={u1,u2,...um};评分矩阵的电影集合I={i1,i2,...,in};电影类型标签集合T={t1,t2,t3...tx};电影导演标签集合D={d1,d2,d3...dy};电影演员标签集合A={a1,a2,a3...az};用户评分矩阵R(m×n),其中,m代表用户数,n代表电影个数;步骤2.计算非冷启动电影集合I(H)与冷启动电影集合I(C);其中,S(I)是电影集合中,电影评分记录数>阀值的电影集合;其中,Scold(I)是电影集合中,电影评分记录数为0的电影集合;步骤3.计算非冷启动电影评分矩阵R'R'={rk,j|ij∈I(H),rk,j∈R};其中rk,j是用户uk对电影ij的评分;步骤4.将非冷启动电影评分矩阵R'按照训练集R′train是验证集R′testβ倍随机划分;步骤5.计算基于电影类型信息预测的预测平均绝对偏差值MAE(type);5.1)计算用户-电影类型评分矩阵Rtype(m×x)其中,是用户us对电影类型标签tw的评分;T′train是训练集中电影的类型标签集合;U′train是训练集中用户集合;I(tw)是训练集中电影类型为tw的电影集合;I(us)是训练集中用户us评分过的电影集合;是训练集中R′train用户us对电影ib的评分;5.2)计算根据电影类型信息预测的预测绝对偏差值MAE(type)5.2.1)计算用户之间的相似度其中,simt(p,q)是用户up与用户uq在用户-电影类型评分矩阵Rtype(m×x)中的相似度;用户up∈U′train;用户uq∈U′train;T(p,q)是用户up与用户uq的共同评价过的电影类型标签集合;5.2.1)计算每个用户相似邻居集合S(uo)其中,S(uo)是与用户uo相似度最高的N1个用户组成的集合;用户uo∈U′train;5.2.2)计算验证集R′test的预测评分矩阵R1其中,U′test是测试集中的...
【专利技术属性】
技术研发人员:陈炳才,刘杰,王健,余超,姚念民,卢志茂,
申请(专利权)人:大连理工大学,
类型:发明
国别省市:辽宁,21
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。