当前位置: 首页 > 专利查询>四川大学专利>正文

基于协同过滤与关联规则并行处理的精准推荐系统及方法技术方案

技术编号:16327378 阅读:52 留言:0更新日期:2017-09-29 19:10
本发明专利技术涉及计算机技术中的数据处理及推荐,其公开了一种基于协同过滤与关联规则并行处理的精准推荐系统及方法,解决传统技术中的推荐系统无法适应于如同电影这种指标体系庞大且繁琐的行业的推荐问题,实现精准推荐。所述推荐方法包括:a.数据预处理阶段:收集影片指标属性信息和用户特征指标信息,并进行预处理,作为预测及推荐的基础数据;b.预测及推荐阶段:基于关联规则对影片指标属性进行计算,生成针对目标用户的特定影片群,并基于协同过滤规则对用户特征指标进行计算,找出相似用户群,最后向具有同一爱好取向的目标用户推荐特定影片,并预测未来的用户群;c.评价阶段:对预测结果的准确性进行评价。本发明专利技术适用于电影行业中为目标用户推荐特定影片。

【技术实现步骤摘要】
基于协同过滤与关联规则并行处理的精准推荐系统及方法
本专利技术涉及计算机技术中的数据处理及推荐,具体涉及一种基于协同过滤与关联规则并行处理的精准推荐系统及方法。
技术介绍
随着网络技术、信息技术和计算机技术飞速发展,早在2010年,全球就进入了大数据时代。如何准确地发现用户的购买偏好并向其进行推荐是当前的一项研究热点问题。但是,电影不同于一般的零售商品,其涉及到多个指标体系,用户兴趣取向及口味各不相同,因此传统单一的推荐系统并不能完全达到精准推荐的目的。
技术实现思路
本专利技术所要解决的技术问题是:提出一种基于协同过滤与关联规则并行处理的精准推荐系统及方法,解决传统技术中的推荐系统无法适应于如同电影这种指标体系庞大且繁琐的行业的推荐问题,实现精准推荐。本专利技术解决上述技术问题所采用的方案是:基于协同过滤与关联规则并行处理的精准推荐系统,包括数据预处理模块、预测及推荐模块、评价模块;数据预处理模块,用于收集影片指标属性信息和用户特征指标信息,并进行预处理,作为预测及推荐模块的基础数据;预测及推荐模块,用于基于关联规则对影片指标属性进行计算,生成针对目标用户的特定影片群,并基于协同过滤规则对用户特征指标进行计算,找出相似用户群,最后向具有同一爱好取向的目标用户推荐特定影片;评价模块,用于预测结果的准确性进行评价。作为进一步优化,所述影片指标属性信息包括:电影ID、电影名、导演、编剧、主演、类型、制片国家/地区、语言、上映日期、片长、评分、标签、评论ID、评论内容、评论者、评论点赞数。作为进一步优化,所述用户特征指标信息包括:用户ID、用户名、历史观看、历史评分、历史评论、标签。此外,本专利技术还提供了一种基于协同过滤与关联规则并行处理的精准推荐方法,其包括以下步骤:a.数据预处理阶段:收集影片指标属性信息和用户特征指标信息,并进行预处理,作为预测及推荐的基础数据;b.预测及推荐阶段:基于关联规则对影片指标属性进行计算,生成针对目标用户的特定影片群,并基于协同过滤规则对用户特征指标进行计算,找出相似用户群,最后向具有同一爱好取向的目标用户推荐特定影片,并预测未来的用户群;c.评价阶段:对预测结果的准确性进行评价。作为进一步优化,步骤a中,所述预处理包括:利用深度学习的方法对缺失数据进行填补,对于类别型数据则可以直接将其映射为新的布尔型数据;对于数值型数据,采用C均值模糊分类法将其划分为多个类,产生隶属度矩阵。作为进一步优化,步骤b中,所述基于关联规则对影片指标属性进行计算,具体包括:首先检索出目标数据库中的所有频繁项集,然后利用频繁项集构造出满足最小信任度的关联规则,根据该关联规则输出目标用户。作为进一步优化,步骤b中,所述基于协同过滤规则对用户特征指标进行计算,具体包括:首先构建活跃用户的用户-属性评分矩阵,然后利用皮尔森相关系数或者余弦相似度为活跃用户找出k个最相似的用户形成用户邻居集合,在相似度的计算过程中,每个用户都被看成是一个n维向量,用户之间的相似度通过向量之间的相似度表示。作为进一步优化,步骤b中,所述向具有同一爱好取向的目标用户推荐特定影片的方法,具体包括:用户邻居集合计算好以后,通过统计该邻居集合中所有用户观看的影片群的出现频率,并根据频率对影片群进行排序,将目标群落推荐给他。作为进一步优化,所述活跃用户的用户-属性评分矩阵中,属性包括:历史观看、历史评分、历史评论、标签。作为进一步优化,步骤c中,所述对预测结果进行评价时,采用预测准确性评价指标为平均绝对误差MAE和根均方误差RMSE,公式分别是:其中,rui和分别是用户u对项目i的实际评分和预测评分,n表示待预测项目的个数;这两项指标的值越小表示预测的准确性越高。本专利技术的有益效果是:借助于关联规则,发现相似类型、风格、演职员、评论内容等的电影群,然后运用协同过滤方法,指出拥有同样爱好取向的用户,并预测未来的用户群;采用本专利技术的方案可以提高电影线上集合网站识别目标用户的效率和推荐的精准性。附图说明图1为本专利技术实施例中的推荐方法流程图;图2为推荐算法示意图。具体实施方式本专利技术旨在提出一种基于协同过滤与关联规则并行处理的精准推荐系统及方法,解决传统技术中的推荐系统无法适应于如同电影这种指标体系庞大且繁琐的行业的推荐问题,实现精准推荐。本专利技术提出的基于协同过滤与关联规则并行处理的精准推荐系统,包括数据预处理模块、预测及推荐模块、评价模块三个部分;其中:数据预处理模块,用于收集影片指标属性信息和用户特征指标信息,并进行预处理,作为预测及推荐模块的基础数据;预测及推荐模块,用于基于关联规则对影片指标属性进行计算,生成针对目标用户的特定影片群,并基于协同过滤规则对用户特征指标进行计算,找出相似用户群,最后向具有同一爱好取向的目标用户推荐特定影片;评价模块,用于预测结果的准确性进行评价。在具体实现上,本专利技术中确定的影片指标属性信息包括:电影ID、电影名、导演、编剧、主演、类型、制片国家/地区、语言、上映日期、片长、评分、标签、评论ID、评论内容、评论者、评论点赞数。本专利技术中确定的用户特征指标信息包括:用户ID、用户名、历史观看、历史评分、历史评论、标签。数据预处理过程是对收集的数据的降维、简化过程,从而生成供预测及推荐模块使用的目标数据。在数据收集时,利用深度学习的方法对缺失数据进行填补,对于类别型数据则可以直接将其映射为新的布尔型数据;对于数值型数据,采用C均值模糊分类法将其划分为多个类,产生隶属度矩阵。基于上述推荐系统,本专利技术的实施例实现的推荐方法如图1所示;其包括:1、数据预处理阶段:收集影片指标属性信息和用户特征指标信息,建立数据集,筛选有效数据并分类,然后进行降维处理,作为预测及推荐的基础数据。2、预测及推荐阶段:在本阶段利用了关联规则和协同过滤规则,基于关联规则对影片指标属性进行计算,生成针对目标用户的特定影片群,基于协同过滤规则对用户特征指标进行计算,找出相似用户群,最后向具有同一爱好取向的目标用户推荐特定影片,并预测未来的用户群。3、评价阶段:对预测结果的准确性进行评价。本阶段对预测结果进行评价时,采用预测准确性评价指标为平均绝对误差MAE和根均方误差RMSE,公式分别是:其中,rui和分别是用户u对项目i的实际评分和预测评分,n表示待预测项目的个数;这两项指标的值越小表示预测的准确性越高。据此可以看出,本专利技术的核心之处在于推荐算法,如图2所示,即分别针对影片指标属性和用户行为指标属性采用关联规则计算和协同过滤计算,再将二者有机融合,为目标用户匹配出特定影片,从而进行商品推荐。在具体实现上,本专利技术中的关联规则选用改进的Apriori,将发现关联规则的过程分为两步:第一步通过迭代,检索出目标数据库中的所有频繁项集;第二步利用频繁项集构造出满足最小信任度的规则。具体做法:首先扫描一次布尔矩阵,矩阵中的每一行代表事务,矩阵中的列代表项目。I代表属性,T代表用户。其次扫描矩阵形成频繁1-项集L1,删除属性集小于支持度的列。然后形成候选项集,即将两个属性进行组合,计算其支持度。再与设定好的最小支持度比较,小于的话删除该用户(行)。形成2-项集L2。以此类推直到第k项集中每一项的支持度都大于或者等于最小支持度。那么我们就找到了最大频繁项集。使用的协同本文档来自技高网...
基于协同过滤与关联规则并行处理的精准推荐系统及方法

【技术保护点】
基于协同过滤与关联规则并行处理的精准推荐系统,其特征在于,包括数据预处理模块、预测及推荐模块、评价模块;数据预处理模块,用于收集影片指标属性信息和用户特征指标信息,并进行预处理,作为预测及推荐模块的基础数据;预测及推荐模块,用于基于关联规则对影片指标属性进行计算,生成针对目标用户的特定影片群,并基于协同过滤规则对用户特征指标进行计算,找出相似用户群,最后向具有同一爱好取向的目标用户推荐特定影片;评价模块,用于预测结果的准确性进行评价。

【技术特征摘要】
1.基于协同过滤与关联规则并行处理的精准推荐系统,其特征在于,包括数据预处理模块、预测及推荐模块、评价模块;数据预处理模块,用于收集影片指标属性信息和用户特征指标信息,并进行预处理,作为预测及推荐模块的基础数据;预测及推荐模块,用于基于关联规则对影片指标属性进行计算,生成针对目标用户的特定影片群,并基于协同过滤规则对用户特征指标进行计算,找出相似用户群,最后向具有同一爱好取向的目标用户推荐特定影片;评价模块,用于预测结果的准确性进行评价。2.如权利要求1所述的基于协同过滤与关联规则并行处理的精准推荐系统,其特征在于,所述影片指标属性信息包括:电影ID、电影名、导演、编剧、主演、类型、制片国家/地区、语言、上映日期、片长、评分、标签、评论ID、评论内容、评论者、评论点赞数。3.如权利要求1所述的基于协同过滤与关联规则并行处理的精准推荐系统,其特征在于,所述用户特征指标信息包括:用户ID、用户名、历史观看、历史评分、历史评论、标签。4.基于协同过滤与关联规则并行处理的精准推荐方法,其特征在于,包括以下步骤:a.数据预处理阶段:收集影片指标属性信息和用户特征指标信息,并进行预处理,作为预测及推荐的基础数据;b.预测及推荐阶段:基于关联规则对影片指标属性进行计算,生成针对目标用户的特定影片群,并基于协同过滤规则对用户特征指标进行计算,找出相似用户群,最后向具有同一爱好取向的目标用户推荐特定影片,并预测未来的用户群;c.评价阶段:对预测结果的准确性进行评价。5.如权利要求4所述的基于协同过滤与关联规则并行处理的精准推荐方法,其特征在于,步骤a中,所述预处理包括:利用深度学习的方法对缺失数据进行填补,对于类别型数据则可以直接将其映射为新的...

【专利技术属性】
技术研发人员:姚黎明王卓睿李晓非
申请(专利权)人:四川大学
类型:发明
国别省市:四川,51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1