一种降低电影推荐系统中马太效应的方法技术方案

技术编号:20485173 阅读:31 留言:0更新日期:2019-03-02 19:05
本发明专利技术公开了一种降低电影推荐系统中马太效应的方法,包括如下步骤:获取电影评分矩阵与电影流行度集合;建立马太效应影响电影集合;计算马太效应影响电影集合中各电影的流行周期函数及标准流行周期函数;基于马太效应影响电影集合中各电影的流行周期函数及标准流行周期函数,计算马太效应影响电影集合中各电影的残差平方和,并建立残差集合;基于所述残差集合,对马太效应影响电影集合中各电影的平均评分进行惩罚,得到马太效应影响电影集合中各电影的新的平均评分,从而降低电影推荐系统中马太效应。采用本发明专利技术公开的方法,可以降低电影推荐系统中的马太效应,防止热门电影长期拥有过高的流行度,冷门物品无人问津的局面出现。

【技术实现步骤摘要】
一种降低电影推荐系统中马太效应的方法
本专利技术涉及电影推荐系统领域,具体涉及一种降低电影推荐系统中马太效应的方法。
技术介绍
推荐系统是一种帮助用户快速发现有用信息的工具,主要表现为通过分析用户的历史行为给用户的兴趣建模,从而主动给用户推荐能够满足他们兴趣和需求的信息。电影推荐系统是推荐系统领域重要的组成部分之一,其通过收集用户和电影的相关信息,帮助用户在庞大的电影库中快速找到令他们感兴趣的电影,一个好的推荐系统不仅需要有较高的推荐准确度、推荐覆盖率在抗冷启动能力和克服矩阵稀疏能力上也要有较好的表现。马太效应,即所谓强者更强,弱者更弱的效应,如果是一个推荐系统会增加热门物品和非热门物品的流行度差距,让流行度呈两极分化趋势发展,导致用户难以发现自己真正感兴趣的物品,降低推荐系统的覆盖率和准确度,这样对推荐系统会造成非常消极的影响。目前的主流推荐算法均具有马太效应。因此,如何降低电影推荐系统的马太效应成为了本领域技术人员亟需解决的问题。
技术实现思路
针对现有技术中存在的上述不足,本专利技术实际要解决的问题是:如何降低电影推荐系统的马太效应。。为解决上述技术问题,本专利技术采用了如下的技术方案:一种降低电影推荐系统中马太效应的方法,包括如下步骤:S1、获取电影评分矩阵与电影流行度集合,电影评分矩阵包括各用户对各电影的评分,所述电影流行度集合包括各部电影的流行度;S2、基于电影评分矩阵及电影流行度集合获取受马太效应影响的电影,建立马太效应影响电影集合;S3、计算马太效应影响电影集合中各电影的流行周期函数及标准流行周期函数;S4、基于马太效应影响电影集合中各电影的流行周期函数及标准流行周期函数,计算马太效应影响电影集合中各电影的残差平方和,并建立残差集合;S5、基于所述残差集合,对马太效应影响电影集合中各电影的平均评分进行惩罚,得到马太效应影响电影集合中各电影的新的平均评分,从而降低电影推荐系统中马太效应。优选地,S2包括如下步骤:S201、基于公式计算每部电影的评分的马太效应影响因子,δi为第i部电影的马太效应影响因子,rui为第u个用户对第i部电影的非零评分,U表示非零评分集合,card(rui)表示非零评分的个数,pi表示第i部电影的流行度;S202、将马太效应影响因子在(0,1)之间的电影加入马太效应影响电影集合。优选地,S3包括如下步骤:S301、将马太效应影响电影集合中的各电影与其对应的流行度相拟合,得到各电影的流行周期函数;S302、基于艾宾浩斯曲线函数及马太效应影响电影集合中的各电影对应的流行度进行回归分析得到各电影的标准流行周期函数。优选地,S4包括如下步骤:S401、基于公式计算马太效应影响电影集合中各电影的残差平方和,SSEi为马太效应影响电影集合中第j部电影的残差平方和,Fj(t)为第j部电影的流行周期函数,Fj'(t)为第j部电影的标准流行周期函数,t表示第t个时间节点,Fj(t)和Fj'(t)是t的函数,n为时间节点的长度;S402、基于马太效应影响电影集合中各电影的残差平方和建立残差集合S,S={SSE1,SSE2,SSE3,…,SSEj,…SSEn}。优选地,S5包括如下步骤:S501、基于公式计算马太效应影响电影集合中各电影的平均评分,为马太效应影响电影集合中第j部电影的平均评分,K为对第j部电影进行评分的用户总数,rkj为第k个用户对第j部电影的评分,M为第j部电影的非零评分的总个数;S502、对残差集合中各残差平方和进行归一化处理得到惩罚因子集合S',S'={SSE1',SSE2',SSE3',…,SSEj',…SSEn'},SSEj'为SSEj对应的惩罚因子;S503、基于公式计算马太效应影响电影集合中各电影的新的评分,λ为惩罚参数,0<λ≤1,rj'为马太效应影响电影集合中第j部电影的新的评分。综上所述,本专利技术公开了一种降低电影推荐系统中马太效应的方法,包括如下步骤:获取电影评分矩阵与电影流行度集合,电影评分矩阵包括各用户对各电影的评分,所述电影流行度集合包括各部电影的流行度;基于电影评分矩阵及电影流行度集合获取受马太效应影响的电影,建立马太效应影响电影集合;计算马太效应影响电影集合中各电影的流行周期函数及标准流行周期函数;基于马太效应影响电影集合中各电影的流行周期函数及标准流行周期函数,计算马太效应影响电影集合中各电影的残差平方和,并建立残差集合;基于所述残差集合,对马太效应影响电影集合中各电影的平均评分进行惩罚,得到马太效应影响电影集合中各电影的新的平均评分,从而降低电影推荐系统中马太效应。采用本专利技术公开的方法,可以降低电影推荐系统中的马太效应,防止热门电影长期拥有过高的流行度,冷门物品无人问津的局面出现。附图说明图1为本专利技术公开的一种降低电影推荐系统中马太效应的方法的流程图;图2为本专利技术中为拟合后的艾宾浩斯曲线的示意图。具体实施方式下面结合附图对本专利技术作进一步的详细说明。如图1所示,本专利技术公开了一种降低电影推荐系统中马太效应的方法,包括如下步骤:S1、获取电影评分矩阵与电影流行度集合,电影评分矩阵包括各用户对各电影的评分,所述电影流行度集合包括各部电影的流行度;S2、基于电影评分矩阵及电影流行度集合获取受马太效应影响的电影,建立马太效应影响电影集合;S3、计算马太效应影响电影集合中各电影的流行周期函数及标准流行周期函数;S4、基于马太效应影响电影集合中各电影的流行周期函数及标准流行周期函数,计算马太效应影响电影集合中各电影的残差平方和,并建立残差集合;S5、基于所述残差集合,对马太效应影响电影集合中各电影的平均评分进行惩罚,得到马太效应影响电影集合中各电影的新的平均评分,从而降低电影推荐系统中马太效应。本专利技术针对现有技术的不足提出一种降低电影推荐系统中马太效应的方法,通过对手马太效应影响的电影的评分进行惩罚,得到这些电影新的评分的方式,提高电影推荐系统的覆盖率和准确度,防止热门电影长期拥有过高的流行度,冷门物品无人问津的局面出现。具体实施时,S2包括如下步骤:S201、基于公式计算每部电影的评分的马太效应影响因子,δi为第i部电影的马太效应影响因子,rui为第u个用户对第i部电影的非零评分,U表示非零评分集合,card(rui)表示非零评分的个数,pi表示第i部电影的流行度;S202、将马太效应影响因子在(0,1)之间的电影加入马太效应影响电影集合。本专利技术充分分析影响电影推荐系统马太效应的几个条件:电影流行度、电影评分、流行时间,通过电影流行度和电影评分得到的马太影响因子可以有效衡量电影对电影推荐系统的马太效应影响大小。马太效应受电影流行度的影响较为严重,其次评分也是影响因素之一,首先,在大多数情况下人们总是更加信任大多数人所推荐的电影,其次一些商家通过广告宣传、炒作等手段增加低分电影的曝光率也能使用户对该电影产生购买行为。鉴于以上分析,本专利技术将所有电影分为三类:①评分较低且流行度较高的电影;②评分较高且流行度较高的电影;③流行度较低的电影。其中①和②是使系统具有马太效应的主要因素,本专利技术引入马太效应影响因子来衡量影响系统马太效应因素的大小。传统推荐算法中没有考虑电影流行度对用户评分带来的客观影响,该公式的引入可以计算出这种影响力的大小,且较好的描述了前文所述的本文档来自技高网...

【技术保护点】
1.一种降低电影推荐系统中马太效应的方法,其特征在于,包括如下步骤:S1、获取电影评分矩阵与电影流行度集合,电影评分矩阵包括各用户对各电影的评分,所述电影流行度集合包括各部电影的流行度;S2、基于电影评分矩阵及电影流行度集合获取受马太效应影响的电影,建立马太效应影响电影集合;S3、计算马太效应影响电影集合中各电影的流行周期函数及标准流行周期函数;S4、基于马太效应影响电影集合中各电影的流行周期函数及标准流行周期函数,计算马太效应影响电影集合中各电影的残差平方和,并建立残差集合;S5、基于所述残差集合,对马太效应影响电影集合中各电影的平均评分进行惩罚,得到马太效应影响电影集合中各电影的新的平均评分,从而降低电影推荐系统中马太效应。

【技术特征摘要】
1.一种降低电影推荐系统中马太效应的方法,其特征在于,包括如下步骤:S1、获取电影评分矩阵与电影流行度集合,电影评分矩阵包括各用户对各电影的评分,所述电影流行度集合包括各部电影的流行度;S2、基于电影评分矩阵及电影流行度集合获取受马太效应影响的电影,建立马太效应影响电影集合;S3、计算马太效应影响电影集合中各电影的流行周期函数及标准流行周期函数;S4、基于马太效应影响电影集合中各电影的流行周期函数及标准流行周期函数,计算马太效应影响电影集合中各电影的残差平方和,并建立残差集合;S5、基于所述残差集合,对马太效应影响电影集合中各电影的平均评分进行惩罚,得到马太效应影响电影集合中各电影的新的平均评分,从而降低电影推荐系统中马太效应。2.如权利要求1所述的降低电影推荐系统中马太效应的方法,其特征在于,S2包括如下步骤:S201、基于公式计算每部电影的评分的马太效应影响因子,δi为第i部电影的马太效应影响因子,rui为第u个用户对第i部电影的非零评分,U表示非零评分集合,card(rui)表示非零评分的个数,pi表示第i部电影的流行度;S202、将马太效应影响因子在(0,1)之间的电影加入马太效应影响电影集合。3.如权利要求1所述的降低电影推荐系统中马太效应的方法,其特征在于,S3包括如下步骤:S301、将马太效应影响电影集合中的各电影与其对应的流行度相拟合,得到各电影的流行周期函数;S302、基于艾宾浩斯...

【专利技术属性】
技术研发人员:何波裴剑辉
申请(专利权)人:重庆理工大学
类型:发明
国别省市:重庆,50

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1