一种基于MCL-HCF算法的电视节目混合推荐方法技术

技术编号:21309893 阅读:42 留言:0更新日期:2019-06-12 11:17
本发明专利技术属于电视节目推荐技术领域,公开了一种基于MCL‑HCF算法的电视节目混合推荐方法,首先,采用马尔可夫聚类对各个时间段的电视用户进行聚类,产生不同的群组,追求每个群组里的成员和群主整体的偏好差异最小化,再以群组为单位进行电视节目推荐;然后,使用基于物品的协同过滤和基于用户的协同过滤算法分别产生推荐列表;最后,为推荐结果惊喜度和相关性的平衡,对两个推荐列表使用了加权方式进行混合,得到最终的混合推荐结果。本发明专利技术降低群组内用户和整个群组之间的偏好差异性;加权混合ItemCF‑IUF和UserCF‑IIF两种推荐算法的结果,解决推荐结果的惊喜度和相关性的矛盾问题;在保持推荐精确度的同时,使推荐节目的惊喜度和相关性达到平衡。

A Hybrid Recommendation Method for TV Programs Based on MCL-HCF Algorithms

The invention belongs to the technical field of TV program recommendation, and discloses a TV program hybrid recommendation method based on MCL HCF algorithm. Firstly, it uses Markov clustering to cluster TV users in different time periods, generates different groups, pursues the minimization of preference differences between members and group owners in each group, and then makes TV program recommendation by group as a unit. Finally, in order to balance the surprise degree and relevance of the recommendation results, a weighted method is used to mix the two recommendation lists to get the final mixed recommendation results. The invention reduces the preference difference between users in a group and the whole group; resolves the contradiction between surprise and correlation of recommendation results by weighted mixing of the results of ItemCF IUF and UserCF IIF recommendation algorithms; and balances the surprise and correlation of recommendation programs while maintaining the accuracy of recommendation.

【技术实现步骤摘要】
一种基于MCL-HCF算法的电视节目混合推荐方法
本专利技术属于电视节目推荐
,尤其涉及一种基于MCL-HCF算法的电视节目混合推荐方法。
技术介绍
目前,业内常用的现有技术是这样的:自从电视诞生以来,观看电视节目一直都是人类精神生活中的重要组成部分。如今,由于计算机技术和网络技术的飞速发展,人们越来越习惯于在互联网平台上观看视频节目,这也对传统广播电视运营商带来了冲击。对于广播电视运营商而言,客户的流失虽然为其带来了许多挑战,但也带来了新的机遇。现在,付费频道是广播电视的主要业务,也是收入的重要来源。现有技术存在的问题是:在推荐阶段,传统的基于物品的协同过滤和基于用户的协同过滤没有考虑到用户活跃度和物品受众程度对相似度计算的影响,影响最终的推荐效果。具体而言,对于基于物品的协同过滤,活跃的用户相比不活跃的用户,对节目之间相似度的贡献更小,如果不对相似度进行修正,则推荐结果将会趋向于活跃用户的偏好,而忽略不活跃用户的需求;对于基于用户的协同过滤,受众程度高的节目,相对于受众程度低的节目而言,其对用户相似度的贡献更小,如果不对相似度进行修正,则推荐的结果将偏向于热门节目推荐,不能完全反映出用户的真实偏好情况(比如对某些冷门节目的偏好)。ItemCF-IUF给用户推荐的是相似物品,所以其推荐的节目的惊喜度比较低。UserCF-IIF因为是根据用户相似度来推荐的,推荐结果的相关性比较弱。单独使用以上两种算法得到的推荐结果,只能在推荐结果的惊喜度或者相关性上追求单一的偏向,而如果一种算法能够在惊喜度和相关性之间找到合适的平衡点,这将提升推荐系统的用户体验—即推荐结果在遵循用户历史偏好的前提下,能够提升用户的观看兴趣,这也能够提升推荐结果的转化率。如果广播运营商可以准确的知道每个用户的收视偏好,为其推荐相似的电视节目,从而挖掘潜在的付费用户,那么广播电视的竞争力就能得到显著提高。另一方面,大量数据的产生、推荐算法和数据挖掘等技术的出现,为广播电视运营商实现精准推荐提供了技术支持。所以,研究个性化的电视节目推荐方法存在着重要意义。综上所述,现有技术存在的问题是:在推荐阶段,传统的基于物品的协同过滤和基于用户的协同过滤没有考虑到用户活跃度和物品受众程度对相似度计算的影响,影响最终的推荐效果;ItemCF-IUF给用户推荐的是相似物品,所以其推荐的节目的惊喜度比较低;UserCF-IIF因为是根据用户相似度来推荐的,推荐结果的相关性比较弱。解决上述技术问题的难度和意义:如果广播运营商可以准确的知道每个用户的收视偏好,为其推荐相似的电视节目,从而挖掘潜在的付费用户,那么广播电视的竞争力就能得到显著提高。另一方面,大量数据的产生、推荐算法和数据挖掘等技术的出现,为广播电视运营商实现精准推荐提供了技术支持。所以,研究个性化的电视节目推荐方法存在着重要意义。
技术实现思路
针对现有技术存在的问题,本专利技术提供了一种基于MCL-HCF算法的电视节目混合推荐方法。本专利技术是这样实现的,一种基于MCL-HCF算法的电视节目混合推荐方法,所述基于MCL-HCF算法的电视节目混合推荐方法首先,采用马尔可夫聚类对各个时间段的电视用户进行聚类,产生不同的群组,追求每个群组里的成员和群主整体的偏好差异最小化,再以群组为单位进行电视节目推荐;然后,使用基于物品的协同过滤和基于用户的协同过滤算法分别产生推荐列表;最后,为推荐结果惊喜度和相关性的平衡,对两个推荐列表使用了加权方式进行混合,得到最终的混合推荐结果。进一步,建立相似用户的群组,单个家庭由多个家庭成员组成,在某一个时间段St时,某些成员对节目Pi感兴趣,成员将在这个时间段构成一个新的群组Ub;在其他的时间段集合,同样对应着其他的群组,并且从聚类的结果来看,一个家庭里的不同成员可以被划分到多个群组中;(1)建立同一时段的邻接矩阵,筛选出在同一时间段内观看节目的用户,当两个用户同时观看了同一个节目时,其邻接矩阵对应元素加上1,邻接矩阵:(2)消除奇偶性依赖,在对图的状态转移矩阵进行处理之前,为每个顶点增加自循环,即矩阵对角线的值置为1,得到改进的邻接矩阵:(3)利用改进的邻接矩阵,计算得到概率矩阵P;其中,B'ij∈B'表示位于改进的邻接矩阵B'的第i行,第j列的元素,Np表示该时段观看节目的总用户数,得到概率矩阵如下所示:(4)对概率矩阵进行扩展和膨胀交替操作,首先执行的是扩展操作,扩展操作是使概率矩阵自乘e次,让流对象扩展到图的不同区域,其指数e的大小决定游走区域的大小:P=Pe;然后,对概率矩阵P进行膨胀操作,参数r影响聚簇的粒度,具体计算公式如下:其中,ΓrP表示膨胀操作,pij∈P表示位于P的第i行,第j列的元素;(5)聚类过程优化,设置一个阈值θ,概率矩阵经过扩展膨胀操作后,遍历所有pij,当pij≤θ时,令pij=0。进一步,基于物品的协同过滤方法包括:(1)数据预处理1)将群组内所有用户的观看记录合并;2)除噪,删去观看时间低于5分钟的记录;3)分组,将每个时间段的用户分组;4)评分计算,计算各个群组对每个节目的评分;利用各个群组观看每个节目的时长、次数、付费金额经过加权融合得到加权总频率,并以此作为群组对节目评分的量化,得到评分矩阵D,计算公式如下:其中,Dij表示第i个群组对第j个节目的评分,a1、a2、a3分别表示观看时长、次数、金额的权重,tij、fij、dij分别表示第i个群组观看第j个节目的时长、次数、金额;(2)计算节目相似度矩阵,加入了IUF参数修正相似度的计算,计算公式如下:其中,KIUF表示IUF参数,Nu表示用户u喜欢的节目总数,Nu越大表示该用户的活跃度越高,其对节目相似度的贡献越小;节目相似度矩阵的计算公式如下:其中,Wij表示节目i与节目j的相似度,Ni表示喜欢节目i的用户数,Nj表示喜欢节目j的用户数;(3)将ItemCF-IUF的相似度矩阵按最大值归一化,计算公式如下:(4)计算群组u对一个节目j的兴趣度:其中,Iuj表示群组u对节目j的兴趣度,表示群组u喜欢的节目集合,S(i,k)表示和节目i相似度最高的k个节目的集合,W′ji表示节目j和i的相似度,Dui表示群组u对节目i的评分;Iuj越大,表示此群组对这个节目的兴趣度越高。进一步,基于用户的协同过滤方法包括:(1)计算用户相似度矩阵,在相似度计算过程里引入IIF参数,用于对热门节目进行惩罚,IIF参数的计算公式如下:其中,KIIF表示IIF参数,Ni表示喜欢看i节目的群组个数,Ni越大表示这个节目的受众程度越高,其对用户相似度的贡献就越小;用户相似度矩阵计算公式:其中,Wuv表示用户u与用户v的相似度,Nu表示用户u喜欢的节目集合,Nv表示用户v喜欢的节目集合;(2)对用户相似度进行归一化,计算公式如下:(3)通过MCL聚类,将聚在一类的用户看作一个群组,对群组进行推荐;在UserCF-IIF算法中,通过如下公式计算群组u对节目i的兴趣度:其中,Iui表示群组u对节目i的兴趣度,表示看过节目i的群组集合,S(u,K)表示与用户u相似度最高的K个用户的集合,W′uv表示用户u与用户v的相似度,Dvi表示用户v对节目i的评分;Iui越大,表示此群组对这个节目的兴趣度越高。进一步,混本文档来自技高网
...

【技术保护点】
1.一种基于MCL‑HCF算法的电视节目混合推荐方法,其特征在于,所述基于MCL‑HCF算法的电视节目混合推荐方法首先,采用马尔可夫聚类对各个时间段的电视用户进行聚类,产生不同的群组,追求每个群组里的成员和群主整体的偏好差异最小化,再以群组为单位进行电视节目推荐;然后,使用基于物品的协同过滤和基于用户的协同过滤算法分别产生推荐列表;最后,为推荐结果惊喜度和相关性的平衡,对两个推荐列表使用了加权方式进行混合,得到最终的混合推荐结果。

【技术特征摘要】
1.一种基于MCL-HCF算法的电视节目混合推荐方法,其特征在于,所述基于MCL-HCF算法的电视节目混合推荐方法首先,采用马尔可夫聚类对各个时间段的电视用户进行聚类,产生不同的群组,追求每个群组里的成员和群主整体的偏好差异最小化,再以群组为单位进行电视节目推荐;然后,使用基于物品的协同过滤和基于用户的协同过滤算法分别产生推荐列表;最后,为推荐结果惊喜度和相关性的平衡,对两个推荐列表使用了加权方式进行混合,得到最终的混合推荐结果。2.如权利要求1所述的基于MCL-HCF算法的电视节目混合推荐方法,其特征在于,建立相似用户的群组,单个家庭由多个家庭成员组成,在某一个时间段St时,某些成员对节目Pi感兴趣,成员将在这个时间段构成一个新的群组Ub;在其他的时间段集合,同样对应着其他的群组,并且从聚类的结果来看,一个家庭里的不同成员可以被划分到多个群组中;(1)建立同一时段的邻接矩阵,筛选出在同一时间段内观看节目的用户,当两个用户同时观看了同一个节目时,其邻接矩阵对应元素加上1,邻接矩阵:(2)消除奇偶性依赖,在对图的状态转移矩阵进行处理之前,为每个顶点增加自循环,即矩阵对角线的值置为1,得到改进的邻接矩阵:(3)利用改进的邻接矩阵,计算得到概率矩阵P;其中,B'ij∈B'表示位于改进的邻接矩阵B'的第i行,第j列的元素,Np表示该时段观看节目的总用户数,得到概率矩阵如下所示:(4)对概率矩阵进行扩展和膨胀交替操作,首先执行的是扩展操作,扩展操作是使概率矩阵自乘e次,让流对象扩展到图的不同区域,其指数e的大小决定游走区域的大小:P=Pe;然后,对概率矩阵P进行膨胀操作,参数r影响聚簇的粒度,具体计算公式如下:其中,ΓrP表示膨胀操作,pij∈P表示位于P的第i行,第j列的元素;(5)聚类过程优化,设置一个阈值θ,概率矩阵经过扩展膨胀操作后,遍历所有pij,当pij≤θ时,令pij=0。3.如权利要求1所述的基于MCL-HCF算法的电视节目混合推荐方法,其特征在于,基于物品的协同过滤方法包括:(1)数据预处理1)将群组内所有用户的观看记录合并;2)除噪,删去观看时间低于5分钟的记录;3)分组,将每个时间段的用户分组;4)评分计算,计算各个群组对每个节目的评分;利用各个群组观看每个节目的时长、次数、付费金额经过加权融合得到加权总频率,并以此作为群组对节目评分的量化,得到评分矩阵D,计算公式如下:其中,Dij表示第i个群组对第j个节目的评分,a1、a2、a3分别表示观看时长、次数、金额的权重,tij、fij、dij分别表示第i个群组观看...

【专利技术属性】
技术研发人员:赵宇舒巧媛韦鹏程
申请(专利权)人:重庆第二师范学院
类型:发明
国别省市:重庆,50

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1