一种面向网络电视家庭用户的动态兴趣模型构建方法技术

技术编号:19704304 阅读:44 留言:0更新日期:2018-12-08 14:49
本发明专利技术公开了一种面向家庭用户的动态兴趣模型的构建方法,其包括以下步骤:(1)收集用户的电视节目收视信息;(2)对用户收视的节目的电视节目收视信息进行分析处理;(3)统计用户收视电视节目的周数;(4)将用户的收视日期转化为对应的星期后分成多个时间段,得到用户收视电视节目的时间段集以及用户观看的电视节目集;(5)对节目进行主题识别,计算电视节目落在主题的概率;(6)对每个主题的电视节目按照其在该主题的概率进行排序,得到主题的偏好节目,并将该偏好电视节目的特征作为该主题隐含的特征;(7)得到用户在一个星期的不同的星期天数的不同的时间段的收视偏好;(8)按预定的时间间隔对用户的收视偏好进行更新。

【技术实现步骤摘要】
一种面向网络电视家庭用户的动态兴趣模型构建方法
本专利技术涉及信息推荐技术,尤其涉及一种面向网络电视家庭用户的动态兴趣模型构建方法。
技术介绍
个性化推荐系统是互联网和电子商务发展的产物,它是建立在海量数据挖掘基础上的一种高级商务智能平台,向顾客提供个性化的信息服务和决策支持。近年来已经出现了许多非常成功的大型推荐系统实例,与此同时,个性化推荐系统也逐渐成为学术界的研究热点之一。在个性化推荐系统中,用户兴趣模型是个性化推荐的核心和关键技术,一个良好的用户兴趣模型可以为个性化推荐服务提供更有利的支持。用户的行为反馈包括:显式行为反馈以及隐式行为反馈,其中,获取用户对信息的显式行为反馈(例如,评分)的成本较高,因而,一般基于用户的隐式行为反馈,例如,点击、分享、收藏等,基于用户的隐式行为反馈次数,提取用户对信息中包含的各信息标签的偏好,得到用户对信息中包含的各信息标签的偏好程度,构建兴趣模型,利用构建的兴趣模型中的信息标签分布,结合待推荐信息包含的信息标签,为用户推荐与其兴趣相吻合的信息。跟大部分经典的个性化推荐领域不同的是,用户在电视上对所收视的电视节目并没有直接给出评分数据,所以无法对显示评分进行用户的偏好识别。在现有的电视节目推荐系统研究中,大部分是根据用户所收视节目的观看时长和该电视节目的总时长利用隐式评分模型将收视时长转化为用户对该电视节目的评分,从而进行用户的偏好识别。目前,由于一个家庭的电视终端大多都是由多个家庭成员包括老人、小孩、青年人以及中年人组成的,单单只由单个终端采集到的数据信息实际上是多个家庭成员兴趣的复合,所以用户的收视兴趣具有多样性和多变形。对于同个机顶盒号,其对应的用户往往是由多个家庭成员组成的一组用户,单利用隐式评分模型不能对家庭成员进行识别,往往导致兴趣模型推荐的质量不佳。
技术实现思路
本专利技术目的在于,针对现有技术的上述不足,提供一种面向网络电视家庭用户的动态兴趣模型构建方法,该方法通过收集用户在不同的星期天数的不同时间段的收视偏好,分析得出用户在不同的星期天数的不同时间段的兴趣主题,并按照一定的时间间隔进行更新,进而构建构建用户动态兴趣模型,其目的在于实现对家庭用户的组成成员进行身份识别,以及根据用户在不同的时间段对应的收视偏好的识别,从而实现在不同的星期的不同的时间段推荐用户可能感兴趣的电视节目,实现动态推荐的效果。为实现上述目的,本专利技术所采用的技术方案是:一种面向家庭用户的动态兴趣模型的构建方法,包括以下步骤:(1)根据网络电视运营商提供的用户在n个月内的收视信息,并对用户收视信息对应的电视节目的信息进行收集;(2)根据用户收视每个电视节目的开始时间和结束时间分别计算出每个用户收视的每个电视节目的收视时长,设置收视电视节目的最小时间为5分钟,将用户收视该电视节目的时间设为t,若t<5分钟,则自动删除掉该条收视信息;(3)将每个月按星期分为4个星期,每个星期按天分为星期一到星期日,进而得到周数4n;(4)将用户的收视电视节目的日期转化为对应的星期即weekday,并将每一天的时间按照00:00:00到23:59:59依次按每20分钟一个时间段分成72个时间段,从而得到用户每个weekday对应的时间段集Wi,j={w1,1,w1,2,…w2,1,w2,2,…,w2,i,…,w7,1,w7,j},其中Wi,j表示星期i(i=1,2,…,7)的第j(j=1,2,…,72)个时间段,如W7,2即表示星期日的第2个时间段,通过时间段集Wi,j={w1,1,w1,2,…w2,1,w2,2,…,w2,i,…,w7,1,w7,j}得到用户在n个月内观看的电视节目集Q={q1,1,q1,2,…,q2,1,q2,2,…,q2,i,…,q7,1,q7,j},其中q1,1表示用户周一的第1个时间段里观看的电视节目集;(5)采用隐含狄利克雷分布(LDA)模型对电视节目集进行主题识别,得到m个关于电视节目的主题Tk(k=1,2,…,m),以及每个电视节目分别落在电视节目主题Tk(k=1,2,…,m)下的概率TVP={P1,1,P1,2,…,P1,k,…,Pp,1,Pp,k,…,Pp,m},其中Pp,k表示电视节目落在主题Tk下的概率;(6)对每个主题Tk(k=1,2,…,m)下的电视节目按照其在该主题Tk(k=1,2,…,m)下的概率TVP从大到小依次进行排序,选取该主题Tk(k=1,2,…,m)下前5个电视节目作为该主题Tk(k=1,2,…,m)下隐含的偏好电视节目,并将该偏好电视节目的特征作为该主题Tk(k=1,2,…,m)隐含的特征;(7)根据上述步骤得到家庭用户在一个星期的不同的星期天数的不同的时间段的收视偏好;(8)按预先设定的时间间隔对用户在Wi,j时间段收视的电视节目对应在主题Tk(k=1,2,…,m)下的概率Pp,k进行分析,将出现在同个主题Tk(k=1,2,…,m)下的概率进行相加,CountP=Pp,k+P′p,k,将概率CountP≥0.8的电视节目主题作为用户在该时间段的兴趣主题,从而实现对用户的偏好进行动态更新,实现对用户动态兴趣模型的构建。作为本专利技术的进一步改进,所述收视信息包括用户号,影视名称,收视开始时间,收视结束时间以及收视日期;所述电视节目信息包括导演、演员、标签、剧情描述以及分类。与现有技术相比具有的优点:1、本专利技术面向家庭用户的动态兴趣模型的构建方法,与现有的面向家庭用户的用户偏好建模相比,本方法通过收集用户在不同的星期天数的不同时间段的收视偏好,分析得出用户在不同的星期天数的不同时间段的兴趣主题,并按照一定的时间间隔进行更新,进而构建构建用户动态兴趣模型,其目的在于实现对家庭用户的组成成员进行身份识别,以及根据用户在不同的时间段对应的收视偏好的识别,从而实现在不同的星期的不同的时间段推荐用户可能感兴趣的电视节目,实现动态推荐的效果。为更清楚地阐述本专利技术的结构特征和功效,下面结合附图与具体实施例来对其进行详细说明。附图说明图1是本专利技术面向网络电视家庭用户的动态兴趣模型构建方法的方法流程图具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。根据附图所示,一种面向家庭用户的动态兴趣模型的构建方法,包括以下步骤:(1)根据网络电视运营商提供的用户在n个月内的收视信息,并对用户收视信息对应的电视节目的信息进行收集;(2)根据用户收视每个电视节目的开始时间和结束时间分别计算出每个用户收视的每个电视节目的收视时长,设置收视电视节目的最小时间为5分钟,将用户收视该电视节目的时间设为t,若t<5分钟,则自动删除掉该条收视信息;(3)将每个月按星期分为4个星期,每个星期按天分为星期一到星期日,进而得到周数4n;(4)将用户的收视电视节目的日期转化为对应的星期即weekday,并将每一天的时间按照00:00:00到23:59:59依次按每20分钟一个时间段分成72个时间段,从而得到用户每个weekday对应的时间段集Wi,j={w1,1,w1,2,…本文档来自技高网
...

【技术保护点】
1.一种面向家庭用户的动态兴趣模型的构建方法,其特征在于,包括以下步骤:(1)根据网络电视运营商提供的用户在n个月内的收视信息,并对用户收视信息对应的电视节目的信息进行收集;(2)根据用户收视每个电视节目的开始时间和结束时间分别计算出每个用户收视的每个电视节目的收视时长,设置收视电视节目的最小时间为5分钟,将用户收视该电视节目的时间设为t,若t<5分钟,则自动删除掉该条收视信息;(3)将每个月按星期分为4个星期,每个星期按天分为星期一到星期日,进而得到周数4n;(4)将用户收视电视节目的日期转化为对应的星期即weekday,并将每一天的时间按照00:00:00到23:59:59依次按每20分钟一个时间段分成72个时间段,从而得到用户每个weekday对应的时间段集Wi,j={w1,1,w1,2,...w2,1,w2,2,...,w2,i,...,w7,1,w7,j},通过时间段集Wi,j={w1,1,w1,2,...w2,1,w2,2,...,w2,i,...,w7,1,w7,j}得到用户在n个月内观看的电视节目集Q={q1,1,q1,2,...,q2,1,q2,2,...,q2,i,...,q7,1,q7,j};(5)采用隐含狄利克雷分布(LDA)模型对电视节目集进行主题识别,得到m个关于电视节目的主题Tk(k=1,2,...,m),以及每个电视节目分别落在电视节目主题Tk(k=1,2,...,m)下的概率TVP={P1,1,P1,2,...,P1,k,...,Pp,1,Pp,k,...,Pp,m},其中Pp,k表示电视节目落在主题Tk下的概率;(6)对每个主题Tk(k=1,2,...,m)下的电视节目按照其在该主题Tk(k=1,2,...,m)下的概率TVP从大到小依次进行排序,选取该主题Tk(k=1,2,...,m)下前5个电视节目作为该主题Tk(k=1,2,...,m)下隐含的偏好电视节目,并将该偏好电视节目的特征作为该主题Tk(k=1,2,...,m)隐含的特征;(7)根据上述步骤得到家庭用户在一个星期的不同的星期天数的不同的时间段的收视偏好;(8)按预先设定的时间间隔对用户在Wi,j时间段收视的电视节目对应在主题Tk(k=1,2,...,m)下的概率Pp,k进行分析,将出现在同个主题Tk(k=1,2,...,m)下的概率进行相加,即CountP=Pp,k+P′p,k,将概率CountP≥0.8的电视节目主题作为用户在该时间段的兴趣主题,从而实现对用户的偏好进行动态更新,实现用户动态兴趣模型的构建。...

【技术特征摘要】
1.一种面向家庭用户的动态兴趣模型的构建方法,其特征在于,包括以下步骤:(1)根据网络电视运营商提供的用户在n个月内的收视信息,并对用户收视信息对应的电视节目的信息进行收集;(2)根据用户收视每个电视节目的开始时间和结束时间分别计算出每个用户收视的每个电视节目的收视时长,设置收视电视节目的最小时间为5分钟,将用户收视该电视节目的时间设为t,若t<5分钟,则自动删除掉该条收视信息;(3)将每个月按星期分为4个星期,每个星期按天分为星期一到星期日,进而得到周数4n;(4)将用户收视电视节目的日期转化为对应的星期即weekday,并将每一天的时间按照00:00:00到23:59:59依次按每20分钟一个时间段分成72个时间段,从而得到用户每个weekday对应的时间段集Wi,j={w1,1,w1,2,...w2,1,w2,2,...,w2,i,...,w7,1,w7,j},通过时间段集Wi,j={w1,1,w1,2,...w2,1,w2,2,...,w2,i,...,w7,1,w7,j}得到用户在n个月内观看的电视节目集Q={q1,1,q1,2,...,q2,1,q2,2,...,q2,i,...,q7,1,q7,j};(5)采用隐含狄利克雷分布(LDA)模型对电视节目集进行主题识别,得到m个关于电视节目的主题Tk(k=1,2,...,m),以及每个电视节目分别...

【专利技术属性】
技术研发人员:曾静吴新玲肖政宏
申请(专利权)人:广东技术师范学院
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1