一种面向网络电视家庭用户的动态兴趣模型构建方法技术

技术编号：19704304 阅读：44 留言：0更新日期：2018-12-08 14:49

本发明专利技术公开了一种面向家庭用户的动态兴趣模型的构建方法，其包括以下步骤：(1)收集用户的电视节目收视信息；(2)对用户收视的节目的电视节目收视信息进行分析处理；(3)统计用户收视电视节目的周数；(4)将用户的收视日期转化为对应的星期后分成多个时间段，得到用户收视电视节目的时间段集以及用户观看的电视节目集；(5)对节目进行主题识别，计算电视节目落在主题的概率；(6)对每个主题的电视节目按照其在该主题的概率进行排序，得到主题的偏好节目，并将该偏好电视节目的特征作为该主题隐含的特征；(7)得到用户在一个星期的不同的星期天数的不同的时间段的收视偏好；(8)按预定的时间间隔对用户的收视偏好进行更新。

全部详细技术资料下载

【技术实现步骤摘要】
一种面向网络电视家庭用户的动态兴趣模型构建方法
本专利技术涉及信息推荐技术，尤其涉及一种面向网络电视家庭用户的动态兴趣模型构建方法。
技术介绍
个性化推荐系统是互联网和电子商务发展的产物，它是建立在海量数据挖掘基础上的一种高级商务智能平台，向顾客提供个性化的信息服务和决策支持。近年来已经出现了许多非常成功的大型推荐系统实例，与此同时，个性化推荐系统也逐渐成为学术界的研究热点之一。在个性化推荐系统中，用户兴趣模型是个性化推荐的核心和关键技术，一个良好的用户兴趣模型可以为个性化推荐服务提供更有利的支持。用户的行为反馈包括：显式行为反馈以及隐式行为反馈，其中，获取用户对信息的显式行为反馈(例如，评分)的成本较高，因而，一般基于用户的隐式行为反馈，例如，点击、分享、收藏等，基于用户的隐式行为反馈次数，提取用户对信息中包含的各信息标签的偏好，得到用户对信息中包含的各信息标签的偏好程度，构建兴趣模型，利用构建的兴趣模型中的信息标签分布，结合待推荐信息包含的信息标签，为用户推荐与其兴趣相吻合的信息。跟大部分经典的个性化推荐领域不同的是，用户在电视上对所收视的电视节目并没有直接给出评分数据，所以无法对显示评分进行用户的偏好识别。在现有的电视节目推荐系统研究中，大部分是根据用户所收视节目的观看时长和该电视节目的总时长利用隐式评分模型将收视时长转化为用户对该电视节目的评分，从而进行用户的偏好识别。目前，由于一个家庭的电视终端大多都是由多个家庭成员包括老人、小孩、青年人以及中年人组成的，单单只由单个终端采集到的数据信息实际上是多个家庭成员兴趣的复合，所以用户的收视兴趣具有多样性...

【技术保护点】
1.一种面向家庭用户的动态兴趣模型的构建方法，其特征在于，包括以下步骤：(1)根据网络电视运营商提供的用户在n个月内的收视信息，并对用户收视信息对应的电视节目的信息进行收集；(2)根据用户收视每个电视节目的开始时间和结束时间分别计算出每个用户收视的每个电视节目的收视时长，设置收视电视节目的最小时间为5分钟，将用户收视该电视节目的时间设为t，若t＜5分钟，则自动删除掉该条收视信息；(3)将每个月按星期分为4个星期，每个星期按天分为星期一到星期日，进而得到周数4n；(4)将用户收视电视节目的日期转化为对应的星期即weekday，并将每一天的时间按照00:00:00到23:59:59依次按每20分钟一个时间段分成72个时间段，从而得到用户每个weekday对应的时间段集Wi，j＝{w1，1，w1，2，...w2，1，w2，2，...，w2，i，...，w7，1，w7，j}，通过时间段集Wi，j＝{w1，1，w1，2，...w2，1，w2，2，...，w2，i，...，w7，1，w7，j}得到用户在n个月内观看的电视节目集Q＝{q1，1，q1，2，...，q2，1，q2，2，...，q2，i，...

【技术特征摘要】
1.一种面向家庭用户的动态兴趣模型的构建方法，其特征在于，包括以下步骤：(1)根据网络电视运营商提供的用户在n个月内的收视信息，并对用户收视信息对应的电视节目的信息进行收集；(2)根据用户收视每个电视节目的开始时间和结束时间分别计算出每个用户收视的每个电视节目的收视时长，设置收视电视节目的最小时间为5分钟，将用户收视该电视节目的时间设为t，若t＜5分钟，则自动删除掉该条收视信息；(3)将每个月按星期分为4个星期，每个星期按天分为星期一到星期日，进而得到周数4n；(4)将用户收视电视节目的日期转化为对应的星期即weekday，并将每一天的时间按照00:00:00到23:59:59依次按每20分钟一个时间段分成72个时间段，从而得到用户每个weekday对应的时间段集Wi，j＝{w1，1，w1，2，...w2，1，w2，2，...，w2，i，...，w7，1，w7，j}，通过时间段集Wi，j＝{w1，1，w1，2，...w2，1，w2，2，...，w2，i，...，w7，1，w7，j}得到用户在n个月内观看的电视节目集Q＝{q1，1，q1，2，...，q2，1，q2，2，...，q2，i，...，q7，1，q7，j}；(5)采用隐含狄利克雷分布(LDA)模型对电视节目集进行主题识别，得到m个关于电视节目的主题Tk(k＝1，2，...，m)，以及每个电视节目分别...

【专利技术属性】
技术研发人员：曾静，吴新玲，肖政宏，
申请(专利权)人：广东技术师范学院，
类型：发明
国别省市：广东,44

全部详细技术资料下载我是这个专利的主人