基于家庭收视纪录的家庭分析及节目推荐方法技术

技术编号:9599862 阅读:109 留言:0更新日期:2014-01-23 04:29
本发明专利技术提供了一种基于家庭收视纪录的家庭分析及节目推荐方法,该方法根据所有家庭的收视纪录,考虑家庭成员收视的时间特征,通过时间-兴趣耦合主题模型,将节目按兴趣分类,将收视时刻按时段分类,并计算出每个家庭在不同时段看节目类型的分布。根据以上分布对家庭收视习惯做聚类分析,向家庭精准推荐节目。

【技术实现步骤摘要】
基于家庭收视纪录的家庭分析及节目推荐方法
本专利技术涉及网络电视
,特别涉及一种基于家庭收视纪录的家庭分析及节目推荐方法。
技术介绍
IPTV即交互式网络电视,是一种利用宽带有线电视网,集互联网、多媒体、通讯等技术于一体,向家庭用户提供包括数字电视在内的多种交互式服务的技术。IPTV的主要优势在于其良好的互动性,通过IPTV,用户将在“IP机顶盒+电视机”上告别单一被动的节目接收,走向更为丰富多彩的互动数字娱乐生活。伴随着IPTV用户规模的迅速上升,研究IPTV用户的使用行为,可以更深入地分析用户群体的特征与偏好。伴随着IPTV提供内容数量的激增,用户很难在海量数字媒体内容中人工找到感兴趣的内容,因此为用户提供精准有效果的个性化的服务成为了一种迫切的需求,而IPTV与生俱来的良好交互性也为获得用户行为数据,并提供个性化服务成为一种可能。基于IPTV家庭收视纪录分析的研究主要包括以下两个部分:对家庭用户行为的建模、以及基于用户群的行为特征进行节目推荐。建立用户模型是实现电视节目个性化推荐的基础。由于用户点播节目是个人兴趣的反映,与临时的、随机的信息获取相比,个人兴趣的稳定性高,有保存、分析的价值。电视节目本体模型能够合理地抽象、归纳电视节目的关键信息,在此基础上学习用户兴趣,建立用户兴趣偏好模型。JongwooKim于2011年通过使用本体论和K-means聚类对用户建模进行推荐。Pogacnik于2005年结合电视节目类别和贝叶斯网络,对用户分层建模。电视一般是在家庭、宿舍等公用娱乐设施使用,通常会有多个成员一起观看电视,此时播放的节目应该照顾到多数人的喜好。个性化推荐系统,根据用户的兴趣喜好,为其推荐感兴趣的节目,满足单用户观看的情况,但没有考虑多个用户同时观看电视的情况。因此也需要基于用户群(家庭)的行为特征进行节目推荐。ZhiwenYu于2006年提出了一种面向多用户的电视节目推荐生成方法,描述了用户对节目喜好程度度量,用户时间优先级度量,以及多个单用户节目单的融合算法。Sotelo于2006年建立了一个非线性的观看模型,能发现特定用户和特定用户群的喜好内容,从而在基于电视内容和语义分析的基础上对特定用户群进行推荐。上述基于收视纪录的家庭分析及推荐方法大多没有考虑家庭成员收视的时间特征,对节目的分类通常要依靠外部数据。因此在家庭分析上没有考虑家庭在不同时段上收视习惯的不同,在节目推荐上也没有考虑应该在不同时段给家庭推荐不同类节目。
技术实现思路
针对现有技术中的缺陷,本专利技术的目的是提供一种基于家庭收视纪录的家庭分析及节目推荐方法,以解决现有方法中没有考虑收视时间,家庭在不同时段上收视习惯的不同,以及节目时段分类需要依靠外部数据的问题。为实现上述目的,本专利技术提出一种基于家庭收视纪录的家庭分析及节目推荐方法,包括以下步骤:1)收视纪录收集模块:获取家庭的收视纪录,包括家庭唯一标识、节目名称、收看时刻;2)时间-兴趣耦合主题算法模块:根据收视纪录收集模块获取的所有家庭的收视纪录,通过时间-兴趣耦合主题模型,将节目按兴趣分类,将收视时刻按时段分类,并计算每个家庭在不同时段看节目类型的分布;3)聚类及推荐模块:根据时间-兴趣耦合主题算法模块得到的每个家庭在不同时段看节目类型的分布,对家庭收视习惯做聚类,向家庭推荐节目。优选地,所述收视纪录收集模块在后台收集家庭的收视纪录后,将同一电视节目的不同集数并为一个节目名称,将收看时刻保存为“星期—小时”存储,忽略具体的日期和分秒信息。由于一周有7天,每天24小时,收看时刻字段共有7×24=168种。优选地,所述的时间-兴趣耦合主题算法模块,是一个概率生成模型,它可以分为节目分类模块、时刻分类模块和家庭分析模块。其中,所述的节目分类模块,是通过时间-兴趣耦合主题模型,仅有家庭收视纪录的数据的情况下,自动将节目按兴趣分类,对于每一个节目类别k,计算类别生成节目概率的向量φk=[(φkw):i=1,2,...,Vw],其中Vw为电视节目数,φkw为类别k生成节目w的概率。对于每个类别,概率较大的节目反映这个类别的兴趣构成。一共有K类节目。其中,所述的时刻分类模块,是通过时间-兴趣耦合主题模型,仅有家庭收视纪录的数据的情况下,自动将时刻按收视时段分类,对于每一个时段分类l,计算类别生成时刻概率的向量ψl=[(ψlt):t=1,2,...,Vt],其中Vt为收看时刻数,Vt=168,ψlt为时段l生成时刻t的概率。对于每个时段,概率较大的时刻反映这个时段的构成。一共有L个时段。其中,所述的家庭分析模块,是通过时间-兴趣耦合主题模型,对家庭m生成时段——节目分布的矩阵Θm=[(Θmij):i=1,2,...,K;j=1,2,...,L],其中Θmij表示家庭m在时段j上观看i类节目的概率。其中,时间-兴趣耦合主题模型,是指定节目分类数K,时段数L及平滑参数后,通过Gibbs采样,计算出类别分布φ,时段分布ψ以及家庭收视习惯分布Θ。其中,所述的聚类模块,是通过对家庭收视习惯分布Θm聚类后,对家庭进行分类,对各个类别的家庭做分析。其中,所述的节目推荐模块,是在计算得到家庭收视习惯分布Θ后,当家庭m在某个时间t打开电视后,根据ψ得到t所属的时段l,在Θm中得到家庭m在该时段看不同类节目的概率分布。根据这一概率分布选出类别k,按类别——节目生成概率φk,选出节目w推荐给家庭。与现有技术相比,本专利技术具有如下的有益效果:本专利技术通过深入挖掘家庭收视纪录数据,提出时间-兴趣耦合主题模型,将收视纪录中的时间信息和节目信息耦合起来,从客观的收视纪录出发,挖掘出电视节目分类,收视时段分类。对每个家庭在不同的收视时段计算出不同的收视习惯,从而能对家庭进行深层次分析,达到针对家庭不同用户的有针对性的节目推荐。附图说明通过阅读参照以下附图对非限制性实施例所作的详细描述,本专利技术的其它特征、目的和优点将会变得更明显:图1为本专利技术方法得出的时段分布图;图2为时间-兴趣耦合主题模型的生成模型图;图3为Gibbs求解时间-兴趣耦合主题模型的流程图。具体实施方式下面结合具体实施例对本专利技术进行详细说明。以下实施例将有助于本领域的技术人员进一步理解本专利技术,但不以任何形式限制本专利技术。应当指出的是,对本领域的普通技术人员来说,在不脱离本专利技术构思的前提下,还可以做出若干变形和改进。这些都属于本专利技术的保护范围。本专利技术主要分三部分:(一)收视纪录收集和预处理;(二)通过时间-兴趣耦合主题模型计算节目类型,时段分布,以及家庭在不同时段的收视习惯;(三)分析家庭的收视习惯,对家庭做电视节目推荐。下面进行详细介绍:(一)收视纪录收集模块:收视纪录收集和预处理系统在获取到收视纪录后,只保留收视纪录中用户观看时长超过3分钟的纪录。对同一个电视节目的不同集数或期数,合并成同一个节目名。将收视纪录中观看时间改写成“星期-小时”形式,省略具体日期和分秒信息。例如,用户A在2013年5月4日星期六18:37:02开始观看水浒传第一集,该纪录在系统中被保留为(A,水浒传,星期六-18)。由于一周有7天,每天24小时,收看时刻字段共有7×24=168种。(二)时间-兴趣耦合主题算法模块:通过时间-兴趣耦合主题模型计算节目类型,时段分布,以本文档来自技高网
...
基于家庭收视纪录的家庭分析及节目推荐方法

【技术保护点】
一种基于家庭收视纪录的家庭分析及节目推荐方法,其特征在于所述方法包括以下步骤:1)收视纪录收集模块:获取家庭的收视纪录,包括家庭唯一标识、节目名称、收看时刻;2)时间?兴趣耦合主题算法模块:根据收视纪录收集模块获取的所有家庭的收视纪录,通过时间?兴趣耦合主题模型,将节目按兴趣分类,将收视时刻按时段分类,并计算每个家庭在不同时段看节目类型的分布;3)聚类及推荐模块:根据时间?兴趣耦合主题算法模块得到的每个家庭在不同时段看节目类型的分布,对家庭收视习惯做聚类,向家庭推荐节目;所述的时间?兴趣耦合主题算法模块,是一个概率生成模型,它分为节目分类模块、时刻分类模块和家庭分析模块,其中:所述的节目分类模块,是通过时间?兴趣耦合主题模型,仅有家庭收视纪录的数据的情况下,自动将节目按兴趣分类,对于每一个节目类别k,计算类别生成节目概率的向量φk=[(φkw):i=1,2,...,Vw],其中Vw为电视节目数,φkw为类别k生成节目w的概率;对于每个类别,概率最大的10个节目反映这个类别的兴趣构成;一共有K类节目;所述的时刻分类模块,是通过时间?兴趣耦合主题模型,仅有家庭收视纪录的数据的情况下,自动将时刻按收视时段分类,对于每一个时段分类l,计算类别生成时刻概率的向量ψl=[(ψlt):t=1,2,...,Vt],其中Vt为收看时刻数,Vt=168,ψlt为时段l生成时刻t的概率;对于每个时段,概率最大的10个时刻反映这个时段的构成;一共有L个时段;所述的家庭分析模块,是通过时间?兴趣耦合主题模型,对家庭m生成时段——节目分布的矩阵Θm=[(Θmij):i=1,2,...,K;j=1,2,...,L],其中Θmij表示家庭m在时段j上观看i类节目的概率;其中,时间?兴趣耦合主题模型,是指定节目分类数K,时段数L及平滑参数后,通过Gibbs采样,计算出类别分布φ,时段分布ψ以及家庭收视习惯分布Θ;所述的聚类模块,是通过对家庭收视习惯分布Θm聚类后,对家庭进行分类,对各 个类别的家庭做分析...

【技术特征摘要】
1.一种基于家庭收视纪录的家庭分析及节目推荐方法,其特征在于所述方法包括以下步骤:1)收视纪录收集模块:获取家庭的收视纪录,包括家庭唯一标识、节目名称、收看时刻;2)时间-兴趣耦合主题算法模块:根据收视纪录收集模块获取的所有家庭的收视纪录,通过时间-兴趣耦合主题模型,将节目按兴趣分类,将收视时刻按时段分类,并计算每个家庭在不同时段看节目类型的分布;所述时间-兴趣耦合主题模型是一个概率生成模型;3)聚类及推荐模块:根据时间-兴趣耦合主题算法模块得到的每个家庭在不同时段看节目类型的分布,对家庭收视习惯做聚类,向家庭推荐节目;所述的时间-兴趣耦合主题算法模块,它分为节目分类模块、时刻分类模块和家庭分析模块,其中:所述的节目分类模块,是通过时间-兴趣耦合主题模型,仅有家庭收视纪录的数据的情况下,自动将节目按兴趣分类,对于每一个节目类别k,计算类别生成节目概率的向量φk=[(φkw):w=1,2,...,Vw],其中Vw为电视节目数,φkw为类别k生成节目w的概率;对于每个类别,概率最大的10个节目反映这个类别的兴趣构成;一共有K类节目;所述的时刻分类模块,是通过时间-兴趣耦合主题模型,仅有家庭收视纪录的数据的情况下,自动将时刻按收视时段分类,对于每一个时段分类l,计算类别生成时刻概率的向量ψl=[(ψlt):t=1,2,...,Vt],其中Vt为收看时刻数,Vt=168,ψlt为时段l生成时刻t的概率;对于每个时段,概率最大的10个时刻反映这个时段的构成;一共有L个时段;所述的家庭分析模块,是通过时间-兴趣耦合主题模型,对家庭m生成时段——节目分布的矩阵Θm=[(Θmij):i=1,2,...,K;j=1,2,...,L],其中Θmij表示家庭m在时段j上观看i类节目的概率;对家庭m来说,第n条收视纪录由如下步骤生成:a)从参数为α的狄利克莱分布中选择收视习惯分布矩阵Θm;b)从参数为β的狄利克莱分布中选择节目分布φ;c)从参数为γ的狄利克莱分布中选择时段分布ψ;d)根据概率矩阵Θm,按多项式分布从矩阵中选择一个位置zp,q=(p,q),p表示选择的时段,p=1,2,...,L,q表示选择的节目类别,q=1,2,...,K;e)根据概率分布ψp,按多项式分布从中选出一个时刻tm,n;f)根据概率分布φq,按多项式分布从中选出一个节目wm,n;这样就生成了第m个家庭的第n条收视纪录(m,wm,n,tm,n);其中,时间-兴趣耦合主题模型,是指定节目分类数K,时段数L及平滑参数后,通过Gibbs采样,计算出类别分布φ,时段分布ψ以及家庭收视习惯分布Θ;设M为家庭数,Nm表示第m个家庭看电视剧的次数;表示第m个家庭被赋予第zp,q个收视习惯的次数,步骤如下:a)初始化nm,nk,nl为0;b)对每个家庭m,对该家庭每个收视纪录n,以为参数的多项式...

【专利技术属性】
技术研发人员:陈唯源张娅查宏远
申请(专利权)人:上海交通大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1