收视习惯分析方法及系统技术方案

技术编号:18841272 阅读:36 留言:0更新日期:2018-09-05 08:33
本发明专利技术提供一种收视习惯分析方法及系统,包括:设定用于确定广播电视用户收视习惯所需的参数,其中,所述参数至少包括:空间区域、时间区域和收视指标;采集用户对广播电视节目的收视数据;将时间区域划分成多个时间段,每一个时间段包括多个子时间段;构建子时间段的收视指标的模型,将调用模块传来的各用户的收视数据代入所述模型,得到各用户每个子时间段的收视指标,从而得到各用户的每个时间段的收视指标矩阵;对每一个用户的多个时间段的收视指标矩阵进行聚类,将每一个用户的聚类结果中包含收视指标最大值的收视指标矩阵作为每一个用户的收视习惯。所述方法及系统可以描述个体收视习惯,在给定决策条件下找到目标收视群体的关键问题。

Analysis method and system of viewing habits

The invention provides a viewing habit analysis method and a system, including: setting parameters for determining the viewing habits of radio and television users, wherein the parameters at least include: space area, time area and viewing index; collecting the viewing data of radio and television programs of users; dividing the time area into multiple hours Interval, each time period includes a number of sub-period; build a sub-period of the viewing index model, the call module will transfer the user's viewing data into the model, get each user's viewing index for each sub-period, thus get the user's viewing index matrix for each time period; for each use Each user's viewing index matrix which contains the maximum value of the viewing index in the clustering result is used as the viewing habit of each user. The method and system can describe the viewing habits of individuals and find the key problems of target audience under given decision conditions.

【技术实现步骤摘要】
收视习惯分析方法及系统
本专利技术涉及广播电视领域,更为具体地,涉及一种收视习惯分析方法及系统。
技术介绍
面对互联网电视、移动新媒体带来的冲击,广播电视收视用户不断分流。在这样的环境下,如何从用户的收视行为中发现规律,找到可能影响用户收视的因素显得十分重要,广播电视用户收视习惯系统能够有效解决这一问题。传统的收视调查以抽样用户为基础,存在样本户数量不够、样本户受到污染等问题。随着数字双向机顶盒的普及、采集与存储技术的不断发展,基于实时采集回传的大样本收视数据为用户行为分析提供了新的契机。广播电视用户收视习惯挖掘的理论基础为数据挖掘技术,更具体地说,涉及聚类方法。常用的聚类方法包括系统聚类、K均值聚类及其变种等。用户收视习惯挖掘的本质是对用户在时间维度、频道维度和节目类型维度上的收视习惯进行刻画,并基于此进行收视群体的划分。现有的广播电视用户收视分析集中于对特定频道、节目的收视指标的分析,缺乏对用户个体收视习惯的描述,同时,在依据收视习惯对收视群体体进行划分时缺乏科学的、定量的阈值确定方法。
技术实现思路
鉴于上述问题,本专利技术的目的是提供一种描述个体收视习惯的收视习惯分析方法及系统。根据本专利技术的一个方面,提供一种收视习惯分析系统,包括:设定模块,设定用于确定广播电视用户收视习惯所需的参数,其中,所述参数至少包括:空间区域、时间区域和收视指标;采集模块,采集用户对广播电视节目的收视数据;划分模块,将时间区域划分成多个时间段,每一个时间段包括多个子时间段;调用模块,调用设定模块设定的空间区域的用户在所述时间区域内的收视数据,发送给收视指标矩阵构建模块;收视指标矩阵构建模块,构建子时间段的收视指标的模型,将调用模块传来的各用户的收视数据代入所述模型,得到各用户每个子时间段的收视指标,从而得到各用户的每个时间段的收视指标矩阵,发送给收视偏好获得模块;收视偏好获得模块,对每一个用户的多个时间段的收视指标矩阵进行聚类,将每一个用户的聚类结果中包含收视指标最大值的收视指标矩阵作为每一个用户的收视习惯。根据本专利技术的另一个方面,提供一种收视习惯分析方法,其特征在于,包括:步骤S1,设定用于确定广播电视用户收视习惯所需的参数,其中,所述参数至少包括:空间区域、时间区域和收视指标;步骤S2,采集用户对广播电视节目的收视数据;步骤S3,将时间区域划分成多个时间段,每一个时间段包括多个子时间段;步骤S4,构建子时间段的收视指标的模型,将调用模块传来的各用户的收视数据代入所述模型,得到各用户每个子时间段的收视指标,从而得到各用户的每个时间段的收视指标矩阵;步骤S5,对每一个用户的多个时间段的收视指标矩阵进行聚类,将每一个用户的聚类结果中包含收视指标最大值的收视指标矩阵作为每一个用户的收视习惯。本专利技术所述收视习惯分析方法及系统通过从不同维度挖掘广播电视用户的收视习惯,以及提供个人收视习惯挖掘方法,能够有效确定用户的收视习惯,还能够依据收视习惯将用户划分成具有不同程度收视习惯的用户群,也就是说上述方法及系统可以实现对个体收视习惯的描述,并能够在给定决策条件下找到目标收视群体的关键问题。附图说明通过参考以下结合附图的说明,随着对本专利技术的更全面理解,本专利技术的其它目的及结果将更加明白及易于理解。在附图中:图1是本专利技术所述收视习惯分析系统的构成框图;图2是本专利技术所述收视习惯分析方法的流程图。具体实施方式在下面的描述中,出于说明的目的,为了提供对一个或多个实施例的全面理解,阐述了许多具体细节。然而,很明显,也可以在没有这些具体细节的情况下实现这些实施例。以下将结合附图对本专利技术的具体实施例进行详细描述。以下将结合附图对本专利技术的具体实施例进行详细描述。图1是本专利技术所述收视习惯分析系统的构成框图,如图1所示,本专利技术所述收视习惯分析系统包括:设定模块1,设定用于确定广播电视用户收视习惯所需的参数,其中,所述参数至少包括:空间区域、时间区域和收视指标,其中,所述空间区域可以是省、市、区等,例如北京市;所述时间区域为选定各节目类型的计算时间段,例如,时间区域为2016年1月1日至2017年1月1日;所述收视指标可以是收视率、收视时长、收视频次等各种表征用户收视情况的指标;采集模块2,采集用户对广播电视节目的收视数据;划分模块3,将时间区域划分成多个时间段,每一个时间段包括多个子时间段,例如,将时间区域按照天分成多个时间段,每天按照小时分成24个子时间段;调用模块4,调用设定模块1设定的空间区域的用户在所述时间区域内的收视数据,发送给收视指标矩阵构建模块5;收视指标矩阵构建模块5,构建子时间段的收视指标的模型(收视指标的函数),将调用模块4传来的各用户的收视数据代入所述模型,得到各用户每个子时间段的收视指标,从而得到各用户的每个时间段的收视指标矩阵,发送给收视偏好获得模块6;收视偏好获得模块6,对每一个用户的多个时间段的收视指标矩阵进行聚类,将每一个用户的聚类结果中包含收视指标最大值的收视指标矩阵作为每一个用户的收视习惯。在本专利技术的一个实施例中,上述收视偏好获得模块包括:计算单元61,计算每一个用户的每两个类之间的距离,所述类为一个时间段的收视指标矩阵,所述收视指标矩阵中的一个子时间段的收视指标为类内的一个样本,dij=|IiFL-IjFL|其中,D(Gp,Gq)表示Gp和Gq两个类之间的距离,np、nq分别表示类Gp、Gq中样本的个数,IiFL表示类Gp中的样本,IiFL表示类Gq中的样本,dij表示所述样本IiFL和IjFL之间的距离;第一合并单元62,将距离最小的两个类合并为一个新类;第一迭代单元63,将新类取代其合并的两个类代入计算单元第一合并单元,进行kh-1次合并,聚类个数为1,2,3……kh,得到(kh-1)个立方聚类准则统计量,其中,kh为小于或等于的最大正整数,n为一个用户的样本总数;第一选取单元64,取所述立方聚类准则统计量的最大值对应的聚类个数kmax为最终聚类个数k;第二迭代单元65,将新类取代其合并的两个类代入计算单元和合并单元,直到聚类个数k对应的类不变化,得到k个类构成的聚类结果;第二选取单元66,选取聚类结果中包含收视指标最大值的类,将所述类作为用户的收视习惯。在本专利技术的一个实施例中,上述收视习惯分析系统还包括分群模块7,根据各用户的所述收视习惯采用聚类的方法划分收视习惯对应的收视群体。优选地,上述分群模块7包括:分群样本采集单元71,将各用户的收视习惯对应的收视指标矩阵作为用户类,所述用户类的收视指标矩阵中各子时间段的收视指标作为样本;类间距离计算单元72,将两个用户类的质心之间的欧几里得距离作为两个用户类之间的类间距离;第二合并单元73,将类间距离最小的两个用户类合并为一个新用户类;第三迭代单元74,将新用户类取代其合并的两个用户类代入类间距离计算单元72和第二合并单元73,进行ky-1次合并,聚类个数为1,2,3……ky,其中,ky为小于或等于的最大正整数,M为用户类的总数;DBI计算单元75,计算每一次聚类的戴维森堡丁指数,得到(ky-1)个戴维森堡丁指数,其中,Xi表示第i个用户类,Δ(Xi)表示用户类Xi的类内距离,Δ(Xj)表示用户类Xj的类内距离,所述类内距离定义为用户类内两两样本间欧几里得距离的最大值本文档来自技高网...

【技术保护点】
1.一种收视习惯分析系统,包括:设定模块,设定用于确定广播电视用户收视习惯所需的参数,其中,所述参数至少包括:空间区域、时间区域和收视指标;采集模块,采集用户对广播电视节目的收视数据;划分模块,将时间区域划分成多个时间段,每一个时间段包括多个子时间段;调用模块,调用设定模块设定的空间区域的用户在所述时间区域内的收视数据,发送给收视指标矩阵构建模块;收视指标矩阵构建模块,构建子时间段的收视指标的模型,将调用模块传来的各用户的收视数据代入所述模型,得到各用户每个子时间段的收视指标,从而得到各用户的每个时间段的收视指标矩阵,发送给收视偏好获得模块;收视偏好获得模块,对每一个用户的多个时间段的收视指标矩阵进行聚类,将每一个用户的聚类结果中包含收视指标最大值的收视指标矩阵作为每一个用户的收视习惯。

【技术特征摘要】
1.一种收视习惯分析系统,包括:设定模块,设定用于确定广播电视用户收视习惯所需的参数,其中,所述参数至少包括:空间区域、时间区域和收视指标;采集模块,采集用户对广播电视节目的收视数据;划分模块,将时间区域划分成多个时间段,每一个时间段包括多个子时间段;调用模块,调用设定模块设定的空间区域的用户在所述时间区域内的收视数据,发送给收视指标矩阵构建模块;收视指标矩阵构建模块,构建子时间段的收视指标的模型,将调用模块传来的各用户的收视数据代入所述模型,得到各用户每个子时间段的收视指标,从而得到各用户的每个时间段的收视指标矩阵,发送给收视偏好获得模块;收视偏好获得模块,对每一个用户的多个时间段的收视指标矩阵进行聚类,将每一个用户的聚类结果中包含收视指标最大值的收视指标矩阵作为每一个用户的收视习惯。2.根据权利要求1所述的收视习惯分析系统,其特征在于,所述收视偏好获得模块包括:计算单元,计算每一个用户的每两个类之间的距离,所述类为一个时间段的收视指标矩阵,所述收视指标矩阵中的一个子时间段的收视指标为类内的一个样本;第一合并单元,将距离最小的两个类合并为一个新类;第一迭代单元,将新类取代其合并的两个类代入计算单元和第一合并单元,进行kh-1次合并,聚类个数为1,2,3……kh,得到(kh-1)个立方聚类准则统计量,其中,kh为小于或等于的最大正整数,n为一个用户的样本总数;第一选取单元,取所述立方聚类准则统计量的最大值对应的聚类个数kmax为最终聚类个数k;第二迭代单元,将新类取代其合并的两个类代入第一计算单元、第二计算单元和合并单元,直到聚类个数k对应的类不变化,得到k个类构成的聚类结果;第二选取单元,选取聚类结果中包含收视指标最大值的类,将所述类作为用户的收视习惯。3.根据权利要求1所述的收视习惯分析系统,其特征在于,所述收视指标包括用户在每个子时间段的收视习惯指数、在每个子时间段对各频道的收视习惯指数和在每个子时间段对各节目类型的收视习惯指数中的一个或多个,其中,ItFL=Frequencyt×LengthtItcFL=Frequencytc×LengthtcItpFL=Frequencytp×Percenttp其中,n1表示用户在t子时间段收看电视的时间段个数之和,N表示所述时间区域分成的时间段个数之和,Ti表示用户在一个时间段的t子时间段的收视时长,Frequencyt表示用户在t子时间段的在线频率;Lengtht表示用户在t子时间段的平均收视时长;ItFL表示用户在t子时间段的收视习惯指数;n2表示用户在t子时间段收看c频道的时间段个数之和,Tj表示用户在一个时间段的t子时间段收看c频道的时长,Frequencytc表示用户在t子时间段收看c频道的频率,Lengthtc表示用户在t子时间段收看c频道的平均收视时长,ItcFL表示用户在t子时间段收看c频道的收视习惯指数;n3表示用户在t子时间段收看p类型节目的时间段个数之和;n4表示一个时间段用户在t子时间段收看p类型节目的个数;Tij表示用户在一个时间段的t子时间段收看p节目类型的时长;Bij表示用户在一个时间段的t子时间段收看的p节目类型的播出时长Frequencytp表示用户在t子时间段收看p节目类型的频率;Percenttp表示用户在t子时间段收看p节目类型的平均收视百分比;ItpFL表示用户在t子时间段收看p节目类型的收视习惯指数。4.根据权利要求1所述的收视习惯分析系统,其特征在于,还包括:分群模块,根据各用户的所述收视习惯采用聚类的方法划分收视习惯对...

【专利技术属性】
技术研发人员:王妍柴剑平冯熙李波江茜韩晶晶檀雷雷
申请(专利权)人:中国传媒大学
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1