一种影视大数据平台的数据分析方法技术

技术编号:14746744 阅读:109 留言:0更新日期:2017-03-01 23:15
本发明专利技术公开了一种影视大数据平台的数据分析方法:通过设置离线数据分析服务器和实时数据分析服务器,对接收到的影视大数据进行分析;然后将分析结果存储至结果数据库。本发明专利技术与现有技术相比,能够实时提供收视率统计结果;能够提供多种基于大量数据统计的分析结果,包括影视用户画像,艺人综合评估、收视率、影视作品点播量;通过分析结果为影视作品提供商提供数据情报。

【技术实现步骤摘要】

本专利技术涉及计算机大数据分析领域,具体涉及一种影视大数据平台的数据分析方法
技术介绍
随着数据分析技术的发展,影视作品提供商对于影视作品数据分析的要求越来越高。但是现有的影视数据分析方法都没有采用计算机大数据技术,且无法实时的提供收视率统计,无法提供多种基于大量数据统计的分析结果,无法通过分析结果为影视作品提供商提供数据情报。
技术实现思路
本专利技术的目的在于提供一种影视大数据平台的数据分析方法,该方法采用计算机大数据技术,能够实时提供收视率统计结果,能够提供多种基于大量数据统计的分析结果,通过分析结果为影视作品提供商提供数据情报。为实现上述目的本专利技术提供了一种影视大数据平台的数据分析方法:通过设置离线数据分析服务器和实时数据分析服务器,对接收到的影视大数据进行分析;然后将分析结果存储至结果数据库。所述的影视大数据包括用户数据和影视数据;用户数据包括影视用户画像,影视数据包括艺人综合评估、收视率、影视作品点播量。所述的离线数据分析服务器用于分析影视用户画像和艺人综合评估;所述的实时数据分析服务器用于分析收视率多维度监测和影视作品点播量在线监测。所述的影视用户画像的分析包括数据建模,具体为:首先对用户在智能电视端的观看行为数据,互联网和移动互联网上的影视点播行为数据建立特征值,每一个维度对应一个特征值,然后采用聚类和关联分析等算法对这些数据构建数据模型,并不断对这些数据模型进行迭代计算,当计算结果收敛于某个设定的阀值后,模型构建成功。所述的影视用户画像分析方法为:首先分析用户在智能电视端、互联网端的操作和观看行为,将这些终端的IP地址、PC的cookie、终端的唯一标识进行关联,确定终端的用户是否为同一人;然后,基于用户在电视和互联网上的影视观看行为,精确分析用户属性,勾勒用户画像,划分7000个多维度属性标签,包括用户的性别、年龄、地域、学历、职业、收入、兴趣爱好等标签,精细勾勒出最具价值的核心用户领袖;最后,将用户的属性标签和广告属性进行精准匹配,准确圈定目标受众。所述的艺人综合评估分析方法为:结合艺人出演节目的收视率、在线点播量、评论等数据,对艺人进行打分,对其演技、公众口碑等进行综合评估。所述的影视作品点播量分析为,描绘出节目在不同终端中目标用户所占比例、所在地域、在线时长等多维度的指标。所述的收视率分析为,对收视率进行分钟级统计,对地区、电视台、节目、用户属性等多维度实时绘制收视率曲线。本专利技术与现有技术相比,能够实时提供收视率统计结果;能够提供多种基于大量数据统计的分析结果,包括影视用户画像,艺人综合评估、收视率、影视作品点播量;通过分析结果为影视作品提供商提供数据情报。附图说明图1是本专利技术实施例1的影视大数据平台的数据分析方法的结构图。具体实施方式以下是本专利技术的具体实施例,对本专利技术的技术方案做进一步的描述,但是本专利技术的保护范围并不限于这些实施例。凡是不背离本专利技术构思的改变或等同替代均包括在本专利技术的保护范围之内。实施例1一种影视大数据平台的数据分析方法,通过设置离线数据分析服务器和实时数据分析服务器,对接收到的影视大数据进行分析;然后将分析结果存储至结果数据库。如图1所示,数据源会将数据逐条录入至一个数据的消息队列中,消息队列使用topic来标识不同类型或不同格式的数据源,默认采用FIFO的算法,并使用一个offset变量记录每个队列当前的访问位置,消息队列默认会将数据保存2天。离线数据分析服务器和实时数据分析服务器各自启动一个进程读取消息队列中的数据,消息队列会为这两个进程各自维护一个offset来记录读取进程所读取到的一行,离线数据分析服务器和实时数据分析服务器会按需到消息队列中取得所需要的数据,离线数据分析服务器会将数据写入到分布式文件系统中并进行离线计算,计算的最终结果会录入至数据库中,实时数据分析服务器则直接读取并进行计算,计算的最终结果会录入至数据库中;这一方案将离线计算和实时在线计算隔离开,两种计算场景互不干扰,满足了业务中实时和离线的两种需求。影视大数据包括用户数据和影视数据;用户数据包括影视用户画像,影视数据包括艺人综合评估、收视率、影视作品点播量。所述的离线数据分析服务器用于分析影视用户画像和艺人综合评估;所述的实时数据分析服务器用于分析收视率多维度监测和影视作品点播量在线监测。所述的影视用户画像的分析包括数据建模,具体为:首先对用户在智能电视端的观看行为数据,互联网和移动互联网上的影视点播行为数据建立特征值,每一个维度对应一个特征值,然后采用聚类和关联分析等算法对这些数据构建数据模型,并不断对这些数据模型进行迭代计算,当计算结果收敛于某个设定的阀值后,模型构建成功。所述的影视用户画像分析方法为:首先分析用户在智能电视端、互联网端的操作和观看行为,将这些终端的IP地址、PC的cookie、终端的唯一标识进行关联,确定终端的用户是否为同一人;然后,基于用户在电视和互联网上的影视观看行为,精确分析用户属性,勾勒用户画像,划分7000个多维度属性标签,包括用户的性别、年龄、地域、学历、职业、收入、兴趣爱好等标签数据,精细勾勒出最具价值的核心用户领袖;最后,将用户的属性标签和广告属性进行精准匹配,准确圈定目标受众。所述的艺人综合评估分析方法为:结合艺人出演节目的收视率、在线点播量、评论等数据,对艺人进行打分,对其演技、公众口碑等进行综合评估。所述的影视作品点播量分析为,描绘出节目在不同终端中目标用户所占比例、所在地域、在线时长等多维度的指标。所述的收视率分析为,对收视率进行分钟级统计,对地区、电视台、节目、用户属性等多维度实时绘制收视率曲线。本专利技术与现有技术相比,能够实时提供收视率统计结果;能够提供多种基于大量数据统计的分析结果,包括影视用户画像,艺人综合评估、收视率、影视作品点播量;通过分析结果为影视作品提供商提供数据情报。根据客户的需求定制化构建数据可视化页面,并以API的方式对用户提供门户网站和数据接口服务,API支持php、java、python等开发语言,客户可直接通过程序调用接口实时获取所需数据。本文档来自技高网...
一种影视大数据平台的数据分析方法

【技术保护点】
一种影视大数据平台的数据分析方法,其特征在于:通过设置离线数据分析服务器和实时数据分析服务器,对接收到的影视大数据进行分析;然后将分析结果存储至结果数据库。

【技术特征摘要】
1.一种影视大数据平台的数据分析方法,其特征在于:通过设置离线数据分析服务器和实时数据分析服务器,对接收到的影视大数据进行分析;然后将分析结果存储至结果数据库。2.根据权利要求1所述的一种影视大数据平台的数据分析方法,其特征在于,所述的影视大数据包括用户数据和影视数据;用户数据包括影视用户画像,影视数据包括艺人综合评估、收视率、影视作品点播量。3.根据权利要求2所述的一种影视大数据平台的数据分析方法,其特征在于,所述的离线数据分析服务器用于分析影视用户画像和艺人综合评估;所述的实时数据分析服务器用于分析收视率多维度监测和影视作品点播量在线监测。4.根据权利要求3所述的一种影视大数据平台的数据分析方法,其特征在于,所述的影视用户画像的分析包括数据建模,具体为:首先对用户在智能电视端的观看行为数据,互联网和移动互联网上的影视点播行为数据建立特征值,每一个维度对应一个特征值,然后采用聚类和关联分析等算法对这些数据构建数据模型,并不断对这些数据模型进行迭代计算,当计算结果收敛于某个设定的阀值后,模型构建成功。5.根据权利要求4所述的一种影视大数据平台的数据分析方法...

【专利技术属性】
技术研发人员:董大伟
申请(专利权)人:杭州探索文化传媒有限公司
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1