一种基于新媒体多源跨屏数据收视指标的计算方法技术

技术编号:22977679 阅读:17 留言:0更新日期:2020-01-01 00:31
本发明专利技术公开了一种基于新媒体多源跨屏数据收视指标的计算方法,其内容包括利用互联网信息采集装置,采集从用户终端反馈的包含的总装机顶盒数、机顶盒开机时长、开机的机顶盒数、收视时长这些统计数据;并结合公式a、b、c计算出开机率、开机触达率和收视率。该方法基于各地以秒为单位的数据采集和以万起步的海量数据,从而从原始抽样数据以个人为单位的计算方式升级为对每机顶盒收视数据的调研,改变抽样计算公式,使其更符合大数据终端数据展示的情况,是对当前抽样市场数据误差大、波动大、不精准的完美校正。并可向各类数据适用方提供收视终端的各类收视行为。

A calculation method of viewing index based on new media multi-source cross screen data

【技术实现步骤摘要】
一种基于新媒体多源跨屏数据收视指标的计算方法
:本专利技术涉及互联网数据分析,特别涉及一种基于新媒体多源跨屏数据收视指标的计算方法。
技术介绍
:目前国内的调查市场中主要有三种方式获得数据采集,他们分别是日记卡、测量仪和大数据。日记卡、测量仪主要还是局限在统计抽样理论的基础上,是延伸出来的市场调查行为。大数据的方法完全脱离统计抽样的概念,采用普查的方式进行数据采集及分析。无论是日记卡还是测量仪,其数据采集无法脱离样本的概念,其样本量越大数据波动越小,从而越接近真实数值,但是每个样本户的维护成本不菲,因此每个地区的样本通常在100-300不等,省级数据样本为500-800不等。这些样本与各地区几十万、上百万、上千万的人口相比相差巨大,因为每样本被赋予一个巨高的权重值,其分析的收视结果自然与真实水平相差甚远,尤其三四线城市本地频道、小众频道,通常抽样数据显示的收视率不足0.01%。另一方面,现有传媒统计方式还存在以下缺陷:1、误差抽样的方式在市场的检验中出了不少问题,不可避免的收视误差算是首当其中。大家都知道样本越多精度越高,但抽样需要进行较高成本的ES基础大调查,且每户样本都需要进行装机、回传、维护等等工作,会产生一系列费用,为了平衡成本和误差,大城市的样本户一般300-500户左右,而在小城镇则抽取100户(约300多人)进行调查。在样本数据加权后,这些样本户代表几十万甚至上百万人口,无论样本量的选择如何的合理,抽样调查始终存在误差大的问题。2、样本容易受污染除此之外,抽样调查最为严重的现实问题为收视数据污染,即收视造假。收视样本受到人为操作。如某节目的制作单位在节目播出期间,通过某些途径清楚了调查公司样本户所在片区,通过举办社区活动,送礼等方式,使观众收看其节目,提升收视率;更有甚至是通过不正当手段,干扰信号。记得在《芈月传》首播时,东方卫视发布的一则公告表示上海杨浦、长宁等地区出现东方卫视信号中断,观众无法正常观看,收视受到严重影响。3、遥控器乱按键每户样本户家中均配备了带有个人信息的遥控器,比如按键中1号键代表妈妈,2号键代表爸爸,每个用户在收视时需要进行按键行为,相应的在收视计算中会得知究竟是妈妈在看还是爸爸在看,从而得到关于性别比例的数据。但是,目前的遥控器并没有强制按键、或者锁定乱按键的功能,如果妈妈收视按的2号爸爸的代表键,收视结果则会告诉我们是一位男性观众在收视。当然,目前比较科学的方式是将传媒大数据分析的各类与观众收视相关的指标与抽样时代并不本职的差异,其均与观众到达规模、收视时长为基础,可以得出收视率这一综合指标,常用的指标还包括市场占有率、平均观众收视时长、开机率等等相关指标。但数据采集方式已经改变、原来的指标公式在大数据时代并不适用。
技术实现思路
:鉴于上述技术问题,本专利技术提供了一种基于新媒体多源跨屏数据收视指标的计算方法。该方法基于各地以秒为单位的数据采集和以万起步的海量数据,从而从原始抽样数据以个人为单位的计算方式升级为对每机顶盒收视数据的调研,改变抽样计算公式,使其更符合大数据终端数据展示的情况,是对当前抽样市场数据误差大、波动大、不精准的完美校正。并可向各类数据适用方提供收视终端的各类收视行为。本专利技术的具体技术方案如下:一种基于新媒体多源跨屏数据收视指标的计算方法,其内容包括利用互联网信息采集装置,采集从用户终端反馈的包含的总装机顶盒数、机顶盒开机时长、开机的机顶盒数、收视时长这些统计数据;并结合公式a、b、c计算出开机率、开机触达率和收视率;所述公式a为:该指标公式不去重,时长累加;所述公式b为:该指标公式去重,有效接触时长;所述公式c为:上述方案中,所述公式a为计算多天多时段的开机率时变为上述方案中,所述公式b为多天多时段的开机触达率时,分子为把每天每个频道每个时段满足条件的开机机顶盒取并集,分母为把每天的总装机机顶盒取并集。上述方案中,所述公式c为单天多频道多时段的收视率时变为本专利技术的有益效果如下:1、大数据海量采集,不存在样本之说,因此各用户的收视行为习惯只代表自己,没有权重值,不存在误差。2、大数据基数过大,各地均是万级用户、甚至十万、百万,因此对于用户小恩小惠希望在某些频道多停留从而提升收视时无用功,这些用户数据只会淹没在海量数据里,不会影响数据的真实结果。3、大数据通过双向机顶盒进行数据自动的回传,直接回传机顶盒所有的状态,不需要人员进行按键配合,因此排除乱按键情况。具体实施方式:为了使本专利技术实现的技术手段、创作特征、达成目的与功效易于明白了解,下面进一步阐述本专利技术。集合具体案例分析,本专利技术中的几个重要定义参数如下:(1)开机率(%)不去重,时长累加指标公式:输入:地区起始日期终止日期统计时段新疆2013/08/032013/08/0302:00:00-25:59:59输出:开机率(%)多天多时段的开机率:(2)开机触达率(%)去重+有效接触时长指标公式:输入:地区起始日期终止日期统计时段开机条件新疆2013/08/032013/08/0302:00:00-25:59:591分钟注:开机条件需要确认需求输出:开机触达率(%)多天多时段的开机触达率:分子:把每天每个频道每个时段满足条件的开机机顶盒取并集分母:把每天的总装机机顶盒取并集(3)收视率(%)指标公式:输出:收视率(%)单天多频道多时段的收视率:注:分母的计算,因为是单天,所以总装机机顶盒数是一样的,如果时段1和时段2有重复,比如计算某节目(21点到22点在CCTV1播出,21点30到22点30在CCTV2播出),则分母是21点到22点30的总时长乘以当天的总装机机顶盒数,即5400s*总装机机顶盒数;若时段1和时段2无重复,分母按上式直接相加再乘以总装机机顶盒数。与现有技术相比,本专利技术中的大数据或称巨量数据、海量数据、大资料,指的是所涉及的数据量规模巨大到无法通过人工,在合理时间内达到截取、管理、处理、并整理成为人类所能解读的信息。在视听市场中,大数据就是通过对DVB、智能电视、IPTV、OTT、PC、移动等终端的采集记录用户的收视行为。在大数据调查中,大数据的样本量至少是万级,甚至是百万级以上的数量,基本可以无视误差,同样,如此庞大的样本量,制作单位想伸魔掌,恐怕也无从下手,所以数据不易受污染。本文档来自技高网
...

【技术保护点】
1.一种基于新媒体多源跨屏数据收视指标的计算方法,其内容包括利用互联网信息采集装置,采集从用户终端反馈的包含的总装机顶盒数、机顶盒开机时长、开机的机顶盒数、收视时长这些统计数据;并结合公式a、b、c计算出开机率、开机触达率和收视率;/n所述公式a为:/n

【技术特征摘要】
1.一种基于新媒体多源跨屏数据收视指标的计算方法,其内容包括利用互联网信息采集装置,采集从用户终端反馈的包含的总装机顶盒数、机顶盒开机时长、开机的机顶盒数、收视时长这些统计数据;并结合公式a、b、c计算出开机率、开机触达率和收视率;
所述公式a为:

该指标公式不去重,时长累加;
所述公式b为:

该指标公式去重,有效接触时长;
所述公式c为:





2.根据权利要求1所述的一种基于新媒体多源跨屏数据收...

【专利技术属性】
技术研发人员:李馥岑孙鑫李莎
申请(专利权)人:上海淘播播电子商务有限公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1