一种实现数字电视目标受众统计的方法及装置制造方法及图纸

技术编号:12624354 阅读:74 留言:0更新日期:2015-12-31 17:40
本发明专利技术公开了一种实现数字电视目标受众统计的方法和装置,包括:获取预设时长内所有用户的机顶盒的回路数据,按照时间段和节目类型进行整理统计为所有用户各自的目标受众分析数据;将各目标受众分析数据分别与各样本数据中的收视数据进行相似度判断,将相似度数值最高的样本数据确定为与该户目标受众分析数据相同的目标受众类型;根据确定的各目标受众分析数据所属的目标受众类型,及确定出目标受众类型对应的样本数据,统计各类型节目在统计时间段内的目标受众。本发明专利技术通过充分利用所有用户的收视行为的回路数据,降低了目标受众统计成本,提高了目标受众统计的准确性。

【技术实现步骤摘要】

本专利技术涉及数据分析领域,尤指一种实现数字电视目标受众统计的方法及装置
技术介绍
在市场营销业和广告业,目标受众(Target Audience)是指被作为广告或营销活 动目标的人口群体;同一广告或营销活动的目标受众群体一般具有共同的年龄段、性别、教 育程度、收入等成员属性。例如,一个广告活动可能针对20-40岁的女性群体,即20-40岁 的女性群体是该广告活动的目标受众。通过统计目标受众可以对广告投放的商业价值进行 判断。 目前,数字电视的收视行为数据、通常是以户为单位收集的。通过机顶盒可以统计 有多少户收看了某特定节目,但是,数字电视和电脑、手机等数字设备存在使用成员构成不 同,即每一户机顶盒统计的数据由若干个具有不同年龄、性别、教育程度、收入等属性的成 员的综合收视情况组成。通过机顶盒的数据,无法确定特定节目的具体的受众目标。以一 户由夫妻组成的家庭为例,夫妻两人共同使用一个机顶盒进行收视,根据机顶盒收集的回 路数据可以统计出该户在某天晚上观看了新闻联播,但是无法确定是哪位成员观看了新闻 联播,即无法根据机顶盒的回路数据确定新闻联播的目标受众。 确定特定节目的目标受众,目前,一种方式是,主要依赖于独立安装测量仪等硬件 设备获取该节目播放时收视该节目的成员属性(通过视频检测等获得用户性别,年龄等参 数),通过机顶盒确定成员的收视内容,结合两者确定目标受众;采用测量仪的硬件设备结 合机顶盒虽然可以确定目标受众,但是,测量仪设备昂贵,无法实现大量的用户完成安装测 量仪设备,因此无法进行全面的受众目标统计。 另一种方式是,通过抽取样本户填写日记卡,通过日记卡中各户机顶盒的成员,收 视节目时间段和收视内容,确定部分样本的目标受众,然后以样本取平均,对所有用户按照 平均统计目标受众信息。采用日记卡的方式,需要大量的样本数据进行分析,对于这种按照 平均统计目标受众的方法,也存在由于不同地域成员属性差异造成的样本数据无法代表整 体数据,造成目标受众统计的偏差,影响目标受众的统计的问题。 可见,以上两种确定特定节目的目标受众的方法,目标受众的统计准确性较低,且 统计成本较高。
技术实现思路
为了解决上述技术问题,本专利技术公开了一种实现目标受众统计的方法及装置,能 够降低目标受众统计成本,并提高统计的准确性。 为了达到本申请的目的,本专利技术提供一种实现目标受众统计的方法,包括: 获取预设时长内所有用户的机顶盒的回路数据,按照时间段和节目类型进行整理 统计为所有用户各自的目标受众分析数据; 将各目标受众分析数据分别与各样本数据中的收视数据进行相似度判断,将相似 度数值最高的样本数据确定为与该户目标受众分析数据相同的目标受众类型; 根据确定的各目标受众分析数据所属的目标受众类型,及确定出目标受众类型对 应的样本数据,统计各类型节目在统计时间段内的目标受众。 进一步地,目标受众分析数据/样本数据的收视数据为: 将节目时间划分为M个时间段,将观看的节目类型划分为N个类型;通过M*N维的 特征向量分别表示目标受众分析数据的各用户/样本数据的各用户在预设时长内各个时 间段收视的各类节目的次数信息。 进一步地,该方法之前还包括:预先统计预设数值的各户机顶盒的家庭的成员组 成、成员属性与各成员各个时间段观看的节目类型的收视数据进行统计作为样本数据。 进一步地,成员属性至少包括: 成员的年龄、和/或性别、和/或教育程度、和/或收入属性。 进一步地,将各目标受众分析数据分别与各样本数据的收视数据进行相似度判断 包括:采用余弦相似度方法对各目标受众分析数据分别与各样本数据的收视数据进行相似 度计算,获得各目标受众分析数据与各样本数据的收视数据的相似度数值。 进一步地,在进行相似度判断之前,该方法还包括设定统计阈值,对各用户的目标 受众分析数据的收视次数进行统计,当各用户的目标受众分析数据的收视次数小于统计阈 值时,对该用户的目标受众分析数据不进行相似度判断; 统计阈值为:预设时长内所有用户的收视次数的平均值的1/20。 进一步地,对不进行相似度判断的目标受众分析数据,该方法还包括: 通过已经统计的目标受众的目标受众数值与用户数的比值; 将对不进行相似度判断的目标受众分析数据的用户数乘以已经统计的目标受众 的目标受众数值与用户数的比值,确定不进行相似度判断的目标受众分析数据的目标受众 数值,以统计目标受众。 另一方面,本申请还提供一种实现数字电视目标受众统计的装置,包括:获取整理 单元、类型确定单元和统计单元;其中, 获取整理单元,用于获取预设时长内所有用户的机顶盒的回路数据,按照时间段 和节目类型进行整理统计为所有用户各自的目标受众分析数据; 类型确定单元,用于将各目标受众分析数据分别与各样本数据中的收视数据进行 相似度判断,将相似度数值最高的样本数据确定为与该户目标受众分析数据相同的目标受 众类型; 统计单元,用于根据确定的各目标受众分析数据所属的目标受众类型,及确定出 目标受众类型对应的样本数据,统计各类型节目在统计时间段内的目标受众。 进一步地,目标受众分析数据/样本数据的收视数据为: 将节目时间划分为M个时间段,将观看的节目类型划分为N个类型;通过M*N维的 特征向量分别表示目标受众分析数据的各用户/样本数据的各用户在预设时长内各个时 间段收视的各类节目的次数信息。 进一步地,该装置还包括样本数据单元,用于预先统计预设数值的各户机顶盒的 家庭的成员组成、成员属性与各成员各个时间段观看的节目类型的收视数据进行统计作为 样本数据; 所述成员属性至少包括:成员的年龄、和/或性别、和/或教育程度、和/或收入属 性。 进一步地,类型确定单元具体用于:采用余弦相似度方法对各目标受众分析数据 分别与各样本数据的收视数据进行相似度计算,获得各目标受众分析数据与各样本数据的 收视数据的相似度数值,将相似度数值最高的样本数据确定为与该户目标受众分析数据相 同的目标受众类型。 进一步地,该装置还包括阈值单元,用于在进行相似度判断之前,对各用户的目标 受众分析数据的收视次数进行统计,当各用户的目标受众分析数据的收视次数小于统计阈 值时,对该用户的目标受众分析数据不进行相似度判断; 统计阈值为:预设时长内所有用户的收视次数的平均值的1/20。 进一步地,统计单元,还用于对不进行相似度判断的目标受众分析数据,通过已经 统计的目标受众的目标受众数值与用户数的比值; 将对不进行相似度判断的目标受众分析数据的用户数乘以已经统计的目标受众 的目标受众数值与用户数的比值,确定不进行相似度判断的目标受众分析数据的目标受众 数值,以统计目标受众。 与现有技术相比,本申请提供的技术方案包括:获取预设时长内所有用户的机顶 盒的回路数据,按照时间段和节目类型进行整理统计为所有用户各自的目标受众分析数 据;将各目标受众分析数据分别与各样本数据中的收视数据进行相似度判断,将相似度数 值最高的样本数据确定为与该户目标受众分析数据相同的目标受众类型;根据确定的各目 标受众分析数据所属的目标受众类型,及确定出目标受众类型对应的样本数据,统计各类 型节目在统计时间段内的目标受众。本专利技术通过充分利用所有用户的收视行为的回路数 据,降低了目标受众统计成本,提高了目标本文档来自技高网
...

【技术保护点】
一种实现数字电视目标受众统计的方法,其特征在于,包括:获取预设时长内所有用户的机顶盒的回路数据,按照时间段和节目类型进行整理统计为所有用户各自的目标受众分析数据;将各目标受众分析数据分别与各样本数据中的收视数据进行相似度判断,将相似度数值最高的样本数据确定为与该户目标受众分析数据相同的目标受众类型;根据确定的各目标受众分析数据所属的目标受众类型,及确定出目标受众类型对应的样本数据,统计各类型节目在统计时间段内的目标受众。

【技术特征摘要】

【专利技术属性】
技术研发人员:蒋龙龙丁若谷欧阳佑冯是聪吴明辉
申请(专利权)人:北京秒针信息咨询有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1