一种数字电视用户行为的大数据采集与分析方法及系统技术方案

技术编号:12102390 阅读:133 留言:0更新日期:2015-09-23 20:44
本发明专利技术提供了一种数字电视用户行为的大数据采集与分析方法及系统。其中,方法包括步骤为:记录操作数据并存储、操作数据预处理、远程发送预处理数据、分类并存储至数据库、分类数据分析处理、收视行为预测以及电视节目或广告推送;系统包括:数据记录模块、数据预处理模块、数据发送模块、数据分类模块、数据分析模块、收视预测模块以及信息推送模块。该的大数据采集与分析方法及系统采用自动实时记录操作数据替换现有的人工采集,无需用户改变任何现有收视习惯,能够有效提高了数据采集的效率和全面性,简化了采集复杂的人工采集流程,同时也避免了用户信息泄露,具有较好的市场应用前景。

【技术实现步骤摘要】

本专利技术涉及一种数据采集与分析方法及系统,尤其是一种针对数字电视用户行为的数据采集与分析方法及系统。
技术介绍
近年来,随着“大数据”概念的普及,在许多领域,服务提供商开始有意识地对海量用户数据的进行实时采集与分析,从而提取有价值的潜在信息。例如,在在线购物领域,阿里巴巴旗下的淘宝对每个用户的网上购物习惯(例如商品购买历史、商铺浏览记录等)以及其个人信息进行综合分析,从而实现个性化的商铺推荐,提高用户购买效率与商铺销售额。在网络视频领域,YouTube以及优酷依据用户信息(例如地理位置、性别等)以及用户的浏览历史,为用户推送相关的广告以及其他同类视频;在零售领域,梅西百货(Macy’ s)通过对不同商品需求和库存的情况的实时统计与分析,进行商品的实时调价,从而实现利润最大化;在信用卡领域,美国运通公司(American Express)通过对用户信用卡历史交易数据的建模与分析,来预测客户忠诚度,并采取相应促销手段提升忠诚度。但是,在大数据应用快速发展的同时,广播电视领域的用户收视行为数据采集与分析,却仍然停留在主要依靠人力的阶段。具体来说,这种传统的信息采集与分析方法按照以下流程进行:1)广电服务商委托调查公司进行用户收视调查;2)调查公司对用户随机抽样;3)调查员人工上门递送纸质调查单;4)用户手动填写调查单;5)调查员上门回收调查单;6)调查公司手工整理与分析数据;7)调查公司将分析结果反馈给广电服务商,为广告投放与电视节目制作提供参考。然而,该方法存在很多缺点。首先,它需要耗费大量的人力物力;其次,它涉及到除广电与用户外的第三方机构(调查公司),使得流程更复杂、保密性更差;最后,此方法所采集到的数据以及在此基础上的分析,往往准确性较差、实时性较低、覆盖面较窄。当今,三网融合的进一步推进,尤其是数字电视的双向改造,为“广电大数据”提供了契机。在此背景下,如何实现对海量广电用户收视行为数据的自动采集与高效分析,已成为广播电视技术的一项重要研宄课题。
技术实现思路
本专利技术要解决的技术问题是传统的信息采集与分析方法费时费力、流程复杂、保密性差、准确性较差、实时性较低且覆盖面较窄。为了解决上述技术问题,本专利技术提供了一种数字电视用户行为的大数据采集与分析方法,包括如下步骤: 步骤1,将数字电视用户对数字机顶盒进行交互操作的操作数据进行实时记录,并将操作数据存储至本地存储器中; 步骤2,读取本地存储器中的操作数据,并对操作数据进行预处理,获得每个节目的观看时长、数字电视用户的调台次数以及每个节目的平均观看时长; 步骤3,将预处理获得的观看时长、调台次数以及平均观看时长作为预处理数据定时或定量地远程发送至远程存储器中; 步骤4,读取远程存储器中的预处理数据,并按照分类规则对预处理数据进行分类处理,再将分类处理获得的分类数据分类存储至面向大数据的数据库中; 步骤5,按照分类有序读取数据库中的分类数据,并对各个类别的分类数据进行分析,获得数字电视用户的收视习惯和/或电视节目的收视率。采用自动实时记录操作数据替换现有的人工采集,能够有效提高了数据采集的效率和全面性,简化了采集复杂的人工采集流程,同时也避免了用户信息泄露;采用预处理步骤能够有效减少操作数据的传输量,降低了传输功耗;将分类数据分类存储至数据库中,能够方便数据分析时分类读取各个分类数据,提高了分析效率;采用主动采集分析获得收视习惯和/或收视率,能够有效提高数据采集的准确性,避免人工采集时数字电视用户任意填写表格。作为本专利技术方法的进一步限定方案,操作数据包括节目名称、调台时间点以及节目慢放控制。作为本专利技术方法的进一步限定方案,分类规则包括收看时间段、节目类型、收视人群、收视地域以及收视率范围。作为本专利技术方法的进一步改进方案,还包括如下步骤: 步骤6,利用预测算法根据收视习惯和/或收视率对数字电视用户的收视行为进行预测,获得数字电视用户期望收看的电视节目的收视预测报告。采用预测算法获得收视预测报告,能够方便广播电视运营商向数字电视用户针对性地推送所期望的电视节目,既能够有效提尚数字电视用户收看电视节目的兴趣,又能够有效提尚广播电视的收视率。作为本专利技术方法的进一步限定方案,预测算法为聚类算法、回归算法、神经网络或深度学习算法。作为本专利技术方法的进一步改进方案,还包括如下步骤: 步骤7,根据收视预测报告向数字电视用户推送期望收看的电视节目或广告。采用向数字电视用户推送期望收看的电视节目或广告,从而潜在地帮助电视节目制作商制作出更受用户欢迎的电视节目,也能帮助电视广告投放商提高广告收益。本专利技术还提供了一种数字电视用户行为的大数据采集与分析系统,包括如下模块: 数据记录模块,用于将数字电视用户对数字机顶盒进行交互操作的操作数据进行实时记录,并将操作数据存储至本地存储器中; 数据预处理模块,用于读取本地存储器中的操作数据,并对操作数据进行预处理,获得每个节目的观看时长、数字电视用户的调台次数以及每个节目的平均观看时长; 数据发送模块,用于将预处理获得的观看时长、调台次数以及平均观看时长作为预处理数据定时或定量地远程发送至远程存储器中; 数据分类模块,用于读取远程存储器中的预处理数据,并按照分类规则对预处理数据进行分类处理,再将分类处理获得的分类数据分类存储至面向大数据的数据库中; 数据分析模块,用于按照分类有序读取数据库中的分类数据,并对各个类别的分类数据进行分析,获得数字电视用户的收视习惯和/或电视节目的收视率。作为本专利技术系统的进一步改进方案,还包括如下模块: 收视预测模块,用于利用预测算法根据收视习惯和/或收视率对数字电视用户的收视行为进行预测,获得数字电视用户期望收看的电视节目的收视预测报告。作为本专利技术系统的进一步限定方案,预测算法为聚类算法、回归算法、神经网络或深度学习算法。作为本专利技术系统的进一步改进方案,还包括如下模块: 信息推送模块,用于根据收视预测报告向数字电视用户推送期望收看的电视节目或广生口 O本专利技术的有益效果在于:(I)采用自动实时记录操作数据替换现有的人工采集,无需用户改变任何现有收视习惯,能够有效提高了数据采集的效率和全面性,简化了采集复杂的人工采集流程,同时也避免了用户信息泄露;(2)采用预处理步骤能够有效减少操作数据的传输量,降低了传输功耗;(3)将分类数据分类存储至数据库中,能够方便数据分析时分类读取各个分类数据,提高了分析效率;(4)采用主动采集分析获得收视习惯和/或收视率,能够有效提高数据采集的准确性,避免人工采集时数字电视用户任意填写表格。【附图说明】图1为本专利技术的方法流程图; 图2为本专利技术的系统结构示意图。【具体实施方式】如图1所示,本专利技术的数字电视用户行为的大数据采集与分析方法,包括如下步骤: 步骤1,将数字电视用户对数字机顶盒进行交互操作的操作数据进行实时记录,并将操作数据存储至本地存储器中; 步骤2,读取本地存储器中的操作数据,并对操作数据进行预处理,获得每个节目的观看时长、数字电视用户的调台次数以及每个节目的平均观看时长; 步骤3,将预处理获得的观看时长、调台次数以及平均观看时长作为预处理数据定时或定量地远程发送至远程存储器中; 步骤4,读取远程存储器中的预处理数据,本文档来自技高网
...

【技术保护点】
一种数字电视用户行为的大数据采集与分析方法,其特征在于,包括如下步骤:步骤1,将数字电视用户对数字机顶盒进行交互操作的操作数据进行实时记录,并将操作数据存储至本地存储器中;步骤2,读取本地存储器中的操作数据,并对操作数据进行预处理,获得每个节目的观看时长、数字电视用户的调台次数以及每个节目的平均观看时长;步骤3,将预处理获得的观看时长、调台次数以及平均观看时长作为预处理数据定时或定量地远程发送至远程存储器中;步骤4,读取远程存储器中的预处理数据,并按照分类规则对预处理数据进行分类处理,再将分类处理获得的分类数据分类存储至面向大数据的数据库中;步骤5,按照分类有序读取数据库中的分类数据,并对各个类别的分类数据进行分析,获得数字电视用户的收视习惯和/或电视节目的收视率。

【技术特征摘要】

【专利技术属性】
技术研发人员:俞冶
申请(专利权)人:嘉兴市广播电视集团
类型:发明
国别省市:浙江;33

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1