一种基于内容模块化的精准统计方法及装置制造方法及图纸

技术编号:18783425 阅读:30 留言:0更新日期:2018-08-29 06:50
本发明专利技术提供的基于内容模块化的精确统计方法及装置,对能确定待分析模块的统计任务,对确定的多个待分析模块进行监控,缩小了监控范围,实现精准数据收集,并提出待分析模块曝光量和价值的计算方法,解决了传统衡量模块价值的弊端,即解决了PV算法限定不同模块内容都曝光在用户眼前且不同模块的面积需一致的问题,本发明专利技术提供的精确统计方法基于内容模块化,实现内容分析、用户分析和来源分析,使统计分析结果更加精确,价值度更高,同时,本发明专利技术支持热词分析法,进行热词、关键词、位置和词频关联性分析,准确反应热词的热度分布。

【技术实现步骤摘要】
一种基于内容模块化的精准统计方法及装置
本专利技术涉及数据处理
,更具体的,涉及一种基于内容模块化的精准统计方法及装置。
技术介绍
海量多样化的数据其中所蕴藏的巨大的商业价值引发了对数据的处理、分析的巨大需求,数据已然成为公司的战略资产,公司战略逐渐的从“业务驱动”转向“数据驱动”。如何精准的收集和分析大量的数据,获取有价值的信息将成为指导各业务线的经营决策和运作的核心环节。市面目前的数据统计系统只对单一的页面或者是页面上的链接进行常规指标的统计,只能统计出某个页面或某个链接的点击行为,分析点击率并没有涉及到区域的曝光行为和点击行为。所以分析出来的数据过于片面,与页面其他枝节也无法形成关联关系,并不能真正的体现出信息的质量和价值,数据分析维度指标过于单一,难以体现出数据内容的质量和价值等。
技术实现思路
有鉴于此,本专利技术提供了一种基于内容模块化的精确统计方法及装置,提高统计分析的精确度,提高了统计分析质量。具体技术方案如下:一种基于内容模块化的精确统计方法,所述方法包括:确定多个监控页面,以及各个所述监控页面中的待分析模块,并为每个所述待分析模块定义唯一标识符;获取各个所述待分析模块的监控日志,所述监控日志携带有各个所述待分析模块的唯一标识符;对所述监控日志进行解析,依据各个所述待分析模块的唯一标识符,获取各个用户在各个所述待分析模块的操作信息;根据各个所述待分析模块的属性信息,以及各个用户在各个所述待分析模块的操作信息,对各个所述待分析模块进行内容分析、用户分析和来源分析,得到对各个所述待分析模块的分析结果;依据业务需要对所述待分析模块的分析结果进行相应的可视化展示。优选的,所述操作信息包括曝光量和点击数据,所述对所述监控日志进行解析,依据各个所述待分析模块的唯一标识符,获取各个用户在各个所述待分析模块的操作信息,包括:根据预设曝光量计算方法对所述监控日志进行解析,得到每个所述待分析模块的曝光量,所述预设曝光量计算方法具体为:当所述待分析模块有2/3的面积被用户看到,且所述待分析模块曝光时间不小于3秒时为有效曝光,当页面有滚动时曝光时间每增加3秒,所述待分析模块的曝光量加1;根据点击操作对所述监控日志进行解析,获取各个所述待分析模块唯一标识符的点击数据,所述点击数据包括:各个所述待分析模块的点击量、每一次点击的用户、各个所述待分析模块的来源数据和去向数据。优选的,所述根据各个所述待分析模块的属性信息,以及各个用户在各个所述待分析模块的操作信息,对各个所述待分析模块进行内容分析,包括:根据所述待分析模块的面积和位置,以及所述操作信息中所述待分析模块的曝光量,计算所述待分析模块的价值,价值=PV/(曝光量*面积*权重)*1000,其中,PV为所述待分析模块的浏览次数,权重=100-25*比值,所述比值为所述待分析模块的权重点到原点的距离占整个屏幕权重点到原点的距离的比值;根据不同时间段中各个所述待分析模块产生的流量变化,按预设模块质量等级评价标准,对各个所述待分析模块的质量进行评价,并对同一时间段中两个所述待分析模块的流量进行对比。优选的,所述根据各个所述待分析模块的属性信息,以及各个用户在各个所述待分析模块的操作信息,对各个所述待分析模块进行用户分析,包括:根据各个用户在预设时间段在各个所述待分析模块上的操作信息,得到各个用户在各个所述待分析模块的回访率;根据各个所述待分析模块在预设时间段的独立访客曝光数、独立访客点击数和独立访客退出量,计算所述待分析模块的衰减率;根据用户在预设时间段在各个所述待分析模块上的操作信息,对用户在不同模块的行为动线进行聚类分析,得到用户访问习惯。优选的,所述根据各个所述待分析模块的属性信息,以及各个用户在各个所述待分析模块的操作信息,对各个所述待分析模块进行来源分析,具体为:分别计算来源为搜索引擎、外部链接和站内链接时,各个所述待分析模块的独立访客数和浏览次数。优选的,所述方法还包括:获取各个所述监控页面的监控日志,根据预先设置的热词,对所述热词出现的频次进行分析,得到所述热词分布结果。优选的,当所述热词分析的对象是游戏热词时,根据预先设置的热词,对所述热词在预设时间段中出现的频次进行分析,得到所述热词分布结果,包括:确定各个所述游戏热词对应的关键词,并对所述关键词进行扩充,构成各个所述游戏热词的关键词库;构建各个游戏热词序列,所述游戏热词序列包括:游戏名称、游戏编号、关键词、所处域名和统计是否开启;根据各个所述游戏热词的关键词库对相应各个所述监控页面进行分词,提取关键字,以及所述关键词所在监控页面的位置;分别按游戏热词和位置的维度统计每个关键词的词频;以各个所述游戏热词序列为统计标准,对各个所述游戏热词的分析结果进行可视化展示。优选的,在根据各个所述待分析模块的属性信息,以及各个用户在各个所述待分析模块的操作信息,对各个所述待分析模块进行内容分析、用户分析和来源分析,之前还包括:对所述操作信息进行清洗,剔除垃圾数据。一种基于内容模块化的精确统计装置,包括:确定单元,用于确定多个监控页面,以及各个所述监控页面中的待分析模块,并为每个所述待分析模块定义唯一标识符;获取单元,用于获取各个所述待分析模块的监控日志,所述监控日志携带有各个所述待分析模块的唯一标识符;解析单元,用于对所述监控日志进行解析,依据各个所述待分析模块的唯一标识符,获取各个用户在各个所述待分析模块的操作信息;分析单元,用于根据各个所述待分析模块的属性信息,以及各个用户在各个所述待分析模块的操作信息,对各个所述待分析模块进行内容分析、用户分析和来源分析,得到对各个所述待分析模块的分析结果;可视化展示单元,用于依据业务需要对所述待分析模块的分析结果进行相应的可视化展示。优选的,所述装置还包括热词分析单元,当所述热词分析对象是游戏热词时,所述热词分析单元包括:确定子单元,用于确定各个所述游戏热词对应的关键词,并对所述关键词进行扩充,构成各个所述游戏热词的关键词库;构建子单元,用于构建各个游戏热词序列,所述游戏热词序列包括:游戏名称、游戏编号、关键词、所处域名和统计是否开启;分词子单元,用于根据各个所述游戏热词的关键词库对相应各个所述监控页面进行分词,提取关键字,以及所述关键词所在监控页面的位置;统计子单元,用于分别按游戏热词和位置的维度统计每个关键词的词频;可视化展示子单元,用于以各个所述游戏热词序列为统计标准,对各个所述游戏热词的分析结果进行可视化展示。相对于现有技术,本专利技术的有益效果如下:本专利技术提供的基于内容模块化的精确统计方法及装置,对能确定待分析模块的统计任务,对确定的多个待分析模块进行监控,缩小了监控范围,实现精准数据收集,并提出待分析模块曝光量和价值的计算方法,解决了传统衡量模块价值的PV算法限定不同模块内容都曝光在用户眼前且不同模块的面积一致的弊端,本专利技术提供的精确统计方法基于内容模块化,实现内容分析、用户分析和来源分析,使统计分析结果更加精确,价值度更高,同时,本专利技术支持热词分析法,进行热词、关键词、位置和词频关联性分析,准确反应热词的热度分布。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中本文档来自技高网...

【技术保护点】
1.一种基于内容模块化的精确统计方法,其特征在于,所述方法包括:确定多个监控页面,以及各个所述监控页面中的待分析模块,并为每个所述待分析模块定义唯一标识符;获取各个所述待分析模块的监控日志,所述监控日志携带有各个所述待分析模块的唯一标识符;对所述监控日志进行解析,依据各个所述待分析模块的唯一标识符,获取各个用户在各个所述待分析模块的操作信息;根据各个所述待分析模块的属性信息,以及各个用户在各个所述待分析模块的操作信息,对各个所述待分析模块进行内容分析、用户分析和来源分析,得到对各个所述待分析模块的分析结果;依据业务需要对所述待分析模块的分析结果进行相应的可视化展示。

【技术特征摘要】
1.一种基于内容模块化的精确统计方法,其特征在于,所述方法包括:确定多个监控页面,以及各个所述监控页面中的待分析模块,并为每个所述待分析模块定义唯一标识符;获取各个所述待分析模块的监控日志,所述监控日志携带有各个所述待分析模块的唯一标识符;对所述监控日志进行解析,依据各个所述待分析模块的唯一标识符,获取各个用户在各个所述待分析模块的操作信息;根据各个所述待分析模块的属性信息,以及各个用户在各个所述待分析模块的操作信息,对各个所述待分析模块进行内容分析、用户分析和来源分析,得到对各个所述待分析模块的分析结果;依据业务需要对所述待分析模块的分析结果进行相应的可视化展示。2.根据权利要求1所述的方法,其特征在于,所述操作信息包括曝光量和点击数据,所述对所述监控日志进行解析,依据各个所述待分析模块的唯一标识符,获取各个用户在各个所述待分析模块的操作信息,包括:根据预设曝光量计算方法对所述监控日志进行解析,得到每个所述待分析模块的曝光量,所述预设曝光量计算方法具体为:当所述待分析模块有2/3的面积被用户看到,且所述待分析模块曝光时间不小于3秒时为有效曝光,当页面有滚动时曝光时间每增加3秒,所述待分析模块的曝光量加1;根据点击操作对所述监控日志进行解析,获取各个所述待分析模块唯一标识符的点击数据,所述点击数据包括:各个所述待分析模块的点击量、每一次点击的用户、各个所述待分析模块的来源数据和去向数据。3.根据权利要求1所述的方法,其特征在于,所述根据各个所述待分析模块的属性信息,以及各个用户在各个所述待分析模块的操作信息,对各个所述待分析模块进行内容分析,包括:根据所述待分析模块的面积和位置,以及所述操作信息中所述待分析模块的曝光量,计算所述待分析模块的价值,价值=PV/(曝光量*面积*权重)*1000,其中,PV为所述待分析模块的浏览次数,权重=100-25*比值,所述比值为所述待分析模块的权重点到原点的距离占整个屏幕权重点到原点的距离的比值;根据不同时间段中各个所述待分析模块产生的流量变化,按预设模块质量等级评价标准,对各个所述待分析模块的质量进行评价,并对同一时间段中两个所述待分析模块的流量进行对比。4.根据权利要求1所述的方法,其特征在于,所述根据各个所述待分析模块的属性信息,以及各个用户在各个所述待分析模块的操作信息,对各个所述待分析模块进行用户分析,包括:根据各个用户在预设时间段在各个所述待分析模块上的操作信息,得到各个用户在各个所述待分析模块的回访率;根据各个所述待分析模块在预设时间段的独立访客曝光数、独立访客点击数和独立访客退出量,计算所述待分析模块的衰减率;根据用户在预设时间段在各个所述待分析模块上的操作信息,对用户在不同模块的行为动线进行聚类分析,得到用户访问习惯。5.根据权利要求1所述的方法,其特征在于,所述根据各个所述待分析模块的属性信息,以及各个用户在...

【专利技术属性】
技术研发人员:张静聪吴鸿煊颜荣辉
申请(专利权)人:北京畅游时空软件技术有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1