页面流量数据的统计方法及其系统技术方案

技术编号:15083097 阅读:126 留言:0更新日期:2017-04-07 14:01
本公开是关于一种页面流量数据的统计方法及其系统,属于计算机网络技术领域。该方法包括:在页面标签里添加所述页面的唯一标识符;接收包含所述唯一标识符的浏览日志;解析所述浏览日志,根据所述唯一标识符进行所述页面的流量数据的统计。本发明专利技术能够实现基于唯一标识符的页面流量数据的准确统计;通过将该唯一标识符作为流量表的主键或者索引,还能够实现页面流量数据的快速查询。

【技术实现步骤摘要】

本公开涉及计算机网络技术,尤其涉及一种页面流量数据的统计方法及其系统
技术介绍
随着互联网技术的发展以及各大电商公司业务的扩张,大数据分析已经起到了越来越重要的作用,而互联网行业体量最大的数据就是“网站流量”数据,所有访客在网站的一切行为都会被记录下来,用来统计分析以及挖掘。目前统计某页面各流量指标的方法是截取目标URL(UniformResourceLocator,统一资源定位符),遍历全表逐一匹配,最后计算各流量指标。但是存在大量如下情况:完全不同的URL可以打开同一个页面,这种情况下,基于URL统计的数据会导致流量指标的失真,造成关注店铺或活动的营销人员的误判。同时,流量数据量巨大,每天上亿的记录,采用全表扫描方式导致查询十分缓慢,资源消耗也非常严重。因此,需要一种新的页面流量数据的统计方法及其系统。在所述
技术介绍
部分公开的上述信息仅用于加强对本公开的背景的理解,因此它可以包括不构成对本领域普通技术人员已知的现有技术的信息。
技术实现思路
本公开提供一种页面流量数据的统计方法及其系统,能够实现对页面流量数据的准确统计。本公开的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本公开的实践而习得。根据本公开的一方面,提供一种页面流量数据的统计方法,包括:在页面标签里添加所述页面的唯一标识符;接收包含所述唯一标识符的浏览日志;解析所述浏览日志,根据所述唯一标识符进行所述页面的流量数据的统计。根据本公开的一实施方式,其中所述页面标签为meta标签。根据本公开的一实施方式,其中所述唯一标识符的编码中包括所述页面的基础信息和开发人员信息。根据本公开的一实施方式,其中所述页面的基础信息包括:站点编号、页面分组、页面编号、页面类型及页面创建时间,所述页面的开发人员信息包括开发人员所属部门及开发人员ID。根据本公开的一实施方式,其中所述唯一标识符的编码采用树状规则。根据本公开的一实施方式,其中同一页面映射至多个不同的URL,当用户通过所述多个不同的URL打开所述同一页面时,生成所述浏览日志并上传。根据本公开的一实施方式,其中根据所述唯一标识符进行所述页面的流量数据的统计包括:根据所述浏览日志的解析结果,在流量表中增加该唯一标识符字段,并将该唯一标识符字段设置成主键或者索引;接收页面流量查询请求,将该唯一标识符作为该页面的唯一标识,获取该页面的流量数据。根据本公开实施例的另一方面,提供一种页面流量数据的统计系统,包括:标识符添加模块,其用于在页面标签里添加页面的唯一标识符;接收模块,其用于接收包含所述唯一标识符的浏览日志;统计模块,其用于解析所述浏览日志,根据所述唯一标识符进行所述页面的流量数据的统计。根据本公开的一实施方式,其中同一页面映射至多个不同的URL,当用户通过所述多个不同的URL打开所述同一页面时,生成所述浏览日志并上传至一日志服务器,所述统计模块包括:数据仓库,其用于解析所述浏览日志,并根据解析结果,在流量表中增加该唯一标识符字段,并设置成索引;流量数据获取单元,其用于接收页面流量查询请求,将该唯一标识符作为该页面的唯一标识,获取该页面的流量数据。根据本公开实施例的再一方面,提供一种电子设备,包括:处理器;用于存储处理器可执行指令的存储器;其中,所述处理器被配置为:在页面标签里添加页面的唯一标识符;接收包含所述唯一标识符的浏览日志;解析所述浏览日志,根据所述唯一标识符进行所述页面的流量数据的统计。根据本公开的页面流量数据的统计方法及其系统,其通过在页面标签增设唯一标识符用于页面流量数据的统计,解决了基于URL的统计方法中同一页面可以通过多个不同的URL打开导致的页面流量数据不准确的问题。根据本公开的另一些实施例,本公开的页面流量数据的统计方法及其系统,通过将该唯一标识符设置成流量表的主键或者索引,能够实现用户快速查询,解决了采用全表扫描方式导致的查询效率低下的问题。应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。附图说明此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本专利技术的实施例,并与说明书一起用于解释本专利技术的原理。图1示意性示出根据本公开示例实施方式的页面流量数据的统计方法的流程图;图2A示意性示出根据本公开示例实施方式的同一页面映射至多个不同的URL的示意图;图2B示意性示出现有的基于URL页面流量数据的统计方法示意图;图3A示意性示出根据本公开示例实施方式的唯一标识符的编码的树状结构示意图;图3B示意性示出基于图3A所示的唯一标识符的编码的树状结构的实际举例;图4示意性示出根据本公开示例实施方式的页面流量数据的统计方法的流程图;图5示意性示出根据本公开示例实施方式的页面流量数据的统计系统的结构图。具体实施方式现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的范例;相反,提供这些实施方式使得本公开将更加全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。附图仅为本公开的示意性图解,并非一定是按比例绘制。图中相同的附图标记表示相同或类似的部分,因而将省略对它们的重复描述。此外,所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施方式中。在下面的描述中,提供许多具体细节从而给出对本公开的实施方式的充分理解。然而,本领域技术人员将意识到,可以实践本公开的技术方案而省略所述特定细节中的一个或更多,或者可以采用其它的方法、组元、系统、步骤等。在其它情况下,不详细示出或描述公知结构、方法、系统、实现、材料或者操作以避免喧宾夺主而使得本公开的各方面变得模糊。附图中所示的一些方框图是功能实体,不一定必须与物理或逻辑上独立的实体相对应。可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器系统和/或微控制器系统中实现这些功能实体。以下示例性实施例中所描述的实施方式并不代表与本专利技术相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本专利技术的一些方面相一致的系统和方法的例子。图1示意性示出根据本公开示例实施方式的页面流量数据的统计方法的流程图。如图1所示,在步骤S110,在页面标签里添加所述页面的唯一标识符。本专利技术中所说的页面(webpage),在WWW环境中,信息以页面信息组织,信息页面由语言来实现,在各个信息页面之间建立超文本链接以便浏览。其中主页是基本信息页,用户通过主页可以访问有关信息。主页一般包括:文本、图象、表格、超链接等基本元素。在示例性实施例中,其中同一页面可以映射至多个不同的URL。如图2A所示,当用户访问以下四个URL:http://betu.xx.com/#nogohttp://betu.xx.com/http://mall.xx.com/index-85499.html/http://mall.xx.com/index-85499.html/name=nothing中的任意一个时,均打开同一页面。不同的URL可以打开同一页面,如在xx电商平台打开百图店铺页面,可以通过多种不同的URL。对于店家而言,流量决定销量,提本文档来自技高网...

【技术保护点】
一种页面流量数据的统计方法,其特征在于,包括:在页面标签里添加所述页面的唯一标识符;接收包含所述唯一标识符的浏览日志;解析所述浏览日志,根据所述唯一标识符进行所述页面的流量数据的统计。

【技术特征摘要】
1.一种页面流量数据的统计方法,其特征在于,包括:在页面标签里添加所述页面的唯一标识符;接收包含所述唯一标识符的浏览日志;解析所述浏览日志,根据所述唯一标识符进行所述页面的流量数据的统计。2.根据权利要求1所述的方法,其特征在于,其中所述页面标签为meta标签。3.根据权利要求1所述的方法,其特征在于,其中所述唯一标识符的编码中包括所述页面的基础信息和开发人员信息。4.根据权利要求3所述的方法,其特征在于,其中所述页面的基础信息包括:站点编号、页面分组、页面编号、页面类型及页面创建时间,所述页面的开发人员信息包括开发人员所属部门及开发人员ID。5.根据权利要求3或4所述的方法,其特征在于,其中所述唯一标识符的编码采用树状规则。6.根据权利要求1所述的方法,其特征在于,其中同一页面映射至多个不同的URL,当用户通过所述多个不同的URL打开所述同一页面时,生成所述浏览日志并上传。7.根据权利要求1所述的方法,其特征在于,其中根据所述唯一标识符进行所述页面的流量数据的统计包括:根据所述浏览日志的解析结果,在流量表中增加该唯一标识符字段,并将该唯一标识符字...

【专利技术属性】
技术研发人员:李静吴凯王海旭
申请(专利权)人:北京京东尚科信息技术有限公司北京京东世纪贸易有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1