确定访问路径的方法和装置、确定页面流失率的方法和系统制造方法及图纸

技术编号:9765839 阅读:161 留言:0更新日期:2014-03-15 11:12
本申请公开了确定访问路径的方法和装置、确定页面流失率的方法和系统,其中确定访问路径的方法包括:在访问日志中获取记录;确定具有相同用户标识的记录集合并确定目标分析记录;根据当前目标分析记录中的上一访问网址获取的上一级记录中确定下一目标分析记录;将该下一目标分析记录作为当前目标分析记录;重复本步骤,直至该当前目标分析记录中的上一访问网址记录为非有效访问网址链接;构建网址记录。由于访问路径中包括了完整的访问网页和网页访问顺序,所以访问路径中包括的信息量要远远地大于现有技术中的路径对所包括的信息量,可以直接反映访问用户的访问行为,所以以访问路径为统计依据可以有效地降低网站分析的计算成本。

【技术实现步骤摘要】
确定访问路径的方法和装置、确定页面流失率的方法和系统
本申请涉及网站分析领域,特别是确定访问路径的方法和装置、确定页面流失率的方法和系统。
技术介绍
网站分析是对网站中的访问用户的行为的研究,通过研究网站中访问用户的行为特点,可以反映网站的设计是否存在缺陷。网站分析的重要的方式为通过采用访问日志中的记录,来提取访问用户在网站中的访问数据。现有技术中,常用的方法是将网站的各个页面按照其树形结构分解为多个网站路径对;举例来说,如图1所示,网站的树状结构示出,网站分为三层,共包括6个页面,可以划分为(首页,产品list),(首页,资讯首页),(产品list,产品detail),(产品list,产品detail),(资讯首页,咨询帖子)共计5个网站路径对;访问用户在访问网站时的每个页面跳转可以作为访问路径对,比如,如果访问用户从首页网页跳转到资讯首页网页,然后跳转至咨询帖子网页,则该访问用户的访问路径对包括(首页,资讯首页)和(资讯首页,咨询帖子)。在进行网站分析时,提取访问日志中包括有直接跳转链接关系的两个页面的路径对,通过统计分析提取到的路径对,从而可以获取访问用户对网站的访问特性;比如,通过路径对的分析,可以统计出页面的流失率。页面流失率是指网站访问用户在访问网站页面时对某一页面的退出或跳出的比率。通过对各个页面的流失率进行统计,可以为网站的优化,提高网站的访问率提供重要的分析依据。目前,业界采用的方式一般为,通过判断访问日志中提取的路径对是否包括了需要分析的完整路径的网站路径对,从而可以判断访问用户是否流失,以及是由哪一个网站路径对所对应的网页造成的流失。具体的,当需要统计访问用户从首页到产品list页面,然后到产品detail页面这一路径的流失率的时候,需要将(首页,产品list)和(产品list,产品detail)这两个网站路径对与每个访问用户的访问路径对进行比较,进而将包括有与访问路径对对应的访问用户统计为非流失,否则将统计为流失。由于目前大型网站中,自身结构比较复杂,包括的网站路径对数量很大,而且由于访问用户的数量较大,所以访问用户的访问路径对也会数量巨大。综上所述,现有技术中,以路径对为统计依据的网站分析方法,计算成本巨大,会使得系统资源的耗费较大。
技术实现思路
有鉴于此,本申请提供了确定访问路径的方法和装置、确定页面流失率的方法和系统,以实现降低计算成本的目的。本申请的
技术实现思路
如下:一种确定访问路径的方法,包括步骤:S11、在访问日志中获取包括有访问用户标识、访问网址、访问时间和上一访问网址的记录;S12、确定具有相同用户标识的记录集合,将所述记录集合内最后访问时间的记录确定为目标分析记录;S13、在根据当前目标分析记录中的上一访问网址获取的上一级记录中确定下一目标分析记录;将该下一目标分析记录作为当前目标分析记录;重复本步骤,直至该当前目标分析记录中的上一访问网址记录为非有效访问网址链接;S14、按照目标分析记录的获取顺序排列,构建该访问用户一次访问过程中所访问的访问网址的集合的网址记录。优选的,在本申请中,在S14、按照目标分析记录的获取顺序排列,构建该访问用户一次访问过程中所访问的访问网址的集合的网址记录之后还包括:S15、在所述记录集合内尚未被确定为目标分析记录的记录中,将最后访问时间的记录确定为另一目标分析记录;S16、重复执行步骤S13至S15,至所有记录均被确定为目标分析记录。优选的,在本申请中,所述在根据当前目标分析记录中的上一访问网址获取的上一级记录中确定下一目标分析记录,包括:当所述上一级记录为多个时,确定访问时间为最后的上一级记录中的访问网址对应的记录为下一目标分析记录。优选的,在本申请中,所述分别确定具有相同用户标识的记录集合,包括:将所述记录按照用户标识排序。优选的,在本申请中,所述上一记录为非有效访问网址链接,包括:所述上一访问网址记录为空或所述上一访问网址链接无效。在本申请的另一方面,还提供了一种确定页面流失率的方法,包括步骤:S21、在访问日志中获取包括有访问用户标识、访问网址、访问时间和上一访问网址的记录;S22、确定具有相同用户标识的记录集合,将所述记录集合内最后访问时间的记录确定为目标分析记录;S23、在根据当前目标分析记录中的上一访问网址获取的上一级记录中确定下一目标分析记录;将该下一目标分析记录作为当前目标分析记录;重复本步骤,直至该当前目标分析记录中的上一访问网址记录为非有效访问网址链接;S24、按照目标分析记录的获取顺序排列,构建该访问用户一次访问过程中所访问的访问网址的集合的网址记录;S25、在所述记录集合内尚未被确定为目标分析记录的记录中,将最后访问时间的记录确定为目标分析记录;S26、重复执行步骤S23至S25,至所有记录均被确定为目标分析记录。S27、获取所述网址记录的集合中第一访问网址数量和第二访问网址数量,计算所述第一访问网址与所述第二访问网址的比值以获取第一访问网址到所述第二访问网址的流失率;所述第二访问网址为由所述第一访问网址通过至少一次链接跳转可以实现访问的访问网址。在本申请的另一方面,还提供了一种确定访问路径的装置,其特征在于,包括:记录获取单元,用于在访问日志中获取包括有访问用户标识、访问网址、访问时间和上一访问网址的记录;目标分析记录确定单元,用于确定具有相同用户标识的记录集合,将所述记录集合内最后访问时间的记录确定为目标分析记录;下一目标分析记录确定单元,用在根据当前目标分析记录中的上一访问网址获取的上一级记录中确定下一目标分析记录;将该下一目标分析记录作为当前目标分析记录;重复本步骤,直至该当前目标分析记录中的上一访问网址记录为非有效访问网址链接;访问网址集合获取单元,用于按照目标分析记录的获取顺序排列,构建该访问用户一次访问过程中所访问的访问网址的网址集合。优选的,在本申请中,所述下一目标分析记录确定单元包括:时间判定模块,用于当所述上一级记录为多个时,确定访问时间为最后的上一级记录中的访问网址对应的记录为下一目标分析记录。优选的,在本申请中,所述目标分析记录确定单元包括:排序模块,用于将所述记录按照用户标识排序。优选的,在本申请中,所述上一记录为非有效访问网址链接,包括:所述上一访问网址记录为空或所述上一访问网址链接无效。在本申请的另一方面,还提供了一种确定页面流失率的系统,其特征在于,包括上述访问路径的装置,和,统计单元,用于获取网址记录的集合中第一访问网址数量和第二访问网址数量,计算所述第一访问网址与所述第二访问网址的比值以获取第一访问网址到所述第二访问网址的流失率;所述第二访问网址为由所述第一访问网址通过至少一次链接跳转可以实现访问的访问网址;通过上述技术方案可以看出,本申请通过访问日志的记录中所包括的上一访问网址,从而可以追踪访问用户在访问网站时的所访问到的网址和访问顺序,进而可以将访问用户的访问行为进行整合,构建该访问用户每次访问过程中所访问的访问网址的集合的网址记录。由于所述网址记录中包括了访问用户在访问网站时的所有访问页面,并将所有访问页面按照访问顺序排列,所以网址记录可以作为访问用户的访问路径;由于访问路径中包括了完整的访问网页和网页访问顺序,所以访问路径中包括的信息量要远远地大于现有本文档来自技高网
...
确定访问路径的方法和装置、确定页面流失率的方法和系统

【技术保护点】
一种确定访问路径的方法,其特征在于,包括:S11、在访问日志中获取包括有访问用户标识、访问网址、访问时间和上一访问网址的记录;S12、确定具有相同用户标识的记录集合,将所述记录集合内最后访问时间的记录确定为目标分析记录;S13、在根据当前目标分析记录中的上一访问网址获取的上一级记录中确定下一目标分析记录;将该下一目标分析记录作为当前目标分析记录;重复本步骤,直至该当前目标分析记录中的上一访问网址记录为非有效访问网址链接;S14、按照目标分析记录的获取顺序排列,构建该访问用户一次访问过程中所访问的访问网址的集合的网址记录。

【技术特征摘要】
1.一种确定访问路径的方法,其特征在于,包括:S11、在访问日志中获取包括有访问用户标识、访问网址、访问时间和上一访问网址的记录;S12、确定具有相同用户标识的记录集合,将所述记录集合内最后访问时间的记录确定为目标分析记录;S13、在根据当前目标分析记录中的上一访问网址获取的上一级记录中确定下一目标分析记录;将该下一目标分析记录作为当前目标分析记录;重复本步骤,直至该当前目标分析记录中的上一访问网址记录为非有效访问网址链接;S14、按照目标分析记录的获取顺序排列,构建该访问用户一次访问过程中所访问的访问网址的集合的网址记录。2.根据权利要求1所述确定访问路径的方法,其特征在于,在S14、按照目标分析记录的获取顺序排列,构建该访问用户一次访问过程中所访问的访问网址的集合的网址记录之后还包括:S15、在所述记录集合内尚未被确定为目标分析记录的记录中,将最后访问时间的记录确定为另一目标分析记录;S16、重复执行步骤S13至S15,至所有记录均被确定为目标分析记录。3.根据权利要求2所述确定访问路径的方法,其特征在于,所述在根据当前目标分析记录中的上一访问网址获取的上一级记录中确定下一目标分析记录,包括:当所述上一级记录为多个时,确定访问时间为最后的上一级记录中的访问网址对应的记录为下一目标分析记录。4.根据权利要求3所述确定访问路径的方法,其特征在于,所述确定具有相同用户标识的记录集合,包括:将所述记录按照用户标识排序。5.根据权利要求4所述确定访问路径的方法,其特征在于,所述上一记录为非有效访问网址链接,包括:所述上一访问网址记录为空或所述上一访问网址链接无效。6.一种确定页面流失率的方法,其特征在于,包括:S21、在访问日志中获取包括有访问用户标识、访问网址、访问时间和上一访问网址的记录;S22、确定具有相同用户标识的记录集合,将所述记录集合内最后访问时间的记录确定为目标分析记录;S23、在根据当前目标分析记录中的上一访问网址获取的上一级记录中确定下一目标分析记录;将该下一目标分析记录作为当前目标分析记录;重复本步骤,直至该当前目标分析记录中的上一访问网址记录为非有效访问网址链接;S24、按照目标分析记录的获取顺序排列,构建该...

【专利技术属性】
技术研发人员:吴伟勋
申请(专利权)人:阿里巴巴集团控股有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1