网站页面间访问路径的确定方法及装置制造方法及图纸

技术编号:15724366 阅读:57 留言:0更新日期:2017-06-29 10:01
本申请公开了一种网站页面间访问路径的确定方法及装置。该方法包括:获取访问日志,其中,访问日志为根据目标网站的访问信息生成的日志;根据访问日志获取网站页面的原始页面间原始访问路径;对原始页面间原始访问路径进行过滤处理,得到目标页面间原始访问路径;以及去除目标页面间原始访问路径中的环路,并根据访问日志在去除环路后的目标页面间原始访问路径中确定目标页面间目标访问路径。通过本申请,解决了相关技术中无法获知用户在网站上重要页面间的真实访问路径的问题。

【技术实现步骤摘要】
网站页面间访问路径的确定方法及装置
本申请涉及互联网领域,具体而言,涉及一种网站页面间访问路径的确定方法及装置。
技术介绍
目前,在对网站数据进行分析时,通常需要获知用户在网站的指定的几个重要页面间最常使用的访问路径。例如,网站中有A、B、C、D四个重要页面,预期用户会按照A->B->C->D页面间的顺序进行访问(忽略中间访问了其它页面),而且A->B->C->D这个路径也跟网站的具体业务处理路径相符合。然而,用户在重要页面间真实的访问路径不一定与网站预期的访问路径相同,而相关技术中无法获知用户在网站上重要页面间的真实访问路径。针对相关技术中无法获知用户在网站上重要页面间的真实访问路径的问题,目前尚未提出有效的解决方案。
技术实现思路
本申请的主要目的在于提供一种网站页面间访问路径的确定方法及装置,以解决相关技术中无法获知用户在网站上重要页面间的真实访问路径的问题。为了实现上述目的,根据本申请的一个方面,提供了一种网站页面间访问路径的确定方法。该方法包括:获取访问日志,其中,访问日志为根据目标网站的访问信息生成的日志;根据访问日志获取网站页面的原始页面间原始访问路径;对原始页面间原始访问路径进行过滤处理,得到目标页面间原始访问路径;以及去除目标页面间原始访问路径中的环路,并根据访问日志在去除环路后的目标页面间原始访问路径中确定目标页面间目标访问路径。进一步地,去除目标页面间原始访问路径中的环路,并根据访问日志在去除环路后的目标页面间原始访问路径中确定目标页面间目标访问路径包括:按照访问顺序遍历目标页面间原始访问路径,对目标页面间原始访问路径中的环路进行切分,得到目标页面间原始访问子路径集合;在目标页面间原始访问子路径集合中,删除包含在其他子路径中的子路径,得到删除后的目标页面间原始访问子路径集合;根据访问日志分别统计删除后的目标页面间原始访问子路径集合中每条目标页面间原始访问子路径包含的会话数量;根据会话数量对删除后的目标页面间原始访问子路径集合中每条目标页面间原始访问子路径进行排序处理;以及从排序后的目标页面间原始访问子路径中确定目标页面间目标访问路径。进一步地,对原始页面间原始访问路径进行过滤处理,得到目标页面间原始访问路径包括:确定预先设置的目标页面;从原始页面间原始访问路径中提取连续访问目标页面的路径,得到至少一条连续访问目标页面的路径;以及将至少一条连续访问目标页面的路径作为目标页面间原始访问路径。进一步地,对原始页面间原始访问路径进行过滤处理,得到目标页面间原始访问路径包括:确定预先设置的目标页面;根据预先设置的目标页面对原始页面间原始访问路径中的非目标页面进行过滤处理;以及将过滤后的原始页面间原始访问路径作为目标页面间原始访问路径。进一步地,在获取访问日志之前,该方法还包括:根据预设脚本代码采集针对目标网站的访问信息;发送目标网站的访问信息至目标地址;以及在目标地址上根据目标网站的访问信息生成访问日志。进一步地,根据访问日志获取网站页面的原始页面间原始访问路径包括:获取预先设置的目标页面;确定访问日志中的所有会话;从访问日志中的所有会话中筛选访问过预先设置的目标页面的会话,得到目标会话;以及分别确定目标会话中对被访问页面的访问顺序,得到原始页面间原始访问路径。为了实现上述目的,根据本申请的另一方面,提供了一种网站页面间访问路径的确定装置。该装置包括:第一获取单元,用于获取访问日志,其中,访问日志为根据目标网站的访问信息生成的日志;第二获取单元,用于根据访问日志获取网站页面的原始页面间原始访问路径;处理单元,用于对原始页面间原始访问路径进行过滤处理,得到目标页面间原始访问路径;以及确定单元,用于去除目标页面间原始访问路径中的环路,并根据访问日志在去除环路后的目标页面间原始访问路径中确定目标页面间目标访问路径。进一步地,确定单元包括:切分模块,用于按照访问顺序遍历目标页面间原始访问路径,对目标页面间原始访问路径中的环路进行切分,得到目标页面间原始访问子路径集合;删除模块,用于在目标页面间原始访问子路径集合中,删除包含在其他子路径中的子路径,得到删除后的目标页面间原始访问子路径集合;统计模块,用于根据访问日志分别统计删除后的目标页面间原始访问子路径集合中每条目标页面间原始访问子路径包含的会话数量;第一处理模块,用于根据会话数量对删除后的目标页面间原始访问子路径集合中每条目标页面间原始访问子路径进行排序处理;以及第一确定模块,用于从排序后的目标页面间原始访问子路径中确定目标页面间目标访问路径。进一步地,处理单元包括:第二确定模块,用于确定预先设置的目标页面;提取模块,用于从原始页面间原始访问路径中提取连续访问目标页面的路径,得到至少一条连续访问目标页面的路径;以及第三确定模块,用于将至少一条连续访问目标页面的路径作为目标页面间原始访问路径。进一步地,处理单元包括:第四确定模块,用于确定预先设置的目标页面;第二处理模块,用于根据预先设置的目标页面对原始页面间原始访问路径中的非目标页面进行过滤处理;以及第五确定模块,用于将过滤后的原始页面间原始访问路径作为目标页面间原始访问路径。通过本申请,采用以下步骤:获取访问日志,其中,访问日志为根据目标网站的访问信息生成的日志;根据访问日志获取网站页面的原始页面间原始访问路径;对原始页面间原始访问路径进行过滤处理,得到目标页面间原始访问路径;以及去除目标页面间原始访问路径中的环路,并根据访问日志在去除环路后的目标页面间原始访问路径中确定目标页面间目标访问路径,解决了相关技术中无法获知用户在网站上重要页面间的真实访问路径的问题,解决了相关技术中无法获知用户在网站上重要页面间的真实访问路径的问题。通过收集用户在目标网站上的访问信息,找出访问指定页面的会话,去除会话中的非重要页面,然后对会话中包含的环进行切分,最后统计出目标页面间目标访问路径,进而达到了能够获知用户在网站上重要页面间的真实访问路径的效果。附图说明构成本申请的一部分的附图用来提供对本申请的进一步理解,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:图1是根据本申请实施例的网站页面间访问路径的确定方法的流程图;以及图2是根据本申请实施例的网站页面间访问路径的确定装置的示意图。具体实施方式需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。为了使本
的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了本文档来自技高网
...
网站页面间访问路径的确定方法及装置

【技术保护点】
一种网站页面间访问路径的确定方法,其特征在于,包括:获取访问日志,其中,所述访问日志为根据目标网站的访问信息生成的日志;根据所述访问日志获取网站页面的原始页面间原始访问路径;对所述原始页面间原始访问路径进行过滤处理,得到目标页面间原始访问路径;以及去除所述目标页面间原始访问路径中的环路,并根据所述访问日志在去除环路后的目标页面间原始访问路径中确定目标页面间目标访问路径。

【技术特征摘要】
1.一种网站页面间访问路径的确定方法,其特征在于,包括:获取访问日志,其中,所述访问日志为根据目标网站的访问信息生成的日志;根据所述访问日志获取网站页面的原始页面间原始访问路径;对所述原始页面间原始访问路径进行过滤处理,得到目标页面间原始访问路径;以及去除所述目标页面间原始访问路径中的环路,并根据所述访问日志在去除环路后的目标页面间原始访问路径中确定目标页面间目标访问路径。2.根据权利要求1所述的方法,其特征在于,去除所述目标页面间原始访问路径中的环路,并根据所述访问日志在去除环路后的目标页面间原始访问路径中确定目标页面间目标访问路径包括:按照访问顺序遍历所述目标页面间原始访问路径,对所述目标页面间原始访问路径中的环路进行切分,得到目标页面间原始访问子路径集合;在所述目标页面间原始访问子路径集合中,删除包含在其他子路径中的子路径,得到删除后的目标页面间原始访问子路径集合;根据所述访问日志分别统计所述删除后的目标页面间原始访问子路径集合中每条目标页面间原始访问子路径包含的会话数量;根据所述会话数量对所述删除后的目标页面间原始访问子路径集合中每条目标页面间原始访问子路径进行排序处理;以及从排序后的目标页面间原始访问子路径中确定目标页面间目标访问路径。3.根据权利要求1所述的方法,其特征在于,对所述原始页面间原始访问路径进行过滤处理,得到目标页面间原始访问路径包括:确定预先设置的目标页面;从所述原始页面间原始访问路径中提取连续访问目标页面的路径,得到至少一条连续访问目标页面的路径;以及将所述至少一条连续访问目标页面的路径作为所述目标页面间原始访问路径。4.根据权利要求1所述的方法,其特征在于,对所述原始页面间原始访问路径进行过滤处理,得到目标页面间原始访问路径包括:确定预先设置的目标页面;根据所述预先设置的目标页面对所述原始页面间原始访问路径中的非目标页面进行过滤处理;以及将过滤后的原始页面间原始访问路径作为所述目标页面间原始访问路径。5.根据权利要求1所述的方法,其特征在于,在获取访问日志之前,所述方法还包括:根据预设脚本代码采集针对所述目标网站的访问信息;发送所述目标网站的访问信息至目标地址;以及在所述目标地址上根据所述目标网站的访问信息生成所述访问日志。6.根据权利要求1所述的方法,其特征在于,根据所述访问日志...

【专利技术属性】
技术研发人员:李新国
申请(专利权)人:北京国双科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1