用户访问路径的数据采集方法和装置制造方法及图纸

技术编号:12842344 阅读:66 留言:0更新日期:2016-02-11 10:53
本发明专利技术提供一种用户访问路径的数据采集方法和装置,属于数据采集技术领域。该方法包括:S1.判断安全协议页面中的点击事件是否被触发,若是,则在安全协议页面同时生成记录第一地址的缓存;S2.在到达页面中获取所述缓存中记录的第一地址,并将所述第一地址作为来自页面,并删除所述缓存。本发明专利技术的技术方案可以实现在https页面中获取来自页面为空时仍能够获取到当前页面的来自页面。

【技术实现步骤摘要】

本专利技术涉及数据采集
,特别涉及一种用户访问路径的数据采集方法和装置
技术介绍
目前采集网站的用户行为时需要采集用户的访问路径,串联用户的访问路径可以采用当前页面和来自页面的统一资源定位器(uniform resource locator,简称url)进行串联即可得到。但是由于技术限制,从安全协议https页面跳转到普通http页面目前存在如下三种情况,导致服务器管理员(Server Administrator,简称SA)无法通过常规的手段获取来自页面。第一种情况:从https A页面到https B页面经过小页面的跳转,在httpsA页面通过document, referrer属性获取到的referrer为中间最后一个小页面的url C, url C不等于https A的url,此种情况下导致SA无法正确采集到用户的访问路径。第二种情况:由于https协议出于安全考虑,在跳转到普通http协议页面时会隐藏referrer属性,导致在http页面通过document, referrer属性获取的来自页面为空,此种情况也会导致SA无法通过普通手段正确采集到用户访问路径。第三种情况:在httpsH跳转到httpsl的过程中,由于其他未知原因导致httpsl页面获取的referrer为空,SA无法通过普通手段正确采集到用户访问路径。
技术实现思路
针对现有技术的上述缺陷,本专利技术所要解决的技术问题是如何实现在获取到的来自页面为空时仍能够获取到当前页面的来自页面。为实现上述目的,一方面,本专利技术提供一种用户访问路径的数据采集方法,该方法包括步骤:S1、判断安全协议页面中的点击事件是否被触发,若是,则在安全协议页面同时生成记录第一地址的缓存;S2、在到达页面中获取所述缓存中记录的第一地址,并将所述第一地址作为来自页面,并删除所述缓存。 优选地,所述步骤S2具体包括:判断当前页面的第二地址是否存在,若存在,则判断当前页面的缓存中的第一地址与第二地址是否相等,若否,则获取当前页面的缓存中的第一地址作为来自页面,并删除所述缓存。优选地,所述步骤S2具体包括:判断当前页面的第二地址是否存在,若不存在,则获取当前页面的缓存的第一地址作为来自页面,并删除所述缓存。优选地,所述方法还包括:判断当前页面是否为安全协议页面,若是,则对当前页面绑定点击事件,若否,则执行正常的页面跳转。优选地,所述方法还包括:加载采集用户行为的代码。另一方面,本专利技术提供一种用户访问路径的数据采集装置,该装置包括:生成单元,判断安全协议页面中的点击事件是否被触发,若是,则在安全协议页面同时生成记录第一地址的缓存;获取单元,在到达页面中获取所述缓存中记录的第一地址,并将所述第一地址作为来自页面,并删除所述缓存。优选地,所述获取单元具体包括:第一判断单元,用于判断当前页面的第二地址是否存在;第二判断单元,用于若在第一单元判断出当前页面的第二地址存在时,则判断当前页面的第二地址是否存在,若存在,则判断当前页面的缓存中的第一地址与第二地址是否相等,若否,则获取当前页面的缓存中的第一地址作为来自页面,并删除所述缓存。优选地,所述获取单元具体包括:第三判断单元,用于判断当前页面的第二地址是否存在,若不存在,则获取当前页面的缓存的第一地址作为来自页面,并删除所述缓存。优选地,所述装置还包括:绑定单元,用于判断当前页面是否为安全协议页面,若是,则对当前页面绑定点击事件,若否,则执行正常的页面跳转。优选地,所述装置还包括:预设单元,用于加载采集用户行为的代码。本专利技术提供的用户访问路径的数据采集方法和装置中,通过获取用户在安全协议https页面发生点击行为时,同时记录当前页面,可以实现在https页面中获取来自页面为空时仍能够获取到当前页面的来自页面。【附图说明】图1是本专利技术一个实施例中的用户访问路径的数据采集方法的流程示意图;图2是本专利技术另一个实施例中的用户访问路径的数据采集装置的结构示意图;图3为本专利技术一个优选实施例中的用户访问路径的数据采集方法的流程示意图;图4为本专利技术一个优选实施例中的用户访问路径的数据采集方法的流程示意图;图5为本专利技术一个优选实施例中的用户访问路径的数据采集方法的流程示意图。【具体实施方式】为使本领域技术人员更好地理解本专利技术的技术方案,下面结合附图和【具体实施方式】对本专利技术作进一步详细描述。图1是本专利技术一个实施例中的用户访问路径的数据采集方法的流程示意图,如图1所示,该方法包括如下步骤:S1、判断安全协议页面中的点击事件是否被触发,若是,则在安全协议页面同时生成记录第一地址的缓存;S2、在到达页面中获取所述缓存中记录的第一地址,并将所述第一地址作为来自页面,并删除所述缓存。 优选地,步骤S2具体包括:判断当前页面的第二地址是否存在,若存在,则判断当前页面的缓存中的第一地址与第二地址是否相等,若否,则获取当前页面的缓存中的第一地址作为来自页面,并删除缓存。优选地,步骤S2具体包括:判断当前页面的第二地址是否存在,若不存在,则获取当前页面的缓存的第一地址作为来自页面,并删除缓存。优选地,该方法还包括:判断当前页面是否为安全协议页面,若是,则对当前页面绑定点击事件,若否,则执行正常的页面跳转。优选地,该方法还包括:加载采集用户行为的代码。优选地,本专利技术中,缓存可以为cookie,第一地址可以为url。通过在当前页面新增一个name为_snml的cookie,此cookie的value值为当前页面的url,以下所指cookie均为此cookie。cookie的更新原则是:当前页面为安全协议页面,当前页面发生点击事件时被触发。具体地,用户访问路径的数据采集方法包括如下步骤:第一步:捕捉用户的点击行为,判断在https页面是否发生了点击跳转行为,同时生成一个记录当前页面url的cookie ;第二步:在到达页面采集用户行为的代码中获取此cookie中记录的u当前第1页1 2 本文档来自技高网...

【技术保护点】
一种用户访问路径的数据采集方法,其特征在于,所述方法包括步骤:S1、判断安全协议页面中的点击事件是否被触发,若是,则在安全协议页面同时生成记录第一地址的缓存;S2、在到达页面中获取所述缓存中记录的第一地址,并将所述第一地址作为来自页面,并删除所述缓存。

【技术特征摘要】

【专利技术属性】
技术研发人员:占河张侦
申请(专利权)人:苏宁云商集团股份有限公司
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1