一种网页追踪用户访问链路的方法、设备及存储设备技术

技术编号:18019010 阅读:84 留言:0更新日期:2018-05-23 05:13
本发明专利技术提供了一种网页追踪用户访问链路的方法、设备及存储设备,所述方法包括步骤:加载一网页;生成所述网页的标识符并将所述标识符存储在存储设备中;在所述网页发生跳转之前对该网页添加所述标识符;执行对所述网页的网页跳转;完成网页跳转并确定跳转后新网页的源网页。一种网页追踪用户访问链路的设备及存储设备,用来实现所述方法。本发明专利技术可以在跳转后的新网页中有效识别源网页。同时,整个过程中不会对网页主体进行修改,也不会影响用户的正常操作,更不需要修改网站原有代码,因此可用于第三方服务。

【技术实现步骤摘要】
一种网页追踪用户访问链路的方法、设备及存储设备
本专利技术涉及网页
,具体涉及一种网页追踪用户访问链路的方法、设备及存储设备。
技术介绍
随着互联网的快速发展,互联网安全领域中针对恶意用户,主要采用机器爬虫的识别技术进行甄别。其中,就包含对用户在网页上的操作链路的分析。分析的首要步骤就是对用户在网页访问链路的收集,现有的技术解决方案是通过javascript来获取网页HTML文档的referrer属性来确定源网页的URL。现有的方案获取到的URL无法区别相同地址重复打开两次的网页。例:用户打开了两个A网页,URL均为www.a.com,此时用户通过A网页中的链接跳转到B网页,那么B网页的referrer属性则为www.a.com,无法确认用户到底是从哪一个A网页跳转而来。网站主可以通过给每个网页的跳转地址动态地加上特殊标识,这样就需要会对既有网站的改造,需要一定的工程量。如果作为第三方服务,想获取用户的访问链路,则没有权限对网站本身结构进行修改,因此前述对网站进行改造的方法也无法使用。因此,找到一种可以唯一确认源网页,不用修改网页主体,不会影响用户正常操作,并且可以用于第三方服务的方法就成为亟待解决的问题。
技术实现思路
本专利技术提供了一种网页追踪用户访问链路的方法、设备及存储设备,通过另行存储生成的网页标识符,并在网页跳转前将标识符加载到网页的URL中,可以有效解决上述问题。本专利技术提供的技术方案是:一种网页追踪用户访问链路的方法,所述方法包括步骤:加载一网页;生成所述网页的标识符并将所述标识符存储在存储设备中;在所述网页发生跳转之前对该网页添加所述标识符;执行对所述网页的网页跳转;完成网页跳转并确定跳转后新网页的源网页。存储设备,所述存储设备存储指令及数据用于实现所述一种网页追踪用户访问链路的方法。一种网页追踪用户访问链路的设备,所述设备包括处理器及所述存储设备;所述处理器加载并执行所述存储设备中的指令及数据用于实现所述的一种网页追踪用户访问链路的方法。本专利技术的有益效果是:本专利技术提供了一种网页追踪用户访问链路的方法、设备及存储设备,通过另行存储生成的网页标识符,并在网页跳转前将标识符加载到网页的URL中,可以在跳转后的新网页中有效识别源网页。同时,整个过程中不会对网页主体进行修改,也不会影响用户的正常操作,更不需要修改网站原有代码,因此可用于第三方服务。附图说明图1是本专利技术第一实施例中网页追踪用户访问链路的方法的整体流程图;图2是本专利技术第二实施例中采用改进open窗口法追踪用户访问链路的方法步骤流程图;图3是本专利技术第三实施例中采用标签法追踪用户访问链路的方法步骤流程图;图4是本专利技术实施例中的HTML文档的referrer属性功能示意图;图5是本专利技术实施例的硬件设备工作示意图。具体实施方式为使本专利技术的目的、技术方案和优点更加清楚,下面将结合附图对本专利技术实施方式作进一步地描述,下文中提到的具体技术细节,如:方法,设备等,仅为使读者更好的理解技术方案,并不代表本专利技术仅局限于以下技术细节。本专利技术的实施例提供了一种网页追踪用户访问链路的方法、设备及存储设备。请参阅图1,图1是本专利技术第一实施例中网页追踪用户访问链路的方法的整体流程图,所述方法由硬件设备实现,具体步骤包括:S101:加载一网页。S102:生成所述网页的标识符并将所述标识符存储在存储设备中。所述标识符具有唯一性,即,唯一标识网页。S103:在所述网页发生跳转之前对该网页添加所述标识符。S104:执行对所述网页的网页跳转。S105:完成网页跳转并确定跳转后新网页的源网页。所述新网页中的referrer属性值形式为:网址加唯一标识符。网页跳转完成后,将所述源网页中的URL回复原状态,即,去掉源网页的URL中的标识符。网页跳转具体采用代理方式进行跳转。参加图2,图2是本专利技术第二实施例中采用改进open窗口法追踪用户访问链路的方法步骤流程图,包括:S201:加载一网页。S202:生成所述网页的标识符并将所述标识符存储在存储设备中。所述标识符具有唯一性,即,唯一标识网页。S203:保证所述网页未跳转。S204:通过HTML5的history接口在所述网页的URL中添加所述标识符。S205:进行现有调用open新窗口进行的跳转。S206:完成网页跳转并确定跳转后新网页的源网页。所述新网页中的referrer属性值形式为:网址加唯一标识符。网页跳转完成后,将所述源网页中的URL回复原状态,即,去掉URL中的标识符。网页跳转具体采用代理方式进行跳转。参见图3,图3是本专利技术第三实施例中采用标签法追踪用户访问链路的方法步骤流程图,包括:S301:加载一网页。S302:生成所述网页的标识符并将所述标识符存储在存储设备中。所述标识符具有唯一性,即,唯一标识网页。S303:判断标签是否为有效跳转链接。S304:如果不是,则不执行网页跳转。S305:如果是,保证所述网页未跳转。S306:通过HTML5的history接口在所述网页的URL中添加所述标识符。S307:完成网页跳转并确定跳转后新网页的源网页。所述新网页中的referrer属性值形式为:网址加唯一标识符。网页跳转完成后,将所述源网页中的URL回复原状态,即,去掉URL中的标识符。网页跳转具体采用代理方式进行跳转。参见图4,图4是本专利技术实施例中的HTML文档的referrer属性功能示意图,包括:跳转后新网页的URL401,referrer属性代码402,源网页URL403,标识符404。由图中可见,在现有技术中执行referrer属性代码402后,会得到跳转后新网页的URL401的源网页URL403,通过执行本专利技术的技术方案后,就可以的到源网页URL403及标识符404,从而唯一确定新网页的源网页。参见图5,图5是本专利技术实施例的硬件设备工作示意图,所述硬件设备具体包括:一种网页追踪用户访问链路的设备501、处理器502及存储设备503。网页追踪用户访问链路的设备501:所述一种网页追踪用户访问链路的设备501实现所述一种网页追踪用户访问链路的方法。处理器502:所述处理器502加载并执行所述存储设备503中的指令及数据用于实现所述的一种网页追踪用户访问链路的方法。存储设备503:所述存储设备503存储指令及数据;所述存储设备503用于实现所述的一种网页追踪用户访问链路的方法。通过执行本专利技术的实施例,本专利技术权利要求里的所有技术特征都得到了详尽阐述。区别于现有技术,本专利技术的实施例提供了一种网页追踪用户访问链路的方法、设备及存储设备,通过另行存储生成的网页标识符,并在网页跳转前将标识符加载到网页的URL中,可以在跳转后的新网页中有效识别源网页。同时,整个过程中不会对网页主体进行修改,也不会影响用户的正常操作,更不需要修改网站原有代码,因此可用于第三方服务。以上所述仅为本专利技术的较佳实施例,并不用以限制本专利技术,凡在本专利技术的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本专利技术的保护范围之内。本文档来自技高网...
一种网页追踪用户访问链路的方法、设备及存储设备

【技术保护点】
一种网页追踪用户访问链路的方法,所述方法由硬件设备实现,其特征在于:包括以下步骤:加载一网页;生成所述网页的标识符并将所述标识符存储在存储设备中;在所述网页发生跳转之前对该网页添加所述标识符;执行对所述网页的网页跳转;完成网页跳转并确定跳转后新网页的源网页。

【技术特征摘要】
1.一种网页追踪用户访问链路的方法,所述方法由硬件设备实现,其特征在于:包括以下步骤:加载一网页;生成所述网页的标识符并将所述标识符存储在存储设备中;在所述网页发生跳转之前对该网页添加所述标识符;执行对所述网页的网页跳转;完成网页跳转并确定跳转后新网页的源网页。2.如权利要求1所述的一种网页追踪用户访问链路的方法,其特征在于:所述标识符具有唯一性,即,唯一标识网页。3.如权利要求1所述的一种网页追踪用户访问链路的方法,其特征在于:在所述网页发生跳转之前对该网页添加所述标识符具体方式为对open新窗口方法进行改造,包括步骤:保证所述网页未跳转;通过HTML5的history接口在所述网页的URL中添加所述标识符。4.如权利要求3所述的一种网页追踪用户访问链路的方法,其特征在于:所述执行对所述网页的网页跳转具体为:进行现有调用open新窗口进行的跳转。5.如权利要求1所述的一种网页追踪用户访问链路的方法,其特征在于:在所述网页发生跳转之前对该网页添加所述标识符具...

【专利技术属性】
技术研发人员:钱堃
申请(专利权)人:武汉极意网络科技有限公司
类型:发明
国别省市:湖北,42

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1