多维度收集URL链接及参数的方法、系统及设备技术方案

技术编号:20657223 阅读:28 留言:0更新日期:2019-03-23 08:37
多维度收集URL链接及参数的方法、系统及设备,所述方法包括步骤:S1、通过爬虫方式获取URL链接与参数;S2、通过网络设备获取URL链接与参数;S3、通过WAF获取URL链接与参数;S4、通过Access log获取URL链接与参数;S5、对步骤S1‑S4获取的URL链接与参数进行Hash去重,获取总的URL链接与参数。所述系统包括爬虫监测模块、网络设备监测模块、WAF监测模块以及Access log监测模块,所述设备用于加载所述方法的程序。它能够全面的获取URL链接与参数。保证了系统进行安全检测与评估的全面性。

Multidimensional methods, systems and devices for collecting URL links and parameters

The methods, systems and devices for collecting URL links and parameters in multi-dimension include: S1, crawling to obtain URL links and parameters; S2, acquiring URL links and parameters through network devices; S3, acquiring URL links and parameters through WAF; S4, acquiring URL links and parameters through Access log; S5, Hash to get URL links and parameters obtained by B S4, and obtain them. Overall URL links and parameters. The system includes a crawler monitoring module, a network device monitoring module, a WAF monitoring module and an Access log monitoring module. The device is used to load the program of the method. It can comprehensively obtain URL links and parameters. It guarantees the comprehensiveness of system security detection and evaluation.

【技术实现步骤摘要】
多维度收集URL链接及参数的方法、系统及设备
本专利技术涉及URL收集、漏洞检测,尤其涉及多维度收集URL链接及参数的方法、系统及设备。
技术介绍
当前进行WEB系统安全测试,首先需要获取到该WEB系统中的URL链接和参数。当前获取URL链接和参数,一般通过网络爬虫方式进行。由于爬虫的局限性,往往不能很全面的获取系统中的URL链接和参数,特别是针对AJAX请求,几乎无法识别。无法获取到全面的URL链接,也就无法全面的对该系统进行安全测试、安全评估。
技术实现思路
为了解决上述技术问题,本专利技术提出一种基于B/S架构系统的多维度收集URL链接及参数的方法、系统及设备,它能够全面的获取URL链接与参数。保证了系统进行安全检测与评估的全面性。为了实现上述目的,本专利技术的技术方案为:基于B/S架构系统的多维度收集URL链接及参数的方法,包括步骤:S1、通过爬虫方式获取URL链接与参数;S2、通过网络设备获取URL链接与参数;S3、通过WAF获取URL链接与参数;S4、通过Accesslog获取URL链接与参数;S5、对步骤S1-S4获取的URL链接与参数进行Hash去重,获取总的URL链接与参数。步骤S1包括步骤:S11,获取页面;S12,分析所述页面的GET或POST请求;S13,重复步骤S11-S12,直至整个WEB系统中的链接与参数获取完毕。步骤S2包括步骤:S21,通过交换机以及路由器上的镜像端口分析镜像流量;S22,将访问WEB服务器的请求通过拆解数据包进行分析;S23,整理全部WEB服务器的请求URL地址和参数。步骤S21包括步骤:S211,对路由器的流量数据包进行解析,若传输层显示为TCP,端口为80/8080/443,则解析数据包;否则不进行拆包。步骤S22包括步骤:S221,按照标准网络数据包组成格式,通过解析各个协议层的包头,分别依次拆除网络层包头、传输层包头;S222,确认传输层是否以HTTP协议方式进行数据发送、接收。步骤S23包括步骤:S231,依次从每个解析出的数据包中获取WEB服务器URL地址;S232,将新的URL地址库与旧的URL地址库进行比对,并将新的URL地址库中存在且旧的URL地址库中不存在的数据添加至URL数据库。步骤S3包括步骤:S31,分析所述WAF通过的流量,识别WEB请求,并记录通过指定站点的WEB请求;S32,将获取的URL地址分类、记录并存储。步骤S4包括步骤:S41,将WEB容器中用户发送的请求信息记录到Accesslog中。步骤S41中所述的请求信息包括:用户的请求方式GET/POST,URL地址与参数。基于B/S架构系统的多维度收集URL链接及参数的系统,包括:爬虫监测模块,用于通过爬虫方式获取URL链接与参数;网络设备监测模块,用于通过网络设备获取URL链接与参数;WAF监测模块,用于通过WAF获取URL链接与参数;Accesslog监测模块,用于通过Accesslog获取URL链接与参数;去重模块,用于对所述爬虫监测模块、网络设备监测模块、WAF监测模块以及Accesslog监测模块获取的URL链接与参数进行Hash去重,获取总的URL链接与参数。基于B/S架构系统的多维度收集URL链接及参数的设备,包括存储有计算机程序的计算机可读介质,所述程序被运行用于执行:S1、通过爬虫方式获取URL链接与参数;S2、通过网络设备获取URL链接与参数;S3、通过WAF获取URL链接与参数;S4、通过Accesslog获取URL链接与参数;S5、对步骤S1-S4获取的URL链接与参数进行Hash去重,获取总的URL链接与参数。本专利技术的有益效果是:从四个维度获取WEB系统的URL接口和参数:爬虫、网络设备、WAF、Accesslog。综合这4个维度获取到的信息,进行URL去重和静态资源去除,能有效、更全面的获取到WEB系统中的URL链接和参数,从而进行更加全面的进行安全测试、安全评估。附图说明图1示出了根据本申请的流程图。具体实施方式为了更好的了解本专利技术的技术方案,下面结合附图1对本专利技术作进一步说明。如图1所示,基于B/S架构系统的多维度收集URL链接及参数的方法,包括步骤:S1、通过爬虫方式获取URL链接与参数。包括步骤:S11,获取页面;S12,分析所述页面的GET或POST请求;S13,重复步骤S11-S12,直至整个WEB系统中的链接与参数获取完毕。每个所述页面都是<html>双标签包含的整个内容,<body>区域是页面显示部分,<body>中包含各种form表单、<a>链接标签、rc、href链接属性。步骤S12中分析的过程为:<body>中的form、a、src、href链接的资源,页面在加载时,会分析资源的访问路径,例如<ahref=”index.jsp?username=admin”>,此时就可以分析到a标签资源地址是index.jsp?username=admin。分析完后获取到新的访问资源,类似于上面的index.jsp?username=admin,获取到这个页面后(这个页面又包含一个完整的html节点文档,body节点中也有各种form、a、src、href链接资源),又获取到新的URL。S2、通过网络设备获取URL链接与参数。包括步骤:S21,通过交换机以及路由器上的镜像端口分析镜像流量。此步骤中的分析是指:通过软件进行分析,或定制化的硬件行分析。由于在网络上的数据包遵循TCP/IP协议格式,从下而上包含MAC封装、IP封装、TCP/UDP封装。应用层若是HTTP协议,则可获取到URL。类似于GET/index.jsp?username=adminHTTP/1.1Host:www.baidu.com。步骤S21包括步骤:S211,对路由器的流量(tcp、udp、icmp、vpn、ftp、arp、http、https等流量)数据包进行解析,若传输层显示为TCP,应用层包头端为80/8080/443端口,则解析数据包;否则不进行拆包。此步骤两处的解析相同,解析方式均是先查看以太网首部,再查看IP首部,再查看TCP首部,最后获取到应用层数据。附件图片是数据包封装格式、数据包样本。路由器获取到数据包后,先解析。S22,将访问WEB服务器的请求通过拆解数据包进行分析;按照标准网络数据包组成格式,通过解析各个协议层的包头,分别依次拆除网络层包头、传输层包头;确认传输层是否以HTTP协议方式进行数据发送、接收。拆解数据包,指的是遵照目前都是TCP/IP协议族标准网络数据包组成格式,通过解析各个协议层(最底层是MAC层,MAC解析后再解析IP层包头,再解析TCP层,再解析HTTP层。)的包头,分别依次拆解网络层包头、传输层包头,再确认传输层是否以HTTP协议方式进行数据发送、接收。判断是否以HTTP协议方式进行数据发送、接收的标准为:传输层端口号若是80、443、8080、7001、9080、9090,则判断应用层是HTTP协议内容。HTTP协议存在两种数据包:request、reply,存在两个客体:浏览器、服务器。request报文是浏览器发送给服务器,reply报文是服务器本文档来自技高网...

【技术保护点】
1.基于B/S架构系统的多维度收集URL链接及参数的方法,其特征在于,包括步骤:S1、通过爬虫方式获取URL链接与参数;S2、通过网络设备获取URL链接与参数;S3、通过WAF获取URL链接与参数;S4、通过Access log获取URL链接与参数;S5、对步骤S1‑S4获取的URL链接与参数进行Hash去重,获取总的URL链接与参数。

【技术特征摘要】
1.基于B/S架构系统的多维度收集URL链接及参数的方法,其特征在于,包括步骤:S1、通过爬虫方式获取URL链接与参数;S2、通过网络设备获取URL链接与参数;S3、通过WAF获取URL链接与参数;S4、通过Accesslog获取URL链接与参数;S5、对步骤S1-S4获取的URL链接与参数进行Hash去重,获取总的URL链接与参数。2.根据权利要求1所述的基于B/S架构系统的多维度收集URL链接及参数的方法,其特征在于,步骤S1包括步骤:S11,获取页面;S12,分析所述页面的GET或POST请求;S13,重复步骤S11-S12,直至整个WEB系统中的链接与参数获取完毕。3.根据权利要求1所述的基于B/S架构系统的多维度收集URL链接及参数的方法,其特征在于,步骤S2包括步骤:S21,通过交换机以及路由器上的镜像端口分析镜像流量;S22,将访问WEB服务器的请求通过拆解数据包进行分析;S23,整理全部WEB服务器的请求URL地址和参数。4.根据权利要求3所述的基于B/S架构系统的多维度收集URL链接及参数的方法,其特征在于,步骤S21包括步骤:S211,对路由器的流量数据包进行解析,若传输层显示为TCP,端口为80/8080/443,则解析数据包;否则不进行拆包。5.根据权利要求3所述的基于B/S架构系统的多维度收集URL链接及参数的方法,其特征在于,步骤S22包括步骤:S221,按照标准网络数据包组成格式,通过解析各个协议层的包头,分别依次拆除网络层包头、传输层包头;S222,确认传输层是否以HTTP协议方式进行数据发送、接收。6.根据权利要求3所述的基于B/S架构系统的多维度收集URL链接及参数的方法,其特征在于,步骤S23包括步骤:S231,依次从每个解析出的数据包中获取WEB服务器URL地址;S232,将新的URL地址...

【专利技术属性】
技术研发人员:王涛汤立为
申请(专利权)人:顺丰科技有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1