当前位置: 首页 > 专利查询>武汉大学国网上海市电力公司国家电网有限公司专利>正文

一种实现网站漏洞快速扫描的方法、装置、介质及设备制造方法及图纸

技术编号：37423095 阅读：11 留言：0更新日期：2023-04-30 09:45

本发明专利技术公开了一种实现网站漏洞快速扫描的方法、装置及介质及设备。其中，方法包括：在目标网站存在漏洞的情况下，爬取目标网站的URL，确定目标网站的URL集合，并根据URL集合构造URL项集集合；在URL项集集合中项集数量达到预先设置的增量阈值的情况下，增量挖掘URL项集中的闭频繁项集，并将闭频繁项集转化为多个URL模式；将目标网站的URL集合中的URL与URL模式进行匹配，确定目标网站的URL集合的页面聚簇信息；多次迭代上述操作，在URL队列变为空的情况下，从页面聚簇信息的每个页面中提取预定数量的URL对目标网站进行漏洞扫描，确定扫描报告。报告。报告。

全部详细技术资料下载

【技术实现步骤摘要】
一种实现网站漏洞快速扫描的方法、装置、介质及设备

[0001]本专利技术涉及Web漏洞扫描
，并且更具体地，涉及一种实现网站漏洞快速扫描的方法、装置及介质及设备。

技术介绍

[0002]由于网站中的网页数量膨胀式增长，传统的Web安全漏洞扫描手段在面对规模较大网站时显得愈加乏力，进行漏洞扫描所需要的时间也变得越来越长。因此，如何在保证漏洞扫描覆盖率大体不降的情况下，提升Web安全漏洞扫描的效率成为了一个关键的问题。目前，针对Web安全漏洞扫描时间过长的问题，加强信息过滤、设置扫描最大时间和设置同目录最大扫描量是三个较为常见的解决手段。设置扫描最大时间和设置同目录最大扫描量虽然在一定程度上缓解了扫描时间过长的问题，但会使漏洞扫描跳过设定阈值外的页面，造成扫描覆盖率下降，并没有从本质上解决Web安全漏洞扫描效率提升的问题。随着RestfulAPI[3]的盛行，网站中通常存在着大量由同一个http请求模板生成的URL，这些URL在后端中由同一个服务入口进行处理，对这些URL对应的页面一一进行扫描工作无疑大幅降低了漏洞扫描的效率。由此可见，传统的Web安全漏洞扫描方法已难以满足现阶段的Web安全防御工作的需求。在面对规模较大的网站时，为了防止Web安全漏洞扫描在信息收集阶段过程中消耗过多的时间，通常会对爬虫的扫描网页的数量、同目录下最大扫描数量、最大扫描时间等进行限制。当一个网站的网页数量越多，爬虫运行时所处在的爬取阶段靠后，爬虫在URL的去重、待爬取队列的管理上耗费的时间成本和空间成本会越大，导致整个爬虫的运行效率变...

【技术保护点】

【技术特征摘要】
1.一种实现网站漏洞快速扫描的方法，其特征在于，包括：在目标网站存在漏洞的情况下，爬取目标网站的URL，确定所述目标网站的URL集合，并根据所述URL集合构造URL项集集合；在所述URL项集集合中项集数量达到预先设置的增量阈值的情况下，增量挖掘所述URL项集中的闭频繁项集，并将闭频繁项集转化为多个URL模式；将所述目标网站的所述URL集合中的URL与所述URL模式进行匹配，确定所述目标网站的所述URL集合的页面聚簇信息；多次迭代上述操作，从所述页面聚簇信息的每个页面中提取预定数量的URL对所述目标网站进行漏洞扫描，确定扫描报告。2.根据权利要求1所述的方法，其特征在于，爬取目标网站的URL，确定所述目标网站的URL集合的操作，包括：确定所述目标网站的初始爬取页面的URL放入URL队列；将所述URL队列中的URL进行出队操作，根据预先训练的页面分类模型判断所述URL是否需要过滤；在所述URL不需要过滤的情况下，根据所述URL进行页面爬取，确定次级URL，并根据所述分类模型判断所述次级URL是否进入所述URL队列；多次重复上述操作，在所述URL队列变为空的情况下，确定所述URL集合。3.根据权利要求2所述的方法，其特征在于，根据预先训练的分类模型判断所述URL是否需要过滤的操作，包括：根据所述URL的日志数据以及页面聚簇信息提取所述URL的特征向量；将所述特征向量输入至所述页面分类模型，得到所述URL对应的页面分类结果，其中分类结果包括冗余页面和非冗余页面；在所述URL的分类结果为冗余页面的情况下，过滤所述URL。4.根据权利要求2所述的方法，其特征在于，还包括：记录爬取所述目标网站的URL过程中的爬虫日志；根据所述页面聚簇信息和所述爬虫日志构造数据集；利用所述数据集更新所述页面分类模型。5.根据权利要求1所述的方法，其特征在于，根据所述URL集合构造URL项集的操作，包括：根据所述目标网站的域名限制信息，过滤掉所述URL集合中不属于该限制域名下的URL；利用BloomFilter数据结构对所述URL集合中的URL进行去重；根据...

【专利技术属性】
技术研发人员：朱朝阳，周亮，王金翔，蔺子卿，张晓娟，李俊娥，朱亚运，缪思薇，刘万大山，王海翔，曹靖怡，胡柏吉，宋小芹，
申请(专利权)人：武汉大学国网上海市电力公司国家电网有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人