一种网页服务器指纹识别方法、装置、设备和存储介质制造方法及图纸

技术编号:38015448 阅读:10 留言:0更新日期:2023-06-30 10:40
本发明专利技术提供了一种网页服务器指纹识别方法、装置、设备和存储介质,所述方法包括:收集目标网页服务器针对不同HTTP请求包返回的响应信息,并提取响应信息的关键特征;利用KNN算法基于关键特征识别目标网页服务器的类别,得到目标网页服务器指纹的识别结果。本发明专利技术能够降低网页服务器指纹特征的冗余性和人工成本,增强了网页服务器指纹特征的维护性,降低网页服务器指纹匹配时的计算复杂程度以及在网页服务器指纹识别匹配阶段所用的时间,提高网页服务器指纹匹配的效率。服务器指纹匹配的效率。服务器指纹匹配的效率。

【技术实现步骤摘要】
一种网页服务器指纹识别方法、装置、设备和存储介质


[0001]本专利技术涉及网页服务器指纹识别
,具体涉及一种网页服务器指纹识别方法、装置设备和存储介质。

技术介绍

[0002]Web Server中文名称叫网页服务器或Web服务器,它的主要功能是提供网上信息浏览服务。网页服务器指纹识别的目的是识别网站背后依赖的网页服务器,进而对网站可能隐藏的漏洞风险及时进行预防和修复。网页服务器指纹识别的过程可以分为指纹的采集和分类两个子过程。在收集指纹时,必须捕获指纹中显示的对象的所有关键特征,否则可能会出现指纹匹配不正确的情况,因为细微的差异很容易被误认,而捕获更多细节和特征有助于网页服务器分类。传统网页服务器指纹识别方法严重依赖人工构造的规则库进行指纹规则匹配,即未知指纹与存储的已知指纹数据库的比较,选择与之最匹配的指纹作为网站的网页服务器指纹。当指纹库存在大量规则时由于指纹匹配的时间复杂随指纹规则数量线性增长,分类时间也会不断增加,反之,由于相关指纹规则不存在可能导致大量的误报。因此传统网页服务器指纹识别存在严重依赖人工指纹库,导致整理和维护指纹规则的成本太大以及网页服务器指纹识别的时间线性增加的问题。

技术实现思路

[0003]鉴于上述问题,本专利技术实施例提供一种网页服务器指纹识别方法、装置设备和存储介质,解决现有的技术问题。
[0004]为解决上述技术问题,本专利技术提供以下技术方案:
[0005]第一方面,本专利技术提供一种网页服务器指纹识别方法,所述方法包括:
[0006]收集目标网页服务器针对不同HTTP请求包返回的响应信息,并提取响应信息的关键特征;
[0007]利用KNN算法基于关键特征识别目标网页服务器的类别,得到目标网页服务器指纹的识别结果。
[0008]一实施例中,所述收集目标网页服务器针对不同HTTP请求包返回的响应信息,并提取响应信息的关键特征包括:
[0009]构建不同的HTTP请求包;
[0010]收集目标网页服务器对不同的HTTP请求包返回的响应头和响应体信息;
[0011]提取响应头和响应体信息的关键特征并对关键特征量化,得到量化特征;
[0012]利用自编码器对量化特征进行表征学习,得到关键特征。
[0013]一实施例中,所述不同的HTTP请求包的构建方法包括:
[0014]通过HEAD/Http/1.0发送基本的Http请求;
[0015]通过DELETE/Http/1.0发送不被允许的Delete请求;
[0016]通过GET/Http/3.0发送非法版本的Http协议请求;
[0017]通过GET/JUNK/1.0发送不正确规格的Http协议请求;
[0018]通过HEAD/Http/1.0发送404请求。
[0019]一实施例中,所述提取响应头和响应体信息的关键特征并对关键特征量化,得到量化特征包括:
[0020]统计不同HTTP请求包目标网页服务器返回的响应体信息中关键词的比例,选择与网页服务器类别相关的关键词,得到响应体特征;
[0021]统计不同HTTP请求包目标网页服务器返回的响应头信息包含的字段,排除与网页服务器类别不相关的字段,得到响应头特征;
[0022]将响应体特征与响应头特征拼接,得到字段特征;
[0023]统计响应信息中响应体特征、响应头特征和字段特征的出现频次作为特征的权重值,得到量化特征。
[0024]一实施例中,所述利用自编码器对量化特征进行表征学习,得到关键特征包括:
[0025]利用编码器对量化特征进行表征学习,获取压缩后的潜在空间指纹表征向量;
[0026]利用解码器重构来自编码器的潜在空间指纹表征向量,得到关键特征。
[0027]一实施例中,所述编码器和解码器均采用六层的前馈神经网络。
[0028]一实施例中,所述利用KNN算法基于关键特征识别目标网页服务器的类别,得到目标网页服务器指纹的识别结果包括:
[0029]统计关键特征在已知网页服务器邻近特征空间范围内网页服务器类别的数量;
[0030]选择网页服务器类别数量最多的类别作为目标网页服务器的类别,完成目标网页服务指纹识别。
[0031]第二方面,本专利技术提供一种网页服务器指纹识别装置,所述装置包括:
[0032]特征提取模块:用于收集目标网页服务器针对不同HTTP请求包返回的响应信息,并提取响应信息的关键特征;
[0033]指纹识别模块:用于利用KNN算法基于关键特征识别目标网页服务器的类别,得到目标网页服务器指纹的识别结果。
[0034]一实施例中,特征提取模块包括:
[0035]构建不同的HTTP请求包;
[0036]收集目标网页服务器对不同的HTTP请求包返回的响应头和响应体信息;
[0037]提取响应头和响应体信息的关键特征并对关键特征量化,得到量化特征;
[0038]利用自编码器对量化特征进行表征学习,得到关键特征。
[0039]一实施例中,所述特征提取模块中不同的HTTP请求包的构建方法包括:
[0040]通过HEAD/Http/1.0发送基本的Http请求;
[0041]通过DELETE/Http/1.0发送不被允许的Delete请求;
[0042]通过GET/Http/3.0发送非法版本的Http协议请求;
[0043]通过GET/JUNK/1.0发送不正确规格的Http协议请求;
[0044]通过HEAD/Http/1.0发送404请求。
[0045]一实施例中,所述特征提取模块中提取响应头和响应体信息的关键特征并对关键特征量化,得到量化特征包括:
[0046]统计不同HTTP请求包目标网页服务器返回的响应体信息中关键词的比例,选择与
网页服务器类别相关的关键词,得到响应体特征;
[0047]统计不同HTTP请求包目标网页服务器返回的响应头信息包含的字段,排除与网页服务器类别不相关的字段,得到响应头特征;
[0048]将响应体特征与响应头特征拼接,得到字段特征;
[0049]统计响应信息中响应体特征、响应头特征和字段特征的出现频次作为特征的权重值,得到量化特征。
[0050]一实施例中,所述特征提取模块中利用自编码器对量化特征进行表征学习,得到关键特征包括:
[0051]利用编码器对量化特征进行表征学习,获取压缩后的潜在空间指纹表征向量;
[0052]利用解码器重构来自编码器的潜在空间指纹表征向量,得到关键特征。
[0053]一实施例中,所述特征提取模块中编码器和解码器均采用六层的前馈神经网络。
[0054]一实施例中,所述指纹识别模块包括:
[0055]统计关键特征在已知网页服务器邻近特征空间范围内网页服务器类别的数量;
[0056]选择网页服务器类别数量最多的类别作为目标本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种网页服务器指纹识别方法,其特征在于,所述方法包括:收集目标网页服务器针对不同HTTP请求包返回的响应信息,并提取响应信息的关键特征;利用KNN算法基于关键特征识别目标网页服务器的类别,得到目标网页服务器指纹的识别结果。2.如权利要求1所述的一种网页服务器指纹识别方法,其特征在于,所述收集目标网页服务器针对不同HTTP请求包返回的响应信息,并提取响应信息的关键特征包括:构建不同的HTTP请求包;收集目标网页服务器对不同的HTTP请求包返回的响应头和响应体信息;提取响应头和响应体信息的关键特征并对关键特征量化,得到量化特征;利用自编码器对量化特征进行表征学习,得到关键特征。3.如权利要求2所述的一种网页服务器指纹识别方法,其特征在于,所述不同的HTTP请求包的构建方法包括:通过HEAD/Http/1.0发送基本的Http请求;通过DELETE/Http/1.0发送不被允许的Delete请求;通过GET/Http/3.0发送非法版本的Http协议请求;通过GET/JUNK/1.0发送不正确规格的Http协议请求;通过HEAD/Http/1.0发送404请求。4.如权利要求2所述的一种网页服务器指纹识别方法,其特征在于,所述提取响应头和响应体信息的关键特征并对关键特征量化,得到量化特征包括:统计不同HTTP请求包目标网页服务器返回的响应体信息中关键词的比例,选择与网页服务器类别相关的关键词,得到响应体特征;统计不同HTTP请求包目标网页服务器返回的响应头信息包含的字段,排除与网页服务器类别不相关的字段,得到响应头特征;将响应体特征与响应头特征...

【专利技术属性】
技术研发人员:王广清方铁城刘颖申彦龙陈宇翀白强李昕刘嫣
申请(专利权)人:北京市燃气集团有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1