网站指纹识别方法、装置、设备以及存储介质制造方法及图纸

技术编号:37671639 阅读:10 留言:0更新日期:2023-05-26 04:33
本申请公开了一种网站指纹识别方法、装置、设备以及存储介质,属于计算机网络与网络空间安全领域,网站指纹识别方法包括:获取待识别网站的目标数据包序列;筛选出目标数据包序列中具有因果关系的任意两个数据包,获得因果关联数据包对;基于因果关联数据包对,将目标数据包序列中的数据包关联成链,得到至少一条子流序列;将子流序列输入指纹识别模型,获得指纹识别模型输出的网站指纹识别结果。本申请通过因果关联数据包对,将目标数据包序列中的数据包关联成链,得到子流序列,即利用待识别网站访问过程中的相关行为特征,充分利用了因果关联数据包对混合流的流量进行切割,从而可以提取到更多的有效特征,进而提高网站指纹识别的准确率。识别的准确率。识别的准确率。

【技术实现步骤摘要】
网站指纹识别方法、装置、设备以及存储介质


[0001]本申请涉及计算机网络与网络空间安全领域,尤其涉及一种网站指纹识别方法、装置、设备以及存储介质。

技术介绍

[0002]相关技术中,为防止用户的个人信息被暴露于网络中,通过更新加密通信协议和开发自由开元的方式防止用户个人信息泄露,如加密代理、隧道技术。采用上述方式可以在网络传输层面阻止信息泄露,载荷分析和域名分析,防止通信关系被暴露。
[0003]但是,网站流量是由多条子流组合而成的一条混合流,并且在经过加密代理和隧道技术后,使得网站流量混合成为一条流。因此,在对加密流量进行分析时,由于无法访问明文有效负载和基于五元组进行流量切割分析流量,因此使得采用传统的加密流量检测方法无法满足检测需求,且因为获得的统计流量特征较少,难以提取有效的特征,使得网站指纹识别准确率较低。

技术实现思路

[0004]本申请的主要目的在于提供一种网站指纹识别方法、装置、设备以及存储介质,旨在解决网站指纹识别准确率低的技术问题。
[0005]为实现上述目的,本申请提供一种网站指纹识别方法,包括:获取待识别网站的目标数据包序列;筛选出所述目标数据包序列中具有因果关系的任意两个数据包,获得因果关联数据包对;基于所述因果关联数据包对,将所述目标数据包序列中的数据包关联成链,得到至少一条子流序列;将所述子流序列输入指纹识别模型,获得所述指纹识别模型输出的网站指纹识别结果。
[0006]可选地,所述筛选出所述目标数据包序列中具有因果关系的任意两个数据包,获得因果关联数据包对,包括:筛选出所述目标数据包序列中任意两个所述数据包;确定所述任意两个所述数据包的平均因果效应计算结果;将所述平均因果效应计算结果大于第三预设阈值的任意两个所述数据包,确定为所述因果关联数据包对。
[0007]可选地,所述基于所述因果关联数据包对,将所述目标数据包序列中的数据包关联成链,得到至少一条子流序列,包括:从所述目标数据包序列中确定出当前数据包与待成链数据包;所述待成链数据包位于所述当前数据包之后;若所述当前数据包与所述待成链数据包满足预设成链规则,则将所述待成链数据
包连接至所述当前数据包之后,得到数据包链;将所述待成链数据包作为所述当前数据包,并从所述目标数据包序列的剩余数据包中确定出新的待成链数据包;返回执行所述若所述当前数据包与所述待成链数据包满足预设成链规则,则将所述待成链数据包连接至所述当前数据包之后,得到数据包链,直至所述目标数据包序列中不存在所述剩余数据包,获得所述子流序列。
[0008]可选地,所述若所述当前数据包与所述待成链数据包满足预设成链规则,则将所述待成链数据包连接至所述当前数据包之后,得到数据包链,包括:若所述当前数据包的第一序号小于所述待成链数据包的第二序号,且所述第一序号和所述第二序号之间的差值小于预设差值,则检测是否存在包括所述当前数据包与所述待成链数据包的所述因果关联数据包对;若存在包括所述当前数据包与所述待成链数据包的所述因果关联数据包对,则将所述当前数据包与所述待成链数据包关联成链,得到所述数据包链。
[0009]可选地,所述将所述子流序列输入指纹识别模型,获得所述指纹识别模型输出的网站指纹识别结果,包括:对所述子流序列进行预设处理,获得子流序列向量;在所述子流序列向量中添加标签向量以及位置向量,获得嵌入向量;将所述嵌入向量输入所述指纹识别模型,获得所述指纹识别模型输出的所述网站指纹识别结果。
[0010]可选地,所述获取待识别网站的目标数据包序列包括:获取所述待识别网站的原始数据包序列;基于所述数据包的基本信息,对所述原始数据包序列进行过滤,获得所述目标数据包序列;其中,所述基本信息包括所述数据包的大小和所述数据包的方向。
[0011]可选地,所述基于所述数据包的基本信息,对所述原始数据包序列进行过滤,获得所述目标数据包序列,包括:确定所述原始数据包序列中各个所述数据包的支持度;其中,所述支持度为所述数据包在所述待识别网站中的所有数据包序列中出现的频率;确定所述原始数据包序列中各个所述数据包的置信度;其中,所述置信度为包含所述数据包的数据包序列在所述待识别网站中的所有数据包序列中的百分比;将所述原始数据包序列中,所述支持度大于第一预设阈值且所述置信度小于第二预设阈值的数据包过滤掉,获得所述目标数据包序列。
[0012]第二方面,本申请提供一种网站指纹识别装置,包括:获取模块,用于获取待识别网站的目标数据包序列;筛选模块,用于筛选出所述目标数据包序列中具有因果关系的任意两个数据包,获得因果关联数据包对;关联模块,用于基于所述因果关联数据包对,将所述目标数据包序列中的数据包关联成链,得到至少一条子流序列;输出模块,用于将所述子流序列输入指纹识别模型,获得所述指纹识别模型输出的网站指纹识别结果。
[0013]第三方面,本申请提供一种网站指纹识别设备,包括存储器、处理器以及存储在存储器上并可在处理器上运行的网站指纹识别程序,网站指纹识别程序配置为实现如上述网站指纹识别方法的步骤。
[0014]第四方面,本申请提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理时执行本申请任意实施例的网站指纹识别方法。
[0015]本申请实施例提出的一种网站指纹识别方法,相较于现有技术中,直接使用传统的加密流量检测方法对流量进行检测,本申请通过因果关联数据包对,将目标数据包序列中的数据包关联成链,得到子流序列,也即是利用待识别网站访问过程中的相关行为特征,充分利用了因果关联数据包对混合流的流量进行切割,从而可以提取到更多的有效特征,进而提高网站指纹识别的准确率。
附图说明
[0016]图1为本申请网站指纹识别方法实施例的硬件结构示意图;图2为本申请网站指纹识别方法第一实施例的流程示意图;图3为本申请网站指纹识别模型的结构示意图;图4为本申请网站指纹识别模型中编码器的结构示意图;图5为本申请全连接的多层感知器(MLP)网络模型架构示意图;图6为本申请网站指纹识别方法第二实施例的流程示意图;图7为本申请网站指纹识别方法的功能模块示意图。
[0017]本申请目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
[0018]应当理解,此处所描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
[0019]由于现有技术,网站流量是由多条子流组合而成的一条混合流,并且在经过加密代理和隧道技术后,使得网站流量混合成为一条流。因此,在对加密流量进行分析时,由于无法访问明文有效负载和基于五元组进行流量切割分析流量,使得采用传统的加密流量检测方法无法满足检测需求,且因为获得的统计流量特征较少,难以提取有效的特征,使得网站指纹识别准确率较低。
[0020]本申请提供一种解决方案,相较于现有技术中,直接使用传统的加密流量检测方法对流量进行检测,本申请通过因果关联数据包对,将目标数据包序列中的数据包关联成链,得到子流序列,也即是利用待识别网站访问过程中的相本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种网站指纹识别方法,其特征在于,所述方法包括:获取待识别网站的目标数据包序列;筛选出所述目标数据包序列中具有因果关系的任意两个数据包,获得因果关联数据包对;基于所述因果关联数据包对,将所述目标数据包序列中的数据包关联成链,得到至少一条子流序列;将所述子流序列输入指纹识别模型,获得所述指纹识别模型输出的网站指纹识别结果。2.如权利要求1所述的网站指纹识别方法,其特征在于,所述筛选出所述目标数据包序列中具有因果关系的任意两个数据包,获得因果关联数据包对,包括:筛选出所述目标数据包序列中任意两个所述数据包;确定所述任意两个所述数据包的平均因果效应计算结果;将所述平均因果效应计算结果大于第三预设阈值的任意两个所述数据包,确定为所述因果关联数据包对。3.如权利要求1所述的网站指纹识别方法,其特征在于,所述基于所述因果关联数据包对,将所述目标数据包序列中的数据包关联成链,得到至少一条子流序列,包括:从所述目标数据包序列中确定出当前数据包与待成链数据包;所述待成链数据包位于所述当前数据包之后;若所述当前数据包与所述待成链数据包满足预设成链规则,则将所述待成链数据包连接至所述当前数据包之后,得到数据包链;将所述待成链数据包作为所述当前数据包,并从所述目标数据包序列的剩余数据包中确定出新的待成链数据包;返回执行所述若所述当前数据包与所述待成链数据包满足预设成链规则,则将所述待成链数据包连接至所述当前数据包之后,得到数据包链,直至所述目标数据包序列中不存在所述剩余数据包,获得所述子流序列。4.根据权利要求3所述的网站指纹识别方法,其特征在于,所述若所述当前数据包与所述待成链数据包满足预设成链规则,则将所述待成链数据包连接至所述当前数据包之后,得到数据包链,包括:若所述当前数据包的第一序号小于所述待成链数据包的第二序号,且所述第一序号和所述第二序号之间的差值小于预设差值,则检测是否存在包括所述当前数据包与所述待成链数据包的所述因果关联数据包对;若存在包括所述当前数据包与所述待成链数据包的所述因果关联数据包对,则将所述当前数据包与所述待成链数据包关联成链,得到所述数据包链。5.根据权利要求1所述的网站指纹识别方法,其特征在于,所...

【专利技术属性】
技术研发人员:施钱宝金文林黄超明彭徽
申请(专利权)人:合肥综合性国家科学中心人工智能研究院安徽省人工智能实验室
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1