基于特征增强的VPN流量WEB指纹识别方法技术

技术编号:26072437 阅读:75 留言:0更新日期:2020-10-28 16:46
本发明专利技术揭示了一种基于特征增强的VPN流量WEB指纹识别方法,包括如下步骤:S1、抓取SSL/TLS隧道内的流量信息并加以保存;S2、对所抓取的流量信息进行预处理,设置过滤规则、删除不符合过滤规则的流量信息;S3、根据流量密度完成激增周期特征提取;S4、利用LightGBM算法、结合经过预处理的流量信息及所提取的激增周期特征,建立并训练识别模型;S5、将所得到的、经过训练的识别模型应用于WEB指纹识别过程中,最终完成WEB指纹识别。本发明专利技术通过使用新的分类特征流量激增周期,在特征增强的基础上有效地提高了指纹识别对加密流量的识别性能。

【技术实现步骤摘要】
基于特征增强的VPN流量WEB指纹识别方法
本专利技术为一种识别方法,具体涉及一种适用于动态网络页面识别的基于特征增强的VPN流量WEB指纹识别方法,属于网络安全

技术介绍
近年来,随着互联网技术的不断发展,网络规模以及网络用户量的不断扩大、网络流量的多样性也随之不断增加。据中国互联网协会发布的《中国互联网发展报告2019》显示,截至2019年6月,全球网民的总数突破50亿,互联网普及率超过50%。在网民规模和网络普及率逐年递增、网络用户对于安全隐私等问题的关注度不断提升的大背景下,整个网络环境对于网络安全、数据保护方面的需求也越来越强烈。为了保护用户的隐私、满足网络安全的需求,通信过程中需要对网络流量进行加密。同时,再加上现代企事业单位业务的多样化发展和单位本身在网络方面的各项需求也在不断增长,单位总部与分部之间、单位内人员与出差人员之间的联系日趋紧密。在上述需求的催生下,相关技术开始陆续出现并逐步发展。VPN(VirtualPrivateNetwork,虚拟专用网络)技术可以在公共互联网建立一个安全的、专用的网络以本文档来自技高网...

【技术保护点】
1.一种基于特征增强的VPN流量WEB指纹识别方法,其特征在于,包括如下步骤:/nS1、抓取SSL / TLS隧道内的流量信息并加以保存;/nS2、对所抓取的流量信息进行预处理,设置过滤规则、删除不符合过滤规则的流量信息;/nS3、根据流量密度完成激增周期特征提取;/nS4、利用LightGBM算法、结合经过预处理的流量信息及所提取的激增周期特征,建立并训练识别模型;/nS5、将所得到的、经过训练的识别模型应用于WEB指纹识别过程中,最终完成WEB指纹识别。/n

【技术特征摘要】
1.一种基于特征增强的VPN流量WEB指纹识别方法,其特征在于,包括如下步骤:
S1、抓取SSL/TLS隧道内的流量信息并加以保存;
S2、对所抓取的流量信息进行预处理,设置过滤规则、删除不符合过滤规则的流量信息;
S3、根据流量密度完成激增周期特征提取;
S4、利用LightGBM算法、结合经过预处理的流量信息及所提取的激增周期特征,建立并训练识别模型;
S5、将所得到的、经过训练的识别模型应用于WEB指纹识别过程中,最终完成WEB指纹识别。


2.根据权利要求1所述的基于特征增强的VPN流量WEB指纹识别方法,其特征在于,S1具体包括如下步骤:使用流量抓包软件WireShark在出口路由器上抓取SSL/TLS隧道内的流量信息,将所抓取的流量信息以pcap格式逐一保存为数据包,随后将全部数据包进行汇总、得到原始数据集。


3.根据权利要求2所述的基于特征增强的VPN流量WEB指纹识别方法,其特征在于,S2具体包括如下步骤:使用WireShark对所述原始数据集内的数据包进行处理,设置过滤规则、按照所述过滤规则对不符合条件的数据包进行删除、得到经过预处理后的原始数据集。


4.根据权利要求3所述的基于特征增强的VPN流量WEB指纹识别方法,其特征在于,所述过滤规则包括:删除所述原始数据集内的非TCP数据包及纯ACK数据包。


5.根据权利要求3所述的基于特征增强的VPN流量WEB指纹识别方法,其特征在于,S3具体包括如下步骤:
S31、将所述原始数据集内的数据包转换为时间戳序列,所述时间戳序列内包含若干成对数据,所述成对数据包括一一对应的时间及数据包大小;
S32、将所述时间戳序列转换为在100ms非重叠窗口中计算出的比特率时间序列...

【专利技术属性】
技术研发人员:陈丹伟王晶
申请(专利权)人:南京邮电大学
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1