【技术实现步骤摘要】
一种基于深度学习的加密网络流量识别及分类方法
[0001]本专利技术涉及计算机网络安全领域,更具体地,涉及一种基于深度学习的加密网络流量识别及分类方法。
技术介绍
[0002]网络流量分类是指将相似或相关的流量数据归为同一类别,准确实时的网络流量分类对网络管理、安全监控和入侵检测都是至关重要。但随着网络技术的不断发展和网络规模的迅速扩大,人们对隐私保护的需求增加,VPN、Tor等具有加密与匿名性的网络技术被用于网络通信的隐私保护。这些技术给普通用户带来便利的同时,也被许多非法分子利用,在匿名网络中利用流量加密技术进行传播恶意软件、分发违法内容和入侵网络主机系统等违法犯罪行为。现今,传统的网络流量分类方法无法应对现今的网络环境,给网络监管带来巨大困难。
[0003]传统的网络流量分类方案可分为基于端口和基于有效载荷两种方法,这两类方法均有较大局限性。端口隐藏和动态端口技术的广泛使用,使得基于端口的分类方法已趋于无效;同时,现今大部分流量数据都以加密形式传输,使得基于有效载荷的方法无法获取加密流量中的特征字串,并且其需要 ...
【技术保护点】
【技术特征摘要】
1.一种基于深度学习的加密网络流量识别方法,其特征在于,包括以下步骤:S1:获取加密网络流量数据并进行预处理得到若干单独的会话;S2:对于预处理后的流量数据进行统计特征的选择;S3:对预处理后的流量数据进行有效载荷截取;S4:将统计特征和有效载荷进行特征整合并进行特征标准化;S5:利用整合后的特征对识别模型进行训练,得到训练好的识别模型;S6:利用训练好的识别模型对加密网络流量进行识别。2.根据权利要求1所述的一种基于深度学习的加密网络流量识别方法,其特征在于,步骤S1所述的获取加密网络流量数据并进行预处理具体步骤为:利用网络抓包工具收集网络通信工具通信的加密网络流量;对格式为pcap的原始流量文件进行清洗;将清洗后的原始流量切分成多个单独的会话。3.根据权利要求1所述的一种基于深度学习的加密网络流量识别方法,其特征在于,步骤S2所述的对于预处理后的流量数据进行统计特征的选择具体步骤为:利用网络流量特征提取工具提取每个会话的统计特征;删除Flow ID、Src IP、Dst IP、Timestamp这4个与分类无关的特征,保留其余网络流量统计特征作为识别模型训练的输入之一。4.根据权利要求1所述的一种基于深度学习的加密网络流量识别方法,其特征在于,步骤S3所述的对预处理后的流量数据进行有效载荷截取具体步骤为:截取每条切分后的流量会话中密文形式的有效载荷前945个字节,若不足945个字节,则使用0进行填充补齐至945,将其作为模型训练的输入之一。5.根据权利要求1所述的一种基于深度学习的加密网络流量识别方法,其特征在于,步骤S4所述将统计特征和有效载荷进行特征整合并进行特征标准化具体步骤为:将步骤S2选择的统计特征和步骤S3得到的有效载荷字节整合成固定长度的特征向量;使用min
‑
max标准化方法将每个特征缩放至0
‑
1之间,计算方法为1之间,计算方法为其中x
*
为标准化后的特征,x为输入特征,min和max分别对应输入特征的最小值和最大值。6.根据权利要求1所述的一种基于深度学习的加密网络流量识别方法,其特征在于,S5所述的利用整合后的特征对识别模型进行训练,得到训练好的识别模型具体过程为:将整合后的特征转换成预设的格式输入Mogrifier LSTM中进行全局时序特征提取;将Mogrifier LSTM输出的特征矩阵输入至SKCNN网络进行空间局部特征提取,得到空间局部特征的特征图;利用全连接分类对得到的特征进行分类,经由...
【专利技术属性】
技术研发人员:凌捷,康健豪,罗玉,黄慧武,区奕宁,区旸,刘艺彬,
申请(专利权)人:中通服建设有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。