【技术实现步骤摘要】
面向类别不平衡下的SSL VPN加密流量识别分类方法
[0001]本专利技术涉及加密流量识别领域,具体地说,是一种面向类别不平衡下的SSLVPN加密流量识别分类方法。
技术介绍
[0002]在远程作业、远程办公成为企业和政府的常态后,SSL VPN因其灵活性、易于维护管理、成本低等优势,在网络流量中的占比日益增加,但这也给了其他人可乘之机。
技术实现思路
[0003]本专利技术针对现有技术中的不足,提供一种面向类别不平衡下的SSL VPN加密流量识别分类方法,采用基于改进的C
‑
SMOTE(Centroid
‑
SMOTE)算法,平衡原始数据集,解决样本数据集不平衡造成的模型欠拟合或过拟合问题。在平衡数据集后进行数据预处理,然后利用基于注意力机制改进的CNN网络流量识别模型,识别分类SSL VPN流量,并用深度可分离卷积替代传统卷积,减少网络参数和计算复杂度。所提方法不仅解决了传统方法在处理不平衡的海量高维数据时存在特征提取困难、检测率低的问题,同时改进后的深度学习模型能提取 ...
【技术保护点】
【技术特征摘要】
1.一种面向类别不平衡下的SSL VPN加密流量识别分类方法,其特征在于,采用基于改进的C
‑
SMOTE算法,平衡原始数据集,在平衡数据集后进行数据预处理,然后利用基于注意力机制改进的CNN网络流量识别模型,识别分类SSL VPN流量,并用深度可分离卷积替代传统卷积,减少网络参数和计算复杂度。2.根据权利要求1所述的面向类别不平衡下的SSL VPN加密流量识别分类方法,其特征在于,该方法具体包括以下步骤:步骤一、获取数据集:捕获网络数据流量,生成会话,通过五元组对网络数据流量过滤分流并获取原始实验数据集;步骤二、平衡数据集:采用基于改进的C
‑
SMOTE算法,对原始实验数据集进行处理;步骤三、数据预处理:读取数据流,截取一定长度的字节,并进行归一化处理,然后将SSL VPN流量实验数据集分为训练集和测试集两部分;步骤四、SSL VPN加密流量识别分类模型:在传统的一维CNN网络流量模型中引入注意力机制,然后用深度可分离卷积替代传统卷积;步骤五、分类SSL VPN加密流量:将经过步骤三处理后的数据集输入到基于注意力机制改进的CNN网络流量识别模型,识别分类SSL VPN加密流量;步骤六、对获得的指标结果分析,并选取参数,优化加密流量识别方法。3.根据权利要求2所述的一种面向类别不平衡下的SSL VPN加密流量识别分类方法,其特征在于,所述步骤一中所述获取数据集的具体内容和方法是:定义TCP流为以握手协议中的SYN标志位开始,并且以FIN标志位或以RST标志位结尾的TCP双向流;定义UDP流为以第一个数据包到达为开始,如果两个数据包到达的时间间隔超过一分钟,则认为数据流结束,新数据流的开始。4.根据权利要求3所述的一种面向类别不平衡下的SSL VPN加密流量识别分类方法,其特征在于,所述步骤二中平衡数据集的具体内容和过程为:计算原始数据集中每类样本的数量,分离原始实验数据集中的多数类和少数类样本,然后设定多数类样本与少数类样本的比值不大于10,计算出所需生成的少数类样本数量;计算少数类样本的质心;以质心为端点,根据插值的方法生成新样本,重复此过程,直到新生成的少数类样本略多于需要的少数类样本;将包含新生成样本的少数类样本设为S,筛选出边界模糊样本并删除,直至符合设定的少数...
【专利技术属性】
技术研发人员:王宇航,姜文刚,郭祥,翟江涛,王晰晨,
申请(专利权)人:江苏科技大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。