一种基于多模块融合的加密流量分类方法技术

技术编号：34763174 阅读：16 留言：0更新日期：2022-08-31 19:06

本发明专利技术公开了一种多模块融合的加密流量分类方法，所述方法包括以下步骤：数据集采集、数据集预处理、自注意力模块设计、残差收缩模块设计、多模块融合的神经网络模型搭建、分类模型训练及评估。本发明专利技术将自注意力机制和深度残差收缩网络与深度学习模型相结合，有效提升了神经网络的特征提取和处理能力，使得部署于网络中的加密流量分类器精度得到提升。本发明专利技术方法可部署于网络出口处对进出网络的流量进行分类，以提高网络管理和安全防护能力。以提高网络管理和安全防护能力。以提高网络管理和安全防护能力。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于多模块融合的加密流量分类方法

[0001]本专利技术涉及加密流量识别领域，具体涉及一种基于多模块融合的加密流量分类方法，所设计方法可部署于网络出口处，用于识别加密流量，为网络安全与管理提供技术支撑。

技术介绍

[0002]现有以僵尸网络、高级持续性威胁(APT)、木马等为主要形式的网络攻击往往采用了相关隐匿技术绕过安全设备入侵系统。因此对加密流量的识别已经成为防御网络攻击的重点。
[0003]近年来随着网络空间安全的受到越来越多的关注，研究人员针对流量分类的研究也逐渐深入。流量分类方法主要分为四类：基于端口的分类方法，基于深度包检测(DPI)的方法，基于传统机器学习和基于深度学习的方法。基于端口的方法对于具有特定端口号的应用程序(例如，具有端口21的FTP流量)的分类性能很好，但是由于随机端口和端口伪装技术的普遍使用，该方法对加密流量分类的精确率低，已不再适用于加密流量的分类。DPI分析整个数据包数据，然后识别其网络协议和应用程序。因为流量负载数据通常用协议加密或封装，包含较少的恒定特征，使得DPI在加密流量分类任务中不再可行。而基于机器学习的方法，通过提取流量数据的行为和统计特征，并用之训练支持向量机(SVM)，随机森林(RF)等传统的机器学习模型，从而实现加密流量的高精度分类。但该方法需要手动设计反映网络流量的特征集，耗费大量的成本并且特征的设计和提取直接影响分类效果，其泛化性能也有待提高。而深度学习作为机器学习的分支，可以有效避免依赖人工设计提取特征的问题。基于深...

【技术保护点】

【技术特征摘要】
1.一种加密流量分类方法，其特征在于，包括以下步骤：步骤1：采集网络流量，生成会话，按照五元组对所采集的原始网络流量数据过滤分流，获取原始实验数据集；步骤2：读取原始流量数据，剔除数据链路层，统一数据长度，归一化并转为包字节矩阵，生成灰度图像训练集和测试集；步骤3：通过三个卷积核生成三个特征空间，通过其中任意两个特征空间生成注意力特征图，并与剩余的特征空间生成自注意力特征矩阵图；步骤4：构建残差收缩模块；步骤5：通过自注意力机制模块从原始流量数据灰度图中提取特征信息，通过残差收缩模块对所提取特征自适应滤除冗余特征，全局平均池化降维特征信息，输出分类结果；步骤6：将所述训练集输入深度残差收缩网络模型中训练深度学习模型，对加密流量分类。2.根据权利要求1所述的加密流量分类方法，其特征在于，所述的捕获流量是用Wireshark抓取网络流量，生成PCAP格式文件。3.根据权利要求1所述的加密流量分类方法，其特征在于，将步骤2中用原始流量映射出的灰度图像作为神经网络输入，利用自注意力机制从原始流量灰度图中提取细粒度特征，进而提取出原始特征的全局信息。4.根据权利要求1所述的加密流量分类方法，其特征在于，所述步骤3包括以下步骤：通过3个卷积核，从原始流量灰度图中提取出三个特征空间；将任意两个特征空间做矩阵乘法运算经过softmax层归一化处理后得到一个特征空间的注意力特征图；将剩下的特征空间与注意力特征图点乘得到自注意力层的输出结果即全局特征信息；全局特征信息乘以可变系数再加上原来的特征图即获得所述的注意力特征矩阵图。5.根据权利要求1所述的加密流量分类方法，其特征在于，所述的构建残差收缩模块...

【专利技术属性】
技术研发人员：翟江涛，许历隆，林鹏，崔永富，
申请(专利权)人：南京信息工程大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人