一种基于CNN-Transformer混合架构的网络流量分类方法技术

技术编号：37466293 阅读：9 留言：0更新日期：2023-05-06 09:40

本发明专利技术提出一种基于CNN

全部详细技术资料下载

【技术实现步骤摘要】
一种基于CNN
‑
Transformer混合架构的网络流量分类方法

[0001]本申请涉及一种网络流量分类方法，尤其涉及一种基于CNN
‑
Transformer混合架构的网络流量分类方法，属于网络流量分类

技术介绍

[0002]互联网从产生到现在，无时不刻都在产生流量，尤其在超大规模集成电路计算机兴起和各种新型TCP/IP协议出现后，计算机的计算能力不断提高，协议更加完善，网络的应用更加丰富，使用互联网的人越来越多，网络的传输速率和吞吐量不断增加，流量迅猛增长。根据2016年思科可视网络指数的预测，全球互联网流量总产量将超过每年1ZB大关，并在2020达到2.3ZB。所以巨大的流量需要一项有重要意义的工程，也即流量分类。流量分类，顾名思义，也就是将流量分类成多个类。如把数据包分类成具体的应用层协议，或分成某一个大种类(如视频类，游戏类，文件传输类等)、有的也根据具体应用来分类(如QQ，Thunder等)，还有一些其他的分类方式。流量分类可以应用于多个方面，如协议识别，QoS管理，恶意软件检测、优化网络布局等。
[0003]随着互联网及各种在线应用的快速增长，加密流量在网络传输中的比重越来越大，这给流量识别和分类带来了巨大的挑战。加密流量采用的端口混淆和端口跳变技术导致传统的基于端口的流量识别方法的准确率大幅下降，加密流量对传输载荷进行加密的特性也导致了基于载荷关键字的流量识别方法的准确率下降。传统机器学习方法也已不太适用加密流量的分类。基于机器学习的方法不能捕获复

【技术保护点】

【技术特征摘要】
1.一种基于CNN
‑
Transformer混合架构的网络流量分类方法，其特征在于，包括以下步骤：S1.获取加密流量数据，并进行预处理，得到处理后的流量数据；S2.将处理后的流量数据按照二进制形式转化为灰度图片；S3.将生成的流量图进行数据增强，获得更多的样本数据；S4.构建基于CNN
‑
Transformer的混合模型Next
‑
ViT；S5.训练混合模型Next
‑
ViT，得到训练好的分类模型；S6.将灰度图片作为分类模型的输入，输出加密网络流量类别。2.根据权利要求1所述的一种基于CNN
‑
Transformer混合架构的网络流量分类方法，其特征在于，S1具体是，包括以下步骤：S11.将原始流量根据会话进行切分，切分为多个流量数据，将流切分成所有层；S12.清理0B文件；S13.处理重复文件；S14.流量匿名化，用随机生成的新地址替换数据链路层的MAC地址和IP层的IP地址，若待分类的流量来自同一个网络环境则不需要处理。3.根据权利要求2所述的一种基于CNN
‑
Transformer混合架构的网络流量分类方法，其特征在于，S2具体是，包括以下步骤：S21.取流量数据中每条流的前784个字节转换为流量图；S22.将每个字节对应图片的一个灰度像素值，0x00对应黑色，0xff对应白色。4.根据权利要求3所述的一种基于CNN
‑
Transformer混合架构的网络流量分类方法，其特征在于，S3具体是，将灰度图片进行随机旋转、随机扭曲、上下翻转、左右翻转以及错切变换操作对图片进行增强，得到更多的输入数据。5.根据权利要求4所述的一种基于CNN
‑
Transformer混合架构的网络流量分类方法，其特征在于，混合模型Next
‑
ViT包括：卷积模块、混合连接模块和Transformer模块，构建基于CNN
‑
Transformer的混合模型Next
‑
ViT，具体包括以下步骤：S41.卷积模块包括多头卷积注意力模块和多层感知机模块；多头卷积注意力模块将Transformer中的多头自注意力模块换成多头卷积注意力模块；卷积注意力模块通过群卷积和逐点卷积学习局部特征，卷积注意力模块的公式如下：其中，T
m
和T
n
是输入特征相邻的tokens，W...

【专利技术属性】
技术研发人员：孙广路，何莎莎，王旭辉，
申请(专利权)人：哈尔滨理工大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人