SDN环境下基于改进的残差卷积网络的细粒度流量分类方法技术

技术编号:36549279 阅读:13 留言:0更新日期:2023-02-04 17:02
本发明专利技术涉及一种SDN环境下基于改进的残差卷积网络的细粒度流量分类方法,属于软件技术领域。为了提供更细粒度的应用感知流量分类,让网络运营商更好地分析网络组成以及管理和调度网络资源,对这些特定应用程序进行细粒度分类非常重要。传统方法倾向于基于协议对流量进行分类,这是粗粒度的分类,受计算机视觉方面研究的启发,本文将残差卷积网络的方法应用于网络流量的识别分类中,该方法解决了传统深度学习方法进行细粒度网络流量识别过程中随着网络深度的增加而出现的网络退化问题,能够有效学习更深层的网络特征进而实现细粒度的网络流量分类。网络流量分类。网络流量分类。

【技术实现步骤摘要】
SDN环境下基于改进的残差卷积网络的细粒度流量分类方法


[0001]本专利技术属于软件
,涉及SDN环境下基于改进的残差卷积网络的细粒度流量分类方法。

技术介绍

[0002]随着物联网、云计算以及5G的发展,接入网络的节点不断增加,网络传输速率不断增长,各种新型应用不断涌现,网络流量呈指数级增长,使得网络不堪重负,容易造成资源浪费、网络拥塞等问题。流量分类是一项重要的网络功能,其目的是将流量划分为多个优先级或多个服务,它提供了一种通过识别不同流量类型来执行细粒度网络管理的方法。借助流量分类,网络运营商可以更有效地处理不同的业务和分配网络资源,提升网络质量和用户体验。
[0003]SDN是一种新兴的、有前途的网络模式,它可以极大地简化网络管理,提高网络资源利用率,优化网络性能,降低运营成本。软件定义网络(SDN)为我们提供了在网络内部实现智能化的新机会,具体而言:
[0004]第一,SDN集中式架构使控制器具有网络的中央视图,能够收集各种网络数据,能够有效解决深度学习中的数据获取难题,便于深度学习算法的应用。第二,基于实时和历史网络数据,深度学习技术可以通过数据分析、网络优化和网络服务的自动化提供,为SDN控制器带来智能。第三,SDN的可编程性允许应用程序对网络进行编程,进而使得深度学习算法做出的最优网络解决方案可以在网络上实时执行。第四,图形处理单元(GPU)和张量处理单元(TPU)等计算技术的最新进展为在网络领域应用深度学习技术提供了技术支撑。因此,在SDN中应用深度学习技术是合适和有效的。<br/>[0005]传统机器学习方法进行流量分类的结果非常依赖于网络流量的特征工程,而这需要大量的时间和人力,这对于一些核心或边缘设备上是不适用的,此外传统机器学习方法并不能适用于加密流量的分类识别,大大降低了机器学习方法的通用性。深度学习是一种端到端的学习方式,其输出不受输入数据特征的影响,不需要人为提取特征,摆脱了繁重的特征学习和特征选择工作,因此基于深度学习的方法能够进行更准确、更快速、更细粒度的流量分类问题。
[0006]深度学习算法的结果根据分类级别可以分为两类:粗粒度和细粒度。粗粒度分类根据粗略的流量类型(如Web浏览器、批量传输、VOIP等)将流量识别为几个类别。细粒度分类旨在区分单个应用程序或功能模型(如Facebook应用程序可以生成视频、语音、音频共享流等),而不是将它们分类为粗略的流量类别,这有利于运营商进一步分析流量组成和用户画像,提高网络服务质量。
[0007]SDN网络作为一种极具前景的网络架构已经被广泛讨论研究,但网络安全和QoS质量仍然面临着巨大的挑战,因此,SDN网络中的流量分类问题也成为了一项重要的研究。目前,有文献将深度学习方法应用到软件定义网络中的各种挑战和问题,从流量分类、路由优化、QoS/QoE预测、资源管理和安全的角度,详细讨论了ML算法在SDN领域的应用。对于流量
分类任务的研究有很好的总览性作用。
[0008]网络流量分类技术发展至今大概经历了四个阶段:
[0009]一是基于端口流量分类,但随着动态端口、隐藏端口的出现,该方法的识别准确率大幅下降。
[0010]二是基于有效负载的流量分类,如深度包检测,通过在IP包的有效负载中搜索应用程序的签名,能够在一定程度上避免动态端口问题。但该类方法需要不断地更新和维护协议特征库,面对快速发展的网络会产生极大的资源消耗,此外当出现加密流量时,该方法很难实现且计算开销很高。
[0011]三是基于传统深度学习的流量分类,该方法主要依据流量的一些外部统计特征,如包间时间、总包数、流量持续时间等实现流量的分类,常见的有支持向量机SVM、随机森林RF、决策树DT、K均值算法,该类方法对动态端口和加密流量等具有高适应性,但需要复杂的特征工程,增加了该方法的复杂性。
[0012]四是基于深度学习的流量分类,基于深度学习的方法的特征提取与选择是通过模型训练自动完成的,与传统的深度学习方法相比,深度学习的方法具有更高的学习能力,此外,深度学习的方法可以直接学习原始流量的特征而不需要额外的人工设计的特有或私有流量信息,这些特性使得基于DL的方法成为一种非常理想的流量分类方法。现有一种具有一维卷积神经网络的端到端加密流量分类方法,该方法将特征提取、特征选择和分类器集成到一个统一的端到端框架中,使用公共ISCX VPN

non VPN流量数据集进行验证。但文章没有对模型的参数进行优化讨论,因此其模型的泛化能力有待进一步验证。现有一种深度数据包Deep Packet框架,该框架分别实现了SAE和一维CNN,对网络流量进行自动提取以对流量进行分类,可以处理应用程序识别和流量表征任务。该篇文献依旧使用公共流量数据集ISCX VPN

non VPN进行验证,两个网络都能够准确地对数据包进行分类。作者表明Deep Packet框架在应用程序识别和流量表征方面均胜过ISCX VPN

non VPN流量数据集上的所有类似工作。但作者没有解决多通道分类问题(即细粒度分类,例如同一应用程序的不同功能流)。现有一种基于深度学习的轻量级流量分类和入侵检测框架,称为深度全范围(DFR),该框架实现了一维CNN、LSTM、SAE,使用两个公共数据集ISCX VPN non VPN和ISCX 2012 IDS进行评估并能够达到很高的准确率。现有一种基于生成对抗网络(GAN)的半监督学习加密流量分类方法ByteSGAN,嵌入在SDN边缘网关中实现流量分类的目标,进一步提高网络资源利用率。基于公共数据集“ISCX2012 VPN

non VPN和Crossmarket进行实验,结果表明ByteSGAN可以有效提高流量分类器的性能。但GAN训练的模式崩溃和不稳定性成为了是该篇文章需要考虑和解决的问题。现有一种新的基于流时空特征的加密流量分类方案TSCRNN,用于工业物联网的高效管理,TSCRNN使用CNN提取抽象特征,然后通过堆栈Bi

LTSM学习基于这些低维特征图的时间特征。现有一种用于暗网流量分类和应用识别的新型自注意力深度学习方法DarknetSec。利用一维的级联模型卷积神经网络(1D CNN)和双向长短期记忆(Bi

LSTM)网络从数据包的有效负载内容中捕获局部时空特征,同时将自注意机制集成到上述特征提取网络中挖掘先前提取的内容特征之间的内在关系和隐藏联系。现有一种基于卷积神经网络(CNN)的在线多媒体流量分类框架,能够进行快速早期分类以及类增量学习。作者应用滑动窗口技术和概率分布函数进行特征设计。为了更好地支持新服务的添加,使用知识蒸馏和偏差校正技术开发了类增量学习模型。但特征提取的时间消耗使该方
法具有一定的局限性。
[0013]表1相关论文总结
[0014][0015][0016]综上所述,目前的相关流量分类文献存在几个主要问题:一是作者选择的数据集都选取了每一类别具有很高的一致性、不本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.SDN环境下基于改进的残差卷积网络的细粒度流量分类方法,其特征在于:该方法包括以下步骤:S1:对网络流量类别进行分类,定义网络流量拆分粒度;S2:在软件定义网络SDN中进行流量分类任务;S3:数据准备、数据预处理、数据可视化;S4:设计基于残差卷积网络的细粒度流量分类系统。2.根据权利要求1所述的SDN环境下基于改进的残差卷积网络的细粒度流量分类方法,其特征在于:所述S1具体为:根据协议、应用程序和流量类型的粒度对流量类别进行分类;网络流量拆分粒度包括:TCP连接、流、会话、服务和主机;不同的分割粒度会导致不同的流量单位;流定义为具有相同5元组的所有数据包,即时间戳、源IP、目标IP、协议和数据包长度;会话为双向流,包括两个方向的流量;设网络流量由一系列连续的数据包组成P=p1,p2,...,p
i
,...p
n
,,其中p
i
代表第i个数据包;通过使用流量切分工具SplitCap从数据包头中提取五元组,每个数据包定义为p
i
=(t
i
,src
i
,dst
i
,pro
i
,len
i
),i=1,2,...,|p|,其中t
i
代表时间戳,src
i
代表源ip地址,dst
i
表示目的ip地址,pro
i
表示协议类型,len
i
表示数据包长度。3.根据权利要求2所述的SDN环境下基于改进的残差卷积网络的细粒度流量分类方法,其特征在于:所述S2具体为:S21:交换机收集网络流量,并通过OpenFlow协议发送给控制器;S22:控制器提取流量数据,然后将特征发送给预处理模块对原始数据集进行处理;S23:处理结果发送到分类模块,对流进行分类;S24:将分类结果发送给SDN控制器;S25:控制器根据分类结果分析流量组成并做出管理与调度的决策。4.根据权利要求3所述的SDN环境下基于改进的残差卷积网络的细粒度流量分类方法,其特征在于:所述S3中,所述数据准备为:从公开数据集网站中获取11类真实环境下的原始数据集,包括facebook_audio、facebook_chat、facebook_video、hangout_chat、hangouts_audio、hangouts_video、skype_audio、netflix、vimeo、youtube和email,并将其命名为CIC_TF。5.根据权利要求4所述的SDN环境下基于改进的残差卷积网络的细粒度流量分类方法,其特征在于:所述S3中,所述数据预处理为:将原始的PCAP格式的流量数据转化为残差卷积网络可识别的IDX格式的数据,包括流量分割、归一化、图像化和PNG转IDX,具体包括:1)流量分割:将原始连续的PCAP流量数据以会话+所有层的形式为粒度拆分为更小的离散的PCAP流量数据;删除空文件和重复文件;2)归一化:将所有文件修剪为统一的长度将文件统一为28*28,784字节,当文件大小大于784字节,则将其修剪为784...

【专利技术属性】
技术研发人员:苏畅刘艳清谢显中
申请(专利权)人:重庆邮电大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1