一种网络流量分类方法技术

技术编号:21715508 阅读:20 留言:0更新日期:2019-07-27 19:30
本发明专利技术提供一种网络流量分类方法,包括构建轻量级分类模型;所述构建轻量级分类模型包括如下步骤:S1:基于自步学习的深度神经网络流量去噪算法训练网络流量分类模型;S2:基于正则化损失知识蒸馏的模型压缩技术,将所述网络流量分类模型压缩成轻量级网络流量分类模型。通过一种新的基于自步学习的深度神经网络流量去噪算法,并结合知识蒸馏技术,对网络流量分类模型进行压缩,得到最终的轻量级网络流量分类模型。有效提升网络流量分类方法的鲁棒性、分类准确率和分类速度。

A Classification Method of Network Traffic

【技术实现步骤摘要】
一种网络流量分类方法
本专利技术涉及
,尤其涉及一种网络流量分类方法。
技术介绍
互联网和信息技术是当今世界科学技术研究中发展最为快速的技术之一。我国自接入国际互联网以来,在短短二十多年内,凭借国内各种互联网企业的不懈努力,中国的互联网行业经历了从国际跟跑到国际并跑,再到未来可期的国际领跑三大跨越,取得的巨大成就有目共睹。截至到2018年6月,我国的网民人数已经达到8.02亿,互联网普及率达57.7%,发展速度可谓惊人。互联网技术因其方便快捷,移动性好,价格低廉等特点,正在改变着人们的生活方式。小到聊天、购物、娱乐,大到航天航空、武器导弹都离不开互联网。互联网的飞速发展推动了全球化的生产和生活方式的深刻变革。随着网络理论技术的发展、网络硬件性能的不断增强,整个互联网的流量规模也在不断的增加。人民生活水平的提高推动着网络应用技术的进一步发展,促使网络供应商不断地提升网络服务的水平。如今,现代互联网的流量的多样性和复杂性远远超出了当初底层互联网架构者的想象。网络流量是记录和反映网络活动及运营情况的重要载体。随着互联网的高速发展,为了满足互联网用户的多样化需求,各种新的网络服务层出不穷,导致网络流量无论是在数量还是种类上都不断增加。这些新型应用扩大了互联网的应用规模,提供了更丰富的网络服务。但是其采用的应用协议特征也有别于传统的应用类型,变得更加复杂和多样化,给网络流量的管理和规划造成了极大的冲击。网络流量分类是指按照网络的应用类型(比如FTP、HTTP、SMTP、360、qq等),将基于TCP/IP协议的网络通信产生的TCP或UDP流量进行分类。网络流量分类技术是保障网络安全的关键技术,也是现代网络管理与安全系统中最基本的功能。同时,网络流量分类技术在QOS服务质量控制、网络应用趋势分析等方面也具有重大的作用,包含极大应用价值,具体体现在:1、通过网络流量识别技术,能够掌控网络内部资源的分配情况,网络运营商和网络服务提供商(ISP)可以将其应用到网络服务质量(QoS)控制机制中,保障网络带宽等网络资源的合理分配,从而促进网络向更加合理的方向发展。如果在各网络关口对网络流量进行分类,自适应匹配不同的应用协议,将可以帮助网络管理者对网络流量实施有效的差异化、精细化管理。这样,也有利于解决网络监管中存在的种种问题,为网络用户营造更加健康高效的网络环境。2、实现网络流量的识别分类,可以对企业或用户的业务流量进行管理,从而能够宏观上动态调配网络资源,为用户定制合理的网络运营方案,实现更加高效的网络应用。通过识别不同应用的网络流量,公司内部可以在工作时间禁止使用娱乐相关的应用流量,政府部门可以设定禁止非法使用P2P等加密传输业务等。最近兴起的针对特殊应用的专有流量优惠(如腾讯大王卡),更是以网络流量分类技术为核心。3、网络流量识别分类对保障网络空间安全具有重要作用。例如,入侵检测系统(IDS)可以利用网络流量分类技术,将恶意网络流量识别出来并采取隔离处理等措施,通过对木马、Web注入等恶意攻击流量的准确识别,提前告警或阻断可能的攻击,实现对网络设备的保护,保障网络系统安全可靠地运行。在政府企业等敏感网络中,还可以利用网络流量分类技术对出入口网络流量进行准确的识别与监管,有效地监控和管理网络流量,防止机密、敏感信息泄露以造成重大的网络信息安全事故。此外,在基于云计算的环境中,网络流量分类技术在确保云计算服务质量方面也发挥着极其重要的作用。但是现有技术中,网络环境中存在大量噪声流量的问题影响网络分流。
技术实现思路
本专利技术为了解决现实网络环境中存在大量噪声流量的问题,提供一种网络流量分类方法。为了解决上述问题,本专利技术采用的技术方案如下所述:一种网络流量分类方法,包括构建轻量级分类模型;所述构建轻量级分类模型包括如下步骤:S1:基于自步学习的深度神经网络流量去噪算法训练网络流量分类模型;S2:基于正则化损失知识蒸馏的模型压缩技术,将所述网络流量分类模型压缩成轻量级网络流量分类模型。在本专利技术的一种实施例中,所述步骤S1中包括如下步骤:S11:网络流量数据的样本通过深度神经网络得到输出值;S12:用所述输出值与所述网络流量数据的样本的真实标签计算损失值;S13:将所述损失值与阈值比较,若所述损失值大于所述阈值,则忽略所述网络流量数据的样本;若所述损失值小于所述阈值,则将所述损失值进行反向传播优化所述网络流量分类模型的参数。优化所述网络流量分类模型的参数的方法采用小批量梯度下降算法;通过计算每次所述小批量梯度下降算法中用于训练的所述网络流量数据的样本的学习难易程度平均值,在训练所述网络流量分类模型时用对应大小的权重更新参数;获取最优的初始学习率并训练网络流量分类模型,并周期性调整学习率。获取最优的初始学习率的方法包括如下步骤:T1:设置一个初始学习率进行训练网络流量分类模型,每个batch之后更新所述网络流量数据的样本,更新所述网络流量数据的样本时增加学习率;T2:计算每个所述网络流量数据的样本的损失,得到学习率和损失的变化曲线;T3:获取所述最优的初始学习率。在本专利技术的另一种实施例中,所述步骤S2中包括如下步骤:S21:在所述网络流量分类模型的softmax层引入“温度”的概念,将softmax层的输出变为:其中,T为温度,在温度T下训练出一个新的网络流量分类模型,T>1;S22:将每个所述网络流量数据的样本输入到所述新的网络流量分类模型,得到每个所述网络流量数据的样本在softmax层的输出,即软标签;S23:再引入L1正则化方法,在相同的温度T下,利用所述软标签和原真实标签训练所述轻量级网络流量分类模型。提出正则化损失函数如下:Loss=Loss1+Loss2+λ||w||1其中,λ是超参数,||w||1是轻量级模型参数w的L1范数,分别为所述新的网络流量分类模型和轻量级网络流量分类模型在相同温度T下得到的软标签,T>1,为轻量级模型softmax层在温度T=1的输出值;ytrue是真实标签;α是超参数,用于调节Loss1和Loss2的比例,CrossEntropy表示交叉熵损失函数。网络流量数据通过所述轻量级网络流量分类模型即可得到预测标签,所述轻量级网络流量分类模型的softmax层的温度为1。本专利技术还提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如上任一所述方法的步骤。本专利技术的有益效果为:提供一种网络流量分类方法,通过一种新的基于自步学习的深度神经网络流量去噪算法,并结合知识蒸馏技术,对网络流量分类模型进行压缩,得到最终的轻量级网络流量分类模型。有效提升网络流量分类方法的鲁棒性、分类准确率和分类速度。附图说明图1是本专利技术实施例中网络流量分类方法示意图。图2是本专利技术实施例中构建轻量级分类模型的方法示意图。图3是本专利技术实施例中基于自步学习的深度神经网络结构流程示意图。图4是本专利技术实施例中训练网络流量分类模型的方法示意图。图5是本专利技术实施例中获取最优的初始学习率的方法示意图。图6是本专利技术实施例中基于正则化损失知识蒸馏的模型压缩技术构建轻量级网络流量分类模型的流程示意图。图7是本专利技术实施例中基于正则化损失知识蒸馏的模型压缩技术构建轻量级网络流量分类模型的方法示本文档来自技高网
...

【技术保护点】
1.一种网络流量分类方法,其特征在于,包括构建轻量级分类模型;所述构建轻量级分类模型包括如下步骤:S1:基于自步学习的深度神经网络流量去噪算法训练网络流量分类模型;S2:基于正则化损失知识蒸馏的模型压缩技术,将所述网络流量分类模型压缩成轻量级网络流量分类模型。

【技术特征摘要】
1.一种网络流量分类方法,其特征在于,包括构建轻量级分类模型;所述构建轻量级分类模型包括如下步骤:S1:基于自步学习的深度神经网络流量去噪算法训练网络流量分类模型;S2:基于正则化损失知识蒸馏的模型压缩技术,将所述网络流量分类模型压缩成轻量级网络流量分类模型。2.如权利要求1所述的网络流量分类方法,其特征在于,步骤S1中包括如下步骤:S11:网络流量数据的样本通过深度神经网络得到输出值;S12:用所述输出值与所述网络流量数据的样本的真实标签计算损失值;S13:将所述损失值与阈值比较,若所述损失值大于所述阈值,则忽略所述网络流量数据的样本;若所述损失值小于所述阈值,则将所述损失值进行反向传播优化所述网络流量分类模型的参数。3.如权利要求2所述的网络流量分类方法,其特征在于,优化所述网络流量分类模型的参数的方法采用小批量梯度下降算法。4.如权利要求3所述的网络流量分类方法,其特征在于,通过计算每次所述小批量梯度下降算法中用于训练的所述网络流量数据的样本的学习难易程度平均值,在训练所述网络流量分类模型时用对应大小的权重更新参数。5.如权利要求2所述的网络流量分类方法,其特征在于,获取最优的初始学习率并训练网络流量分类模型,并周期性调整学习率。6.如权利要求5所述的网络流量分类方法,其特征在于,获取最优的初始学习率的方法包括如下步骤:T1:设置一个初始学习率进行训练网络流量分类模型,每个batch之后更新所述网络流量数据的样本,更新所述网络流量数据的样本时增加学习率;T2:计算每个所述网络流量数据的样本的...

【专利技术属性】
技术研发人员:肖喜毛科龙夏树涛郑海涛江勇
申请(专利权)人:清华大学深圳研究生院
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1