基于动态网络环境下的未知流量数据识别方法及装置制造方法及图纸

技术编号:33205643 阅读:28 留言:0更新日期:2022-04-24 00:51
本申请涉及一种基于动态网络环境下的未知流量数据识别方法及装置。所述方法包括:通过先利用已知网络流量分类模型对网络数据中的已知流量进行分类,再根据分类预测结果进行初步判断,将初步判断为未知流量数的网络数据利用自适应聚类方法对未知流量数据的类别进行划分,再通过相似系数估计方法对各类别进行识别,以识别出属于恶意流量的类别以及正常流量的类别,也就是对未知流量数据的进行进一步的认识及学习,将其转变为已知流量数据,并将该新的已知流量数据再次对已知网络流量分类模型进行训练及更新。采用本方法能够在当前飞速变化的动态网络环境对已知流量数据进行分类以及识别未知流量数据。类以及识别未知流量数据。类以及识别未知流量数据。

【技术实现步骤摘要】
基于动态网络环境下的未知流量数据识别方法及装置


[0001]本申请涉及网络数据识别
,特别是涉及一种基于动态网络环境下的未知流量数据识别方法及装置。

技术介绍

[0002]近年来,伴随着互联网快速发展,网络流量迎来爆炸性增长,互联网接入流量增长势头迅猛。但是迅猛的发展给网络安全带来了更大的挑战,网络流量的增长,使得未知流量参杂在网络流量数据流中,未知流量中可能存在威胁恶意流量,对用户的网络安全造成巨大威胁,其隐患不容小觑。因此,对未知流量尤其是未知恶意流量的识别与分析成为了重要的研究主题。现有的识别方案采用基于端口的流量识别技术、基于机器学习的流量识别技术或基于深度学习的流量识别技术。在封闭世界问题中,现有研究方法已经可以达到较高的流分类准确率,但在真实世界中,网络应用的数据繁多,并且会随着网络发展不断更新,新的应用对于现有模型来讲是未知的,每当出现新的应用,现有的模型准确度会受到较大影响,造成对未知流量的识别效率下降,甚至威胁网络安全。

技术实现思路

[0003]基于此,有必要针对上述技术问题,提供一种能够应对现在网络环本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.基于动态网络环境下的未知流量数据识别方法,其特征在于,所述方法包括:获取需要进行识别的网络流量数据集,所述网络流量数据集中包括多个已知流量数据和/或未知流量数据,其中已知流量数据和未知流量数据中均包括有正常流量数据和恶意流量数据;基于流量特征排序对所述网络流量数据集进行预处理,得到多个维度的流量数据特征;将所述多个维度的流量数据特征输入已知网络流量分类模型对所述网络流量数据集中的各流量数据的类别进行预测,并输出相应的类别预测结果;依据自适应调整的置信度原则对所述类别预测结果对应的流量数据进行未知流量数据的初步判断,得到未知流量数据;根据自适应聚类方法对所述未知流量数据划分成不同的类别,并依据划分的类别对未知流量数据进行初始标注;根据相似系数估计方法对所述未知流量数据的类别进行识别,识别出未知流量数据中为恶意流量的类别以及正常流量的类别;将所述未知流量数据中已经识别出来的恶意流量数据和正常流量数据作为已知流量数据对所述已知网络流量分类模型进行训练并更新。2.根据权利要求1所述的未知流量数据识别方法,其特征在于,在利用所述已知网络流量分类模型对网络流量数据集中的各流量数据的类别进行预测之前还对所述已知网络流量分类模型进行训练,包括:获取已知流量数据训练集,所述已知流量数据训练集中包括已知正常流量数据,已知恶意流量数据以及已知正常流量数据以及已知恶意流量数据的混合流量数据;分别对各所述已知流量训练数据进行预处理后,输入已知网络流量分类模型进行训练,直至使其具备对已知流量数据进行分类的能力,所述已知网络流量分类模型包括三个子流量分类网络,将所述已知正常流量数据,已知恶意流量数据以及混合流量数据分别对三个子流量分类网络进行训练。3.根据权利要求2所述的未知流量数据识别方法,其特征在于,各所述子流量分类网络均包括一维深度神经网络、二维深度神经网络、三维深度神经网络以及决策信息融合层;在对所述已知流量训练数据进行预处理后得到与各所述已知流量训练数据对应的一维向量数据、二维向量数据以及三维向量数据;在对各所述子流量分类网络进行训练时,将与所述已知流量训练数据对应的一维向量数据、二维向量数据以及三维向量数据输入对应的所述一维深度神经网络、二维深度神经网络以及三维深度神经网络进行特征提取,将分别提取的特征输入所述决策信息融合层进行融合后再输出所述已知流量训练数据的类别预测结果。4.根据权利要求3所述的未知流量数据识别方法,其特征在于,所述一维深度神经网络、二维深度神经网络以及三维深度神经网络分别包括进行特征提取的两个连续的卷积层,以及连接在各所述卷积层后的一个ReLU激活函数、全连接层和Softmax输出层;所述决策信息融合层将三个不同维度深度神经网络的输出结果进行融合。5.根据权利要求1所述的未知流量数据识别方法,其特征在于,所述依据自适应调整的
置信度原则对所述类别预测结果对应的流量数据进行...

【专利技术属性】
技术研发人员:丁兆云张航曹得琪刘蔚柯刘毅朱先强朱承周鋆黄松平刘斌
申请(专利权)人:中国人民解放军国防科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1