基于特征自适应层次聚类的网络流量图像安全分类方法技术

技术编号:28147792 阅读:43 留言:0更新日期:2021-04-21 19:35
本发明专利技术公开了一种基于特征自适应层次聚类的网络流量图像安全分类方法,利用自适应层次聚类方法对网络流量特征进行聚类,所生成的聚类的网络流量图像在不损失网络流量特征信息的前提下,加强了网络流量特征之间的关联性,增加了网络流量相关特征的强度,从而提高了网络流量安全分类的准确性。所述方法对网络流量特征进行自底而上的凝聚法聚类,具有一定的自适应性,并提出最优聚类数选取的方法,增强了流量特征图像聚类效果,对种类复杂多样的网络流量安全分类问题普遍适用。网络流量安全分类问题普遍适用。网络流量安全分类问题普遍适用。

【技术实现步骤摘要】
基于特征自适应层次聚类的网络流量图像安全分类方法


[0001]本专利技术涉及网络流量安全
,特别涉及一种基于特征自适应层次聚类的网络流量图像安全分类方法。

技术介绍

[0002]网络流量安全分类作为网络安全管理和网络安全分析的基础,是网络安全领域的研究重点。随着人工智能的发展,机器学习技术在网络流量安全分类应用中愈加广泛,然而机器学习分类模型的识别性能往往过于依赖特征选择,在某种程度上,特征选择的优劣直接决定了网络流量分类模型性能的上限。
[0003]现有技术通过改进网络流量特征选择方法或优化机器学习算法来提高网络流量安全分类的效果,然而利用特征选择方法求得对机器学习模型分类特征组合,会不同程度地损失网络流量的原始特征信息,甚至陷入局部最优,使得整体分类结果不稳定、不准确,并且由于机器学习算法自身的局限性,实现多种类复杂网络流量安全分类仍然存在一定的难度。
[0004]现有的技术方案主要有以下几种:
[0005](1)中国科学技术大学的Wei Wang认为数据流前面字段部分是包含连接数据和内容数据,可以很好地反映数本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于特征自适应层次聚类的网络流量图像安全分类方法,其特征在于,包括以下步骤:S1、输入原始网络流量数据,提取网络流量特征,为每条网络流量特征标注类别标签,得到原始网络流量特征数据集;S2、读取所述原始网络流量特征数据集的前W列,记为矩阵A
H
×
W
,生成大小为H
×
W的网络流量图像,并将矩阵A
H
×
W
转置为矩阵A'
W
×
H
;S3、基于自适应层次聚类算法优化选取聚类数量n_cluster,使得类间距离大于第一预设值,类内距离小于第二预设值;S4、采用最优的n_cluster值对网络流量图像的特征进行聚类,得到对应的网络流量特征聚类结果;S5、根据网络流量特征的类别标签重新排列网络流量特征,得到矩阵B
W
×
H
,并转置为矩阵B'
H
×
W
;S6、分别对矩阵A'
W
×
H
和矩阵B'
H
×
W
进行按类别切割,生成原始网络流量切割图像和聚类网络流量切割图像,并标注类别标签;S7、将原始网络流量切割图像放入原始数据集,将聚类网络流量切割图像放入切割数据集,并将原始数据集和切割数据集带入分类模型进行分类;S8、对分类预测的准确率进行测试。2.根据权利要求1所述的基于特征自适应层次聚类的网络流量图像安全分类方法,其特征在于,所述步骤S1具体包括:输入原始网络流量pcap数据包,通过CICFlowMeter网络流量特征提取工具提取网络流量特征,对提取的网络流量特征进行规范化处理:为每条网络流量特征标注类别标签i,其中i=0、1、2、3、

,获得原始网络流量特征数据集D
f
。3.根据权利要求2所述的基于特征自适应层次聚类的网络流量图像安全分类方法,其特征在于,所述步骤S2具体包括:读取原始网络流量特征数据集D
f
前W列,记为矩阵A
H
×
W
,生成大小为H
×
W的网络流量图像,其中高度H代表网络数据流数量,宽度W代表网络流量特征数量,并将矩阵A
H
×
W
转置为矩阵A'
W
×
H
。4.根据权利要求3所述的基于特征自适应层次聚类的网络流量图...

【专利技术属性】
技术研发人员:陈红松孙学洁
申请(专利权)人:北京科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1