一种入侵流量检测识别方法及系统技术方案

技术编号:33637816 阅读:12 留言:0更新日期:2022-06-02 01:53
本发明专利技术涉及一种入侵流量检测识别方法及系统。该方法包括获取入侵流量数据集;将所述入侵流量数据集分为训练数据集和测试数据集;利用ADASYN采样器对所述训练数据集进行升采样;利用升采样后的训练数据集训练入侵流量检测识别网络;将所述测试数据集输入训练好的入侵流量检测识别网络,利用改进残差网络分类器在多分类和二分类的情况下对测试集的入侵流量类型进行检测识别,确定检测识别结果;本发明专利技术能够提升攻击流量在数据集中的所占比例,防止小样本特征被忽略,并完成不同情况下的入侵流量检测、分类任务。分类任务。分类任务。

【技术实现步骤摘要】
Network and Information Security期刊上的“Deep LearningApproach onNetwork IntrusionDetection System usingNSL

KDD Dataset”一文中,Gurung S等提出一种带逻辑回归的稀疏自动编码器,通过堆叠自动编码器创建深度网络,在NSL

KDD数据集二分类准确率达到84.6%。这些模型相比于机器学习方法,在识别准确率上均有所提升,但仍具备提升空间。大部分研究对于数据都未进行合理的预处理,尤其对于不平衡数据集,通常直接采用归一化处理,这直接弱化了神经网络对小样本数据的特征学习能力,进而导致小样本的识别率低下,特征选择出现偏差,模型泛化性不强。

技术实现思路

[0005]本专利技术的目的是提供一种入侵流量检测识别方法及系统,能够提升攻击流量在数据集中的所占比例,防止小样本特征被忽略,并完成不同情况下的入侵流量检测、分类任务。
[0006]为实现上述目的,本专利技术提供了如下方案:
[0007]一种入侵流量检测识别方法,包括:
[0008]获取入侵流量数据集;所述入侵流量数据集为NSL

KDD入侵流量数据集;所述NSL

KDD入侵流量数据集包括:正常流量及4种攻击流量;所述攻击流量包括:DoS、Probing、R2L以及U2R;
[0009]将所述入侵流量数据集分为训练数据集和测试数据集;
[0010]利用ADASYN采样器对所述训练数据集进行升采样;
[0011]利用升采样后的训练数据集训练入侵流量检测识别网络;所述入侵流量检测识别网络以入侵流量数据为输入,以入侵流量检测识别结果为输出;
[0012]将所述测试数据集输入训练好的入侵流量检测识别网络,利用改进残差网络分类器在多分类和二分类的情况下对测试集的入侵流量类型进行检测识别,确定检测识别结果;所述改进残差网络分类器Inception

ResNet为基础构建,利用Inception模块进行多尺寸卷积,并在模块中添加跳跃连接线构成残差网络;利用Stem模块加深网络结构、扩充数据维数;利用Reduction模块进行特征压缩;利用全局平均池化层对数据进行池化操作;利用Softmax函数进行分类器输出。
[0013]可选地,所述获取入侵流量数据集,具体包括:
[0014]将所述入侵流量数据集分为数据部分和非数据部分;所述非数据部分包括:protocol_type、service以及flag;
[0015]对所述非数据部分按类型数进行One

hot编码转换;
[0016]对所述数据部分进行归一化处理;
[0017]将One

hot编码转换后数据和归一化处理后的数据进行合并,得到合并后的数据集;
[0018]对所述合并的数据集预处理;所述预处理包括无用特征剔除以及尺寸转换。
[0019]可选地,所述利用ADASYN采样器对所述训练数据集进行升采样,具体包括:
[0020]对升采样后的训练数据集中One

hot编码转换后数据进行取整处理。
[0021]可选地,所述改进残差网络分类器采用categorical

crossentropy作为损失函数。
[0022]可选地,所述将所述测试数据集输入训练好的入侵流量检测识别网络,利用改进残差网络分类器在多分类和二分类的情况下对测试集的入侵流量类型进行检测识别,确定检测识别结果,具体包括:
[0023]利用公式确定性能值;所述性能值包括:准确率、精确率、召回率以及调和平均值;
[0024]其中,Accuracy表述准确率,Precision表示精确率,Recall表示召回率,F1

score表示调和平均值,TP表示被正确分类的正例数量,FN表示被错分为负例的正例数量,TN表示被正确分类的负例数量,FP表示被错分为正例的负例数量。
[0025]一种入侵流量检测识别系统,包括:
[0026]入侵流量数据集获取模块,用于获取入侵流量数据集;所述入侵流量数据集为NSL

KDD入侵流量数据集;所述NSL

KDD入侵流量数据集包括:正常流量及4种攻击流量;所述攻击流量包括:DoS、Probing、R2L以及U2R;
[0027]数据集划分模块,用于将所述入侵流量数据集分为训练数据集和测试数据集;
[0028]升采样模块,用于利用ADASYN采样器对所述训练数据集进行升采样;
[0029]入侵流量检测识别网络训练模块,用于利用升采样后的训练数据集训练入侵流量检测识别网络;所述入侵流量检测识别网络以入侵流量数据为输入,以入侵流量检测识别结果为输出;
[0030]检测识别结果确定模块,用于将所述测试数据集输入训练好的入侵流量检测识别网络,利用改进残差网络分类器在多分类和二分类的情况下对测试集的入侵流量类型进行检测识别,确定检测识别结果;所述改进残差网络分类器Inception

ResNet为基础构建,利用Inception模块进行多尺寸卷积,并在模块中添加跳跃连接线构成残差网络;利用Stem模块加深网络结构、扩充数据维数;利用Reduction模块进行特征压缩;利用全局平均池化层对数据进行池化操作;利用Softmax函数进行分类器输出。
[0031]可选地,所述入侵流量数据集获取模块具体包括:
[0032]入侵流量数据集数据类型划分单元,用于将所述入侵流量数据集分为数据部分和非数据部分;所述非数据部分包括:protocol_type、service以及flag;
[0033]One

hot编码转换单元,用于对所述非数据部分按类型数进行One

hot编码转换;
[0034]归一化处理单元,用于对所述数据部分进行归一化处理;
[0035]数据合并单元,用于将One

hot编码转换后数据和归一化处理后的数据进行合并,得到合并后的数据集;
[0036]数据集预处理单元,用于对所述合并的数据集预处理;所述预处理包括无用特征剔除以及尺寸转换。
[0037]可选地,所述升采样模块具体包括:
[0038]取整处理单元,用于对升采样后的训练数据集中One

hot编码转换后数据进行取
整处理。
[0039]可选地,所述改进残差网络分类器采用categorical

crossentropy作为损失函数。
[0040]可选地,所述检测识别结果确定模块具体包括:
[0041]性能值确定单元,用于利用公式确定性能值;所述性能值包括:准确率、精确率、召回率以及调和平均值;
[0042]其中,Accuracy本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种入侵流量检测识别方法,其特征在于,包括:获取入侵流量数据集;所述入侵流量数据集为NSL

KDD入侵流量数据集;所述NSL

KDD入侵流量数据集包括:正常流量及4种攻击流量;所述攻击流量包括:DoS、Probing、R2L以及U2R;将所述入侵流量数据集分为训练数据集和测试数据集;利用ADASYN采样器对所述训练数据集进行升采样;利用升采样后的训练数据集训练入侵流量检测识别网络;所述入侵流量检测识别网络以入侵流量数据为输入,以入侵流量检测识别结果为输出;将所述测试数据集输入训练好的入侵流量检测识别网络,利用改进残差网络分类器在多分类和二分类的情况下对测试集的入侵流量类型进行检测识别,确定检测识别结果;所述改进残差网络分类器Inception

ResNet为基础构建,利用Inception模块进行多尺寸卷积,并在模块中添加跳跃连接线构成残差网络;利用Stem模块加深网络结构、扩充数据维数;利用Reduction模块进行特征压缩;利用全局平均池化层对数据进行池化操作;利用Softmax函数进行分类器输出。2.根据权利要求1所述的一种入侵流量检测识别方法,其特征在于,所述获取入侵流量数据集,具体包括:将所述入侵流量数据集分为数据部分和非数据部分;所述非数据部分包括:protocol_type、service以及flag;对所述非数据部分按类型数进行One

hot编码转换;对所述数据部分进行归一化处理;将One

hot编码转换后数据和归一化处理后的数据进行合并,得到合并后的数据集;对所述合并的数据集预处理;所述预处理包括无用特征剔除以及尺寸转换。3.根据权利要求2所述的一种入侵流量检测识别方法,其特征在于,所述利用ADASYN采样器对所述训练数据集进行升采样,具体包括:对升采样后的训练数据集中One

hot编码转换后数据进行取整处理。4.根据权利要求1所述的一种入侵流量检测识别方法,其特征在于,所述改进残差网络分类器采用categorical

crossentropy作为损失函数。5.根据权利要求1所述的一种入侵流量检测识别方法,其特征在于,所述将所述测试数据集输入训练好的入侵流量检测识别网络,利用改进残差网络分类器在多分类和二分类的情况下对测试集的入侵流量类型进行检测识别,确定检测识别结果,具体包括:利用公式确定性能值;所述性能值包括:准确率、精确率、召回率以及调和平均值;其中,Accuracy表述准确率,Precision表示精确率,Recall表示召回率,F1

score表示
调和平均值,TP表示被正确分类的正例数量,FN表示被错分为负例的正例数量,TN表示被正确分类的负例数量,FP表示被错分为正例的负例数量。6.一种入侵流量检测识别系统,其特征在于,包括:入侵流量数据集获取模块,用于获取入...

【专利技术属性】
技术研发人员:钟兆根唐玺博张立民谢存祥金堃
申请(专利权)人:中国人民解放军海军航空大学航空基础学院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1