一种信息分类模糊模型的网络入侵检测分类方法技术

技术编号:31562600 阅读:34 留言:0更新日期:2021-12-25 10:45
一种信息分类模糊模型的网络入侵检测分类方法。该方法通过构造的模糊规则库来进行入侵检测分类。模糊规则的构造包括前提和结论两部分,其中前提部分的构造基于硬聚类算法(Hard Clustering Method,简称HCM),结论部分的构造则基于最小二乘法(Ordinary Least Square,简称OLS)。信息分类模糊模型在一定程度上解决了传统入侵检测方法耗时长、检测率低等问题。该方法在国际标准数据上进行模拟测试,并同其它两种入侵检测方法进行比较,实验结果显示本发明专利技术提供的方法优于其它两种入侵检测方法。检测方法。检测方法。

【技术实现步骤摘要】
一种信息分类模糊模型的网络入侵检测分类方法


[0001]本专利技术属于入侵检测
,特别涉及一种信息分类模糊模型的网络入侵检测分类方法。

技术介绍

[0002]入侵检测是对潜在的有预谋的未经授权的访问信息、操作信息以及致使系统不可靠、不稳定或无法使用的企图的检测和监视。它能够从计算机网络系统中的若干关键点收集信息,并进行相应的分析,以检查网络中是否有违反安全策略的行为和操作袭击的迹象。
[0003]根据入侵检测模型,入侵检测原理可以分为两种:异常检测原理和误用检测原理。目前入侵检测有很多种方法:如基于概率统计的检测、基于神经网络的检测。但是,目前基于入侵检测模型存在检测率低、经常出现过拟合问题。

技术实现思路

[0004]本专利技术的目的是为克服上述现有技术存在的缺点和不足,提供一种信息分类模糊模型的网络入侵检测分类方法。通过在国际标准数据集(10%KDDCup99实验数据集)上测试,和其他两种入侵检测算法进行对比,该算法的整体检测效果较优于其它两种入侵检测算法。
[0005]本专利技术技术方案:
[本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种信息分类模糊模型的网络入侵检测分类方法,其特征包括以下步骤:第1步、设计多项式模糊模型的表示形式;第2步、对国际标准数据集10%KDDCup99进行预处理,将预处理后的数据集分为训练集和测试集两部分;第3步、将训练集中的数据输入硬聚类算法(Hard Clustering Method,简称HCM)得到模糊规则库中所有模糊规则的前提;第4步、通过最小二乘法(Ordinary Least Square,简称OLS)估计多项式系数获得模糊规则库中所有模糊规则的结论;第5步、对于测试集中的数据,根据构造出的模糊规则库,对数据进行识别,并输出结果。2.根据权利要求1所述的信息分类模糊模型的网络入侵检测分类方法,其特征在于:第1步中所述的设计多项式模糊模型的表示形式具体过程如下:给定一个多项式模糊模型包含n条模糊规则,则它的模糊规则库的表示形式如下:R1:if x1is A1then z1=f1(x1)R2:if x2is A2then z2=f2(x2)
……
R
n
:if x
n
is A
n
then z
n
=f
n
(x
n
)其中,R
i
(i=1,2,...,n)表示第i条模糊规则,n表示模糊规则的总数;数据集X={x1,x2,...,x
m
},x
i
表示第i行输入数据;A
i
(i=1,2,...,n)为第i个模糊集(或输入变量的分类中心点),f
i
(x
i
)第i行输入数据,第i条模型规则的输出多项式,z
i
是第i条模型规则的输出多项式;模型的最终输出多项式表达式z=f(x1,x2,...,x
n
)(i=1,2,...,n)的类型如下:f=a
j0
+a
j1
(x
1-v
1j
)+

+a
ji
(x
i-v
ij
)+a
j(i+1)
(x
1-v
1j
)2+

+a
j(2i)
(v
i-v
ij
)2其中f(x1,x2,...,x
n
)表示所有输入数据的模型规则的输出多项式,a
ji
表示第j行第i列输入数据的系数。v
ij
表示第i个聚类中心第j个输入变量的中心点,它的具体值是通过第3.2步硬聚类算法(Hard Clustering Method,简称HCM)获得的。3.根据权利要求1所述的信息分类模糊模型的网络入侵检测分类方法,其特征在于:第2步中所述的数据预处理的方法是:第2.1步、数值标准化:将10%KDDCup99原始数据集中的每条记录中的文本类型,转换成数值类型;第2.2步、将标准化后的数据集,按8∶2比例进行划分:随机选择80%的数据作为训练集,剩下的20%作为测试集。4.根据权利要求1所述的信息分类模糊模型的网络入侵检测分类方法,其特征在于:第3步中所述的硬聚类算法(Hard Clustering Method,简称HCM)得到模糊规则库中所有模糊规则的前提具体过程如下:第3.1步、选择模糊模型的输入变量x
i
(i=1,2,...,m,m<=N),其中N是系统输入变量的最大个数(数据集中输入变量的总个数),x

【专利技术属性】
技术研发人员:王丹熊聪聪张贤坤
申请(专利权)人:天津科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1