当前位置: 首页 > 专利查询>浙江大学专利>正文

基于支持向量机简化算法的网络入侵检测系统技术方案

技术编号:3862546 阅读:187 留言:0更新日期:2012-04-11 18:40
本发明专利技术一种基于支持向量机简化算法的网络入侵检测系统,该系统由顺次连接的网络数据捕获及提取模块、网络数据预处理模块、检测模块以及输出与响应模块组成,所述检测模块为精简SVM分类器,所述精简SVM分类器的判定函数为:f(x)=sgn(*α↓[i]y↓[i]k(x↓[i],x)+b),其中(x↓[i],y↓[i]),i=1,...,Ns就是所谓的支持向量,它们对应的拉格朗日乘子α↓[i]大于零,x为待分类的向量,Ns为支持向量的数量,b为偏置。该系统通过约简支持向量提高了SVM分类器的分类速度,从而使得基于此精简支持向量机的网络入侵检测系统的实时响应能力得到极大提高,同时保证系统比较低的误检率和漏检率。

【技术实现步骤摘要】

本专利技术涉及 一种网络入侵检测系统,尤其涉及一种基于支持向量机简化算 法的网络入侵检测系统。 背景纟支术入侵检测顾名思义,便是对入侵行为的发觉,它是为保证计算机系统的安 全而设计与配置的一种能够及时发现并报告系统中未授权或异常现象的技术。 网络入侵检测所处理的数据是由多类攻击数据和正常数据构成的,因此网络入 侵检测可以看作一个多分类问题。入侵检测系统的关键在于正常和异常行为模 式库的建立。建立行为系统的方法主要有神经网络、数据挖掘等。这些方法有 一个共同特点,就是所需要的训练数据量大,然而在入侵检测领域中能够获得 的数据常常呈现出多变性、高维性和小样本,不能满足传统的统计方法的前提 条件,以致误检率和漏检率都比较高。支持向量机(Support Vector Machine ,SVM)和核学习方法主要用于解决有 限样本学习问题,而且对数据的维度和多变性不敏感,具有较好的分类精度和 泛化能力,因此,它们被广泛应用于入侵检测系统,并取得了良好的检测效果。然而,SVM分类器的分类速度取决于支持向量的数目,如果支持向量数目 很大,分类器的分类速度会很慢。对于入侵检测这种实时性要求极高的系统, 緩慢的检测速度将极大地影响其性能,使其不能及时地;险测攻击并作出响应。因此,需要一种分类速度快同时误检率和漏检率都比较低的网络入侵检测 系统,以保证网络的正常使用。
技术实现思路
为克服现有技术的上述缺陷,本专利技术基于支持向量机简化算法的网络入侵检测系统提出 一种基于SVM简化算法网络入侵冲企测系统,通过约简支持向量提 高了 SVM分类器的分类速度,同时基于此精简支持向量机的网络入侵检测系统 的实时响应能力得到极大提高。为实现上述技术目的,本专利技术采用的技术方案如下一种基于支持向量机简化算法的网络入侵检测系统,该系统由顺次连接的网 络数据捕获及提取模块、网络数据预处理模块、检测模块以及输出与响应模块 组成,所述检测模块为精简SVM分类器,所述精简SVM分类器的判定函数为 /("=柳(|>,.#0^;)+6) (1),其中(Xi, yi), i = l,..., Ns就是所谓的支持向量,它们对应的拉格朗日乘子"'大于零,x为待分类的向量,Ns为支持向量的 数量,b为偏置。本专利技术基于支持向量才几筒化算法的网络入侵;险测系统与现有技术相比,具 有如下有益效果该系统通过约简支持向量提高了 SVM分类器的分类速度,基 于此精简支持向量机的网络入侵检测系统的实时响应能力得到了极大提高。 附图说明图1是本专利技术基于支持向量机简化算法的网络入侵检测系统的框图。 具体实施例方式以下结合附图对本专利技术基于支持向量机简化算法的网络入侵检测系统作进 一步描述。本专利技术基于支持向量机简化算法的网络入侵检测系统,该系统由顺次连接 的网络数据捕获及提取模块、网络数据预处理模块、检测模块以及输出与响应 模块组成,所述检测模块为精简SVM分类器,所述精简SVM分类器的判定函数 为/ =柳(|>,.#0^;)+^(1),其中(A, yi), i = l,..., Ns就是所谓的支持向量,它们对应的拉;格朗日乘子"'大于零,X为待分类的向量,Ns为支持向量的数量,b为偏置。为描述方便起见,本专利技术中将类别信息集成进Lagrange乘子"'中,下文的 所有"'都采用了类似处理,相应地,(l)式这个判定函数变更为 (2)此时的"'为不等于零的数。从(2)式可以看出,判定一个未知类别的样本所 需要的时间和支持向量的数目成正比,因此,削减支持向量的数量能够有效地 提高分类机的分类速度。SVM分类器训练所得的最优分类超平面所对应的向量w在形式上表示为所有支持向量在特征空间中的线性组合W = U°^(X')( 3 )本专利技术中SVM简化法试图采用 一个约简的向量集来代替原有的支持向量集『、' (4)其中"'…, ^^就是约简向量集,A"为约简向量Z'所对应的权值,Wz为约简向量集所包含的向量个数,并且~<&。这样,可以用浙代替w来判定未知类别的 向量x,此时,SVM的判定函数形式如下/(x) = sgn(2AWz;,x) + 6)w (5)SVM简化法的目标就是在尽量减小分类精度损失的前提下,寻找最小的 礼=W和对应的约简向量集,形成一个精简的SVM分类器来提高分类速度。在削减支持向量数目时,首先构造一个新的约简向量及其对应权值",^来近 似(3)式中的向量w,接着迭代地构建^+"U来近似向量 , 的形式如下2 ,伊")-£她) (6)由于不可能精确地找到向量zm和对应权值A使向量^为零。所以只能通过 非线性优化来寻找最小的s , 5的形式如下式所示3氛—广/ ,(z』12 (7) 对于某些特殊的核函数如高斯核函数,SVM分类器采用不动点迭代法来寻找 约筒向量z,设(7)式导数为零,求约简向量z的迭代公式如下式所示laiexp(-"广zj卩/(2f7、 (8)假设简化前后SVM分类器的支持向量分别为Ns, Nz,以核函数的计算次数来 度量,则原始SVM分类器预测一样本的时间复杂度为O(Ns),精简SVM分类器对 应的时间复杂度为0(NZ),由于^= w.s.,所以精筒SVM分类器比原始SVM分类器 具有更低的分类复杂度。本专利技术采用的KDD CUP 1999作为实验数据集。该数据集是Wenke Lee等人 在1998年美国国防部高级研究计划局(DARPA)作IDS评测时所获得数据^5出上 恢复出来的连接信息。这批数据总共包含7个星期的网络流量,大约有500万 条连接记录。由于原始数据集过于庞大,所以只有两个具有代表性的数据集被 选取作为实验数据集, 一个名为10Percent (训练集),包含494, 020条记录, 另一个名为Correct (测试集),包含311, 029条记录。入侵;险测训练集包含正常网络流量数据和22个攻击类别,测试集除正常流 量数据外还包含38个攻击类型。本实验将这两个数据集按照大的类型划分成5 类,形成新的训练集和测试集。入侵检测训练和测试集的具体描述如表l所示。表1入侵检测数据集的训练及测试数据描述类型名称类标记训练记录数测试记录数Normal197,27760,593Probe24,1074,166DOS3391,458229,851U2R452230R2L51,12616,189入侵检测数据集包含了 7个符号属性,而支持向量机只能处理数值属性, 因此必须将符号属性转换为数值属性。转换方法如下首先创建一个全为0的数值序列,序列的长度等于该属性的取值种类并且序列中每个数和该字符 属性的每一取值——对应,如果某条记录该属性取某个值,则数值序列中对应 的数的值置为l,其余仍为0,此时该序列可看作一二进制值,对应十进制值即 为所求数值。处理完符号属性后将所有的属性值都规j各化到区间。对数据进行适当预处理后,选择LIBSVM作为标准的SVM训练算法。核函数 采用高斯核函数,惩罚算子C及核函数参数都是采用LIBSVM在实验数据集一随 机抽取的子集上10次交叉测试所得结果的最优值。实验结果如表2所示,其中第1行为不同的约简率,2—4行对应5类问题 的精简SVM分类器的支持向量数、在测试集上的错误率和测试时间。其中第二 列三本文档来自技高网...

【技术保护点】
一种基于支持向量机简化算法的网络入侵检测系统,其特征在于:该系统由顺次连接的网络数据捕获及提取模块、网络数据预处理模块、检测模块以及输出与响应模块组成,所述检测模块为精简SVM分类器,所述精简SVM分类器的判定函数为:f(x)=sgn(*α↓[i]y↓[i]k(x↓[i,x)+b) (1),其中(x↓[i],y↓[i]),i=1,...,Ns就是所谓的支持向量,它们对应的拉格朗日乘子α↓[i]大于零,x为待分类的向量,Ns为支持向量的数量,b为偏置。

【技术特征摘要】

【专利技术属性】
技术研发人员:吴群曾志强吴剑锋柴春雷
申请(专利权)人:浙江大学
类型:发明
国别省市:86[中国|杭州]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利