基于随机森林算法的网络入侵检测系统技术方案

技术编号:36384207 阅读:27 留言:0更新日期:2023-01-18 09:46
本发明专利技术公开了一种基于随机森林算法的网络入侵检测系统,属于网络安全技术领域,该系统包括预处理单元,用于获取网络攻击数据,并对其进行预处理,提取网络攻击数据的特征;还包括标签对照单元,用于存储更新个子数据集的特征标签数据,接收实时的测试数据的特征标签,并对测试数据的特征标签与子数据集的特征标签进行对照分析,获取两者的重合度。相较于现有技术中的测试方法,能够对不同类型的网络攻击数据进行分别处理,简化数据处理模型中树的数量,提升处理效率,并且能够对测试数据进行初步的识别,避免大量数据一一被导入网络入侵检测模型中进行测试过程,从而进一步有效的提升了数据处理效率。提升了数据处理效率。

【技术实现步骤摘要】
基于随机森林算法的网络入侵检测系统


[0001]本专利技术属于网络安全
,具体的,涉及一种基于随机森林算法的网络入侵检测系统。

技术介绍

[0002]随着现代网络技术的快速发展,网络入侵带来的风险与损失也在逐渐变大,为了保护网络信息安全,对网络入侵进行检测是一项非常重要的技术,其能够降低网络入侵带来的损失,有利于网络安全性的提升。
[0003]现有技术中,影响网络入侵检测的关键因素是检测效率与检测的准确率,如何提升网络入侵检测的效率与准确率是目前网络安全技术的重要研究项目,为了解决上述问题,提供一种在保证检测准确率的同时能够显著提升网络检测效率的方法,本专利技术提供了以下技术方案。

技术实现思路

[0004]本专利技术的目的在于提供一种基于随机森林算法的网络入侵检测系统,解决现有技术中网络检测效率与网络入侵检测准确度难以兼顾,影响网络安全准确性的问题。
[0005]本专利技术的目的可以通过以下技术方案实现:
[0006]基于随机森林算法的网络入侵检测系统,包括:
[0007]预处理单元,用于获取网络攻击数据,并对其进行预处理,提取网络攻击数据的特征;
[0008]标签对照单元,用于存储更新个子数据集的特征标签数据,还用于接收实时的测试数据的特征标签,并对测试数据的特征标签与子数据集的特征标签进行对照分析,获取两者的重合度;
[0009]上述的基于随机森林算法的网络入侵检测系统的工作方法包括步骤:
[0010]第一步,通过预处理单元获取最近的Z个网络攻击数据,并将采集的网络攻击数据作为训练集,提取其中的特征后,根据特征不同生成若干个子数据集;
[0011]第二步,利用随机森林模型对将上一步骤中处理得到的若干个子数据集分别进行训练,从而得到对应的若干个网络入侵检测模型;
[0012]第三步,将目标数据输入上一步骤中得到的对应网络入侵检测模型中对应的网络入侵检测模型进行网络入侵检测。
[0013]作为本专利技术的进一步方案,第三步中将目标数据输入上一步骤中得到的对应网络入侵检测模型中对应的网络入侵检测模型进行网络入侵检测的具体方法为:首先确定测试数据所对应的网络入侵检测模型,然后将测试数据导入对应的网络入侵检测模型中进行测试,网络入侵检测模型预测其召回率与准确率,然后再根据召回率与准确率判断是否存在网络入侵。
[0014]作为本专利技术的进一步方案,第二步与第三步中确定测试数据所对应网络入侵检测
模型的方法为:
[0015]S1、将若干个子数据集依次标记为S1、S2、
……
、Sk,其中k为子数据集的数量;
[0016]S2、获取各子数据集的特征标签,并将获取的特征标签存储至标签对照单元;
[0017]S3、当导入测试数据时,获取测试数据的特征标签,将该特征标签导入标签对照单元进行对比,获取测试数据与各子数据集特征标签的重合度C,所述重合度C的计算方法为C=C1/C2,其中C1为测试数据与各子数据集特征标签的重合数量,C2为测试数据中的特征标签的数量;
[0018]S4、根据公式P=|C

1|计算得到重合偏差值P,从而获取各子数据集与测试数据之间的重合偏差值P,将各子数据集对应的重合偏差度按照从小到大的顺序进行排序,从而得到P1、P2、
……
、Pk;
[0019]若P1≥Py,则认为对应测试数据不存在网络入侵,Py为预设值。
[0020]作为本专利技术的进一步方案,若P1<Py,则按照P1至Pk的顺序选用对应子数据集对应的网络入侵检测模型来对测试数据进行测试,直至根据计算得到的召回率与准确率判断对应测试数据不存在网络入侵或者
[0021]测试所用网络入侵检测模型对应的Pk1≥Py成立时或者
[0022]根据计算得到的召回率与准确率判断对应测试数据存在网络入侵时,停止测试过程。
[0023]作为本专利技术的进一步方案,所述Py取值为40%。
[0024]本专利技术的有益效果:
[0025](1)本专利技术相较于现有技术中的测试方法,能够对不同类型的网络攻击数据进行分别处理,简化数据处理模型中树的数量,提升处理效率,并且能够对测试数据进行初步的识别,避免大量数据一一被导入网络入侵检测模型中进行测试过程,从而进一步有效的提升了数据处理效率。
具体实施方式
[0026]下面将对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本专利技术保护的范围。
[0027]基于随机森林算法的网络入侵检测系统,包括:
[0028]预处理单元,用于获取网络攻击数据,并对其进行预处理,提取网络攻击数据的特征;
[0029]标签对照单元,用于存储更新个子数据集的特征标签数据,还用于接收实时的测试数据的特征标签,并对测试数据的特征标签与子数据集的特征标签进行对照分析,获取两者的重合度;
[0030]上述的基于随机森林算法的网络入侵检测系统的工作方法包括步骤:
[0031]第一步,通过预处理单元获取最近的Z个网络攻击数据,并将采集的网络攻击数据作为训练集,提取其中的特征后,根据特征不同生成若干个子数据集;
[0032]第二步,利用随机森林模型对将上一步骤中处理得到的若干个子数据集分别进行
训练,从而得到对应的若干个网络入侵检测模型;
[0033]第三步,将目标数据输入上一步骤中得到的若干个网络入侵检测模型中对应的网络入侵检测模型进行网络入侵检测;
[0034]具体的,首先确定测试数据所对应的网络入侵检测模型,然后将测试数据导入上一步骤中得到的对应的网络入侵检测模型中进行测试,网络入侵检测模型预测其召回率与准确率,然后再根据召回率与准确率判断是否存在网络入侵。
[0035]在本专利技术的一个实施例中,第二步与第三步中确定测试数据所对应网络入侵检测模型的方法为:
[0036]S1、将若干个子数据集依次标记为S1、S2、
……
、Sk,其中k为子数据集的数量,获取各子数据集中网络攻击数据的数量,进而获取各子数据集中网络攻击数据的数量占据网络攻击数据总量Z的百分比B,将其依次表示为B1、B2、
……
、Bk;
[0037]S2、获取各子数据集的特征标签,并将获取的特征标签存储至标签对照单元,需要注意的是,各子数据集的特征标签可以重复,且一个子数据集具有多个特征标签;
[0038]S3、当导入测试数据时,获取测试数据的特征标签,将该特征标签导入标签对照单元进行对比,获取测试数据与各子数据集特征标签的重合度C,所述重合度C的计算方法为C=C1/C2,其中C1为测试数据与各子数据集特征标签的重合数量,C2为测试数据中的特征标签的数量;
[0039]S4、根据公式P=|C
本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.基于随机森林算法的网络入侵检测系统,其特征在于,包括:预处理单元,用于获取网络攻击数据,并对其进行预处理,提取网络攻击数据的特征;标签对照单元,用于存储更新个子数据集的特征标签数据,还用于接收实时的测试数据的特征标签,并对测试数据的特征标签与子数据集的特征标签进行对照分析,获取两者的重合度;上述的基于随机森林算法的网络入侵检测系统的工作方法包括步骤:第一步,通过预处理单元获取最近的Z个网络攻击数据,并将采集的网络攻击数据作为训练集,提取其中的特征后,根据特征不同生成若干个子数据集;第二步,利用随机森林模型对将上一步骤中处理得到的若干个子数据集分别进行训练,从而得到对应的若干个网络入侵检测模型;第三步,将目标数据输入上一步骤中得到的对应网络入侵检测模型中对应的网络入侵检测模型进行网络入侵检测。2.根据权利要求1所述的基于随机森林算法的网络入侵检测系统,其特征在于,第三步中将目标数据输入上一步骤中得到的对应网络入侵检测模型中对应的网络入侵检测模型进行网络入侵检测的具体方法为:首先确定测试数据所对应的网络入侵检测模型,然后将测试数据导入对应的网络入侵检测模型中进行测试,网络入侵检测模型预测其召回率与准确率,然后再根据召回率与准确率判断是否存在网络入侵。3.根据权利要求2所述的基于随机森林算法的网络入侵检测系统,其特征在于,第二步与第三步中确定测试数据所对应网络入侵检测模型的方法为:S...

【专利技术属性】
技术研发人员:杨开敏邵梅何静
申请(专利权)人:安徽智立通科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1