网络数据入侵检测方法、系统、终端及存储介质技术方案

技术编号:24517882 阅读:18 留言:0更新日期:2020-06-17 06:53
本发明专利技术提供一种网络数据入侵检测方法、系统、终端及存储介质,包括:采集网络传输数据作为样本数据并将所述样本数据划分为多组,所述网络传输数据包括正常数据和入侵数据;利用FCBF算法去除各组内与预设目标类别不相关的冗余特征,将去除冗余特征的数据组作为亲系集合;对亲系集合进行单点遗传交叉处理,从亲系集合和遗传的子系集合中筛选出与目标类别相关度最高的初始集合;利用遗传变异算法计算所述初始集合的变异集合,并通过比对初始集合与目标类别的相关性和变异集合与目标类别的相关性,迭代筛选出与目标类别相关度最高的数据集合;将所述与目标类别相关度最高的数据集合作为特征子集,根据特征子集对网络传输数据进行特征提取和特征检测。

Network data intrusion detection method, system, terminal and storage medium

【技术实现步骤摘要】
网络数据入侵检测方法、系统、终端及存储介质
本专利技术涉及网络入侵检测
,具体涉及一种网络数据入侵检测方法、系统、终端及存储介质。
技术介绍
随着大数据和云计算的迅速发展,网络入侵手段呈现隐蔽性、静默性的特点,人们对于网络安全的需求日益增加。但随着数据量的增加,主流的网络入侵模型进行入侵识别效率越来越低下。因为这些数据不仅规模庞大,而且维度较高,存在着大量的冗余信息,这些无关的信息会极大降低入侵检测的效果。特征选择是解决这种问题的一种有效手段,良好的特征选择算法可以有效的剔除分类数据中存在的冗余特征或噪声数据,提升入侵检测的速度和准确度。因此性能稳健的特征选择算法对入侵检测的识别是非常重要的。FCBF算法是特征选择算法中的典型算法,该方法主要包括两个步骤:去除不相干的特征、采用顺序前向搜索算法去除冗余特征。FCBF算法设置阈值,认为特征与类的相关性低于阈值的特征所在位置的相关性为不相干的特征,因此去除不相干的特征可以极大的降低数据的维度。剩下的相关特征采用顺序前向搜索的算法剔除特征子集中的冗余特征,从而得到最终的特征子集。采用FCBF的算法主要存在的问题是:FCBF特征选择算法在进行特征选择时,把所有的样本同时进行计算,从而得到最终的特征子集。特征选择的过程只执行一次,这种方式得到的特征子集对当前所有样本在特定的评估准则下是有效的。但这种方式得到特征子集容易出现过拟合的情况,一旦样本集合发生变动,特征子集也将不适用新的样本集合,采用原有的特征子集进行分类会导致分类正确率降低。r>
技术实现思路
针对现有技术的上述不足,本专利技术提供一种网络数据入侵检测方法、系统、终端及存储介质,以解决上述技术问题。第一方面,本专利技术提供一种网络数据入侵检测方法,包括:采集网络传输数据作为样本数据并将所述样本数据划分为多组,所述网络传输数据包括正常数据和入侵数据;利用FCBF算法去除各组内与预设目标类别不相关的冗余特征,将去除冗余特征的数据组作为亲系集合;对亲系集合进行单点遗传交叉处理,从亲系集合和遗传的子系集合中筛选出与目标类别相关度最高的初始集合;利用遗传变异算法计算所述初始集合的变异集合,并通过比对初始集合与目标类别的相关性和变异集合与目标类别的相关性,迭代筛选出与目标类别相关度最高的数据集合;将所述与目标类别相关度最高的数据集合作为特征子集,根据所述特征子集对网络传输数据进行特征提取和特征检测。进一步的,所述利用FCBF算法去除各组内与预设目标类别不相关的冗余特征,包括:计算各组内数据特征与目标类别的相关度,其中相关度等于两倍的数据特征与目标类别之积除以数据特征信息熵与目标类别信息熵之和;将相关度低于预设相关阈值的特征所属数据删除;将与同组其他数据特征的相关度超过与目标类别相关度的特征数据删除。进一步的,所述对亲系集合进行单点遗传交叉处理,从亲系集合和遗传的子系集合中筛选出与目标类别相关度最高的初始集合,包括:将多个亲系集合两两进行单点交叉处理,得到多个子系集合;分别计算所有亲系集合和子系集合与目标类别的相关度;筛选出预设亲系数量的相关度最高的集合作为下代亲系集合,并删除其他集合;循环执行对最新代的亲系集合的单点交叉处理和筛选迭代直至迭代次数达到预设遗传次数;从当前所有集合中选取与目标类别相关度最高的集合作为初始集合。进一步的,所述利用遗传变异算法计算所述初始集合的变异集合,包括:随机生成变异的数据位置;根据所述数据位置将初始集合中的相应数据删除,将剩余数据集合作为变异集合。进一步的,所述通过比对初始集合与目标类别的相关性和变异集合与目标类别的相关性迭代筛选出与目标类别相关度最高的数据集合,包括:比对初始集合与目标类别的相关性和变异集合与目标类别的相关性,将与目标类别相关性较高的的集合作为新一代初始集合;循环对新的初始集合的遗传变异处理和筛选直至变异处理次数达到预设变异次数;将最终变异筛选处理得到的与目标类型相关度最高的集合输出。第二方面,本专利技术提供一种网络数据入侵检测系统,包括:数据分组单元,配置用于采集网络传输数据作为样本数据并将所述样本数据划分为多组,所述网络传输数据包括正常数据和入侵数据;冗余去除单元,配置用于利用FCBF算法去除各组内与预设目标类别不相关的冗余特征,将去除冗余特征的数据组作为亲系集合;交叉遗传单元,配置用于对亲系集合进行单点遗传交叉处理,从亲系集合和遗传的子系集合中筛选出与目标类别相关度最高的初始集合;变异遗传单元,配置用于利用遗传变异算法计算所述初始集合的变异集合,并通过比对初始集合与目标类别的相关性和变异集合与目标类别的相关性,迭代筛选出与目标类别相关度最高的数据集合;特征检测单元,配置用于将所述与目标类别相关度最高的数据集合作为特征子集,根据所述特征子集对网络传输数据进行特征提取和特征检测。进一步的,所述冗余去除单元包括:相关计算模块,配置用于计算各组内数据特征与目标类别的相关度,其中相关度等于两倍的数据特征与目标类别之积除以数据特征信息熵与目标类别信息熵之和;数据删除模块,配置用于将相关度低于预设相关阈值的特征所属数据删除;相似排查模块,配置用于将与同组其他数据特征的相关度超过与目标类别相关度的特征数据删除。进一步的,所述交叉遗传单元包括:单点交叉模块,配置用于将多个亲系集合两两进行单点交叉处理,得到多个子系集合;相关获取模块,配置用于分别计算所有亲系集合和子系集合与目标类别的相关度;相关筛选模块,配置用于筛选出预设亲系数量的相关度最高的集合作为下代亲系集合,并删除其他集合;交叉迭代模块,配置用于循环执行对最新代的亲系集合的单点交叉处理和筛选迭代直至迭代次数达到预设遗传次数;初始选取模块,配置用于从当前所有集合中选取与目标类别相关度最高的集合作为初始集合。第三方面,提供一种终端,包括:处理器、存储器,其中,该存储器用于存储计算机程序,该处理器用于从存储器中调用并运行该计算机程序,使得终端执行上述的终端的方法。第四方面,提供了一种计算机存储介质,所述计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述各方面所述的方法。本专利技术的有益效果在于,本专利技术提供的网络数据入侵检测方法、系统、终端及存储介质,通过结合FCBF算法与遗传算法,在利用FCBF算法对数据集合去冗余后,采用交叉遗传方法产生初始特征子集,进一步采用遗传变异方法对初始特征子集进行迭代筛选,产生最终的数据集合。本专利技术能够在不降低特征选择速度的基础上,降低特征子集过拟合的情况,从而提高入侵检测的准确性。此外,本专利技术设计原理可靠,结构简单,具有非常广泛的应用前景。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将本文档来自技高网...

【技术保护点】
1.一种网络数据入侵检测方法,其特征在于,包括:/n采集网络传输数据作为样本数据并将所述样本数据划分为多组,所述网络传输数据包括正常数据和入侵数据;/n利用FCBF算法去除各组内与预设目标类别不相关的冗余特征,将去除冗余特征的数据组作为亲系集合;/n对亲系集合进行单点遗传交叉处理,从亲系集合和遗传的子系集合中筛选出与目标类别相关度最高的初始集合;/n利用遗传变异算法计算所述初始集合的变异集合,并通过比对初始集合与目标类别的相关性和变异集合与目标类别的相关性,迭代筛选出与目标类别相关度最高的数据集合;/n将所述与目标类别相关度最高的数据集合作为特征子集,根据所述特征子集对网络传输数据进行特征提取和特征检测。/n

【技术特征摘要】
1.一种网络数据入侵检测方法,其特征在于,包括:
采集网络传输数据作为样本数据并将所述样本数据划分为多组,所述网络传输数据包括正常数据和入侵数据;
利用FCBF算法去除各组内与预设目标类别不相关的冗余特征,将去除冗余特征的数据组作为亲系集合;
对亲系集合进行单点遗传交叉处理,从亲系集合和遗传的子系集合中筛选出与目标类别相关度最高的初始集合;
利用遗传变异算法计算所述初始集合的变异集合,并通过比对初始集合与目标类别的相关性和变异集合与目标类别的相关性,迭代筛选出与目标类别相关度最高的数据集合;
将所述与目标类别相关度最高的数据集合作为特征子集,根据所述特征子集对网络传输数据进行特征提取和特征检测。


2.根据权利要求1所述的方法,其特征在于,所述利用FCBF算法去除各组内与预设目标类别不相关的冗余特征,包括:
计算各组内数据特征与目标类别的相关度,其中相关度等于两倍的数据特征与目标类别之积除以数据特征信息熵与目标类别信息熵之和;
将相关度低于预设相关阈值的特征所属数据删除;
将与同组其他数据特征的相关度超过与目标类别相关度的特征数据删除。


3.根据权利要求1所述的方法,其特征在于,所述对亲系集合进行单点遗传交叉处理,从亲系集合和遗传的子系集合中筛选出与目标类别相关度最高的初始集合,包括:
将多个亲系集合两两进行单点交叉处理,得到多个子系集合;
分别计算所有亲系集合和子系集合与目标类别的相关度;
筛选出预设亲系数量的相关度最高的集合作为下代亲系集合,并删除其他集合;
循环执行对最新代的亲系集合的单点交叉处理和筛选迭代直至迭代次数达到预设遗传次数;
从当前所有集合中选取与目标类别相关度最高的集合作为初始集合。


4.根据权利要求1所述的方法,其特征在于,所述利用遗传变异算法计算所述初始集合的变异集合,包括:
随机生成变异的数据位置;
根据所述数据位置将初始集合中的相应数据删除,将剩余数据集合作为变异集合。


5.根据权利要求1所述的方法,其特征在于,所述通过比对初始集合与目标类别的相关性和变异集合与目标类别的相关性迭代筛选出与目标类别相关度最高的数据集合,包括:
比对初始集合与目标类别的相关性和变异集合与目标类别的相关性,将与目标类别相关性较高的的集合作为新一代初始集合;
循环对新的初始集合的遗传变异处理和筛选直至变异处理...

【专利技术属性】
技术研发人员:闫利华
申请(专利权)人:苏州浪潮智能科技有限公司
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1