本发明专利技术属于网络安全技术领域,公开了一种入侵流量检测方法、装置、设备及存储介质;该方法包括:对待识别流量特征提取得到初始特征,通过归因法对初始特征分类得到含有多个初始特征的决策树;根据决策树特征提取得到待识别特征;将待识别特征输入预设特征识别模型得到多个初始识别结果;根据预设特征识别模型的参考权重对所述初始特征识别结果分析得到待识别流量的流量类别;本发明专利技术通过对待识别流量分类后特征提取得到更能够代表该类流量的特征,再根据预先训练好的多个同质集成算法对该特征进行种类识别,并更根据优化后的权重从多个识别结果中得到更加准确的待识别流量的类别,解决了无法快速从大量流量中快速、准确识别入侵流量的问题。侵流量的问题。侵流量的问题。
【技术实现步骤摘要】
入侵流量检测方法、装置、设备及存储介质
[0001]本专利技术涉及网络安全
,尤其涉及一种入侵流量检测方法、装置、设备及存储介质。
技术介绍
[0002]网络技术的飞速发展,为当今社会的各个领域发展提供了巨大动力。信息基础设施面临着网络中的大量威胁,我国的信息安全体系形势严峻,存在网络攻击告警、侦测、防范和响应等多方面的问题,互联网中存在的安全漏洞是导致网络安全问题的关键因素之一。网络安全隐患逐渐增多的同时,入侵检测的规模也越来越大。相关的技术和方法层出不穷百花齐放。早期的网络安全产品,例如:防火墙,它作为守护网络的壁垒一般通过访问控制表只能阻止少数外部入侵攻击。它本身的作用也很有限,由于防御功能比较单一,弱点和缺陷也比较多,这些弱点经常被当作入侵的切入点,也就是我们常说的漏洞。即便是通过防火墙,攻击者也经常能想办法绕过它来非法进入使用网络。被攻击的系统却毫不知情,一旦自身网络被攻破很可能造成企业机密被不法分子窃取,企业网络遭到破坏,而这些数据损失往往难以用普通的经济损失来衡量。
[0003]尽管网络中存在海量高速流转的流量,利用入侵检测技术鉴别区分良性流量和恶意流量,这正是该领域的前人学者们通过不断努力研究的成果。然而目前亟待解决的问题是如何更好地提高入侵检测精度、降低冗长的运行时间和捕获攻击的实时性,这些需要我们更加明确方向研究来一一解决。
[0004]上述内容仅用于辅助理解本专利技术的技术方案,并不代表承认上述内容是现有技术。
技术实现思路
[0005]本专利技术的主要目的在于提供一种入侵流量检测方法,旨在解决现有技术无法快速从大量流量中快速、准确识别入侵流量的技术问题。
[0006]为实现上述目的,本专利技术提供了一种入侵流量检测方法,所述方法包括以下步骤:
[0007]对待识别流量进行特征提取得到初始特征,通过归因法对所述初始特征进行分类得到含有多个初始特征的决策树;
[0008]根据所述决策树进行特征提取,得到待识别特征;
[0009]将所述待识别特征输入预设特征识别模型得到多个初始识别结果;
[0010]根据所述预设特征识别模型的参考权重对所述初始特征识别结果进行分析得到所述待识别流量的流量类别。
[0011]可选地,所述根据所述决策树进行特征提取,得到待识别特征,包括:
[0012]计算每个决策树中初始特征的有效占比以及所述初始特征的基尼指数;
[0013]根据所述有效占比和所述基尼指数对所述决策树中的初始特征进行排序得到初始特征序列表;
[0014]根据所述初始特征序列表得到代表所述待识别流量的待识别特征。
[0015]可选地,所述将所述待识别特征输入预设特征识别模型得到多个初始识别结果之前,还包括:
[0016]获取原数据集;
[0017]对所述原数据集进行分类得到不同类别的数据集,对所述原数据集进行特征提取,得到带有类别标签的样本特征;
[0018]根据所述样本特征对同质集成算法进行训练得到训练后的预设特征识别模型,所述同质集成算法包括随机森林算法、决策树算法、极端随机数算法。
[0019]可选地,所述对所述原数据集进行分类得到不同类别的数据集,对所述原数据集进行特征提取得到带有类别标签的样本特征,包括:
[0020]从原始数据集中随机抽取预设个数的初始数据集,去除所述初始数据集中的错误样本数据得到初始样本数据集,将所述样本数据集中的数据格式同一化得到样本数据集;
[0021]根据所述样本数据集中的最大值和最小值对样本数据集进行线性变换得到参考数据集;
[0022]将所述参考数据集中的数据类别转化为数字标签得到带有类别标签的标签数据集;
[0023]对所述标签数据集进行综合采样得到采样后的标签数据集,对所述标签数据集中的样本数据进行特征降维,得到样本特征。
[0024]可选地,所述对所述标签数据集进行综合采样得到采样后的标签数据集,对所述标签数据集中的样本数据进行特征降维,得到样本特征,包括:
[0025]根据所述标签数据集得到差值样本,计算所述差值样本之间的欧式距离;
[0026]根据所述欧式距离得到所述差值样本预设个数的最近邻,根据所述最近邻生成新的样本数据;
[0027]将所述新的样本数据加入标签数据集中得到新的标签数据集;
[0028]删除所述新的标签数据集中的欠拟合差值样本,得到采样后的标签数据集;
[0029]对所述标签数据集中的样本数据进行特征降维,得到样本特征。
[0030]可选地,所述根据所述预设特征识别模型的参考权重对所述初始特征识别结果进行分析得到所述待识别流量的流量类别之前,还包括:
[0031]通过多项式回归算法计算所述预设特征识别模型对所述原数据集的分类概率;
[0032]将所述分类概率和所述原始数据的真实类别输入对数损失函数,计算所述损失函数的最小值;
[0033]通过预设算法计算所述最小值对应的权重,将所述权重作为参考权重。
[0034]可选地,所述通过预设算法计算所述最小值对应的权重,将所述权重作为参考权重,包括:
[0035]根据原数据集数据总数以及损失函数计算得到误差函数;
[0036]根据随机权重以及所述误差函数计算雅克比矩阵以及误差值,根据所述雅克比矩阵以及误差值计算得到权重增量;
[0037]当所述权重增量大于预设阈值时,则根据所述随机权重以及所述权重增量计算得到新的随机权重;
[0038]当所述权重增量小于预设阈值时,则根据所述随机权重以及所述权重增量计算得到参考权重。
[0039]此外,为实现上述目的,本专利技术还提出一种入侵流量检测装置,所述入侵流量检测装置包括:
[0040]特征识别模块,用于对待识别流量进行特征提取得到初始特征,通过归因法对所述初始特征进行分类得到含有多个初始特征的决策树;
[0041]所述特征识别模块,还用于根据所述决策树进行特征提取,得到待识别特征;
[0042]流量检测模块,用于将所述待识别特征输入预设特征识别模型得到多个初始识别结果;
[0043]所述流量检测模块,还用于根据所述预设特征识别模型的参考权重对所述初始特征识别结果进行分析得到所述待识别流量的流量类别。
[0044]此外,为实现上述目的,本专利技术还提出一种入侵流量检测设备,所述入侵流量检测设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的入侵流量检测程序,所述入侵流量检测程序配置为实现如上文所述的入侵流量检测方法的步骤。
[0045]此外,为实现上述目的,本专利技术还提出一种存储介质,所述存储介质上存储有入侵流量检测程序,所述入侵流量检测程序被处理器执行时实现如上文所述的入侵流量检测方法的步骤。
[0046]本专利技术通过对待识别流量分类后特征提取得到更能够代表该类流量的特征,再根据预先训练好的多个同质集成算法对该特征进行种类识别,并更根据优本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种入侵流量检测方法,其特征在于,所述入侵流量检测方法包括:对待识别流量进行特征提取得到初始特征,通过归因法对所述初始特征进行分类得到含有多个初始特征的决策树;根据所述决策树进行特征提取,得到待识别特征;将所述待识别特征输入预设特征识别模型得到多个初始识别结果;根据所述预设特征识别模型的参考权重对所述初始特征识别结果进行分析,得到所述待识别流量的流量类别。2.如权利要求1所述的入侵流量检测方法,其特征在于,所述根据所述决策树进行特征提取,得到待识别特征,包括:计算每个决策树中初始特征的有效占比以及所述初始特征的基尼指数;根据所述有效占比和所述基尼指数对所述决策树中的初始特征进行排序得到初始特征序列表;根据所述初始特征序列表得到代表所述待识别流量的待识别特征。3.如权利要求1所述的入侵流量检测方法,其特征在于,所述将所述待识别特征输入预设特征识别模型得到多个初始识别结果之前,还包括:获取原数据集;对所述原数据集进行分类得到不同类别的数据集,对所述原数据集进行特征提取,得到带有类别标签的样本特征;根据所述样本特征对同质集成算法进行训练得到训练后的预设特征识别模型,所述同质集成算法包括随机森林算法、决策树算法、极端随机数算法。4.如权利要求3所述的入侵流量检测方法,其特征在于,所述对所述原数据集进行分类得到不同类别的数据集,对所述原数据集进行特征提取得到带有类别标签的样本特征,包括:从原始数据集中随机抽取预设个数的初始数据集,去除所述初始数据集中的错误样本数据得到初始样本数据集,将所述样本数据集中的数据格式同一化得到样本数据集;根据所述样本数据集中的最大值和最小值对样本数据集进行线性变换得到参考数据集;将所述参考数据集中的数据类别转化为数字标签得到带有类别标签的标签数据集;对所述标签数据集进行综合采样得到采样后的标签数据集,对所述标签数据集中的样本数据进行特征降维,得到样本特征。5.如权利要求4所述的入侵流量检测方法,其特征在于,所述对所述标签数据集进行综合采样得到采样后的标签数据集,对所述标签数据集中的样本数据进行特征降维,得到样本特征,包括:根据所述标签数据集得到差值样本,计算所述差值样本之间的欧式距离;根据所述欧式距离得到所述差值样本预...
【专利技术属性】
技术研发人员:李润杰,张小庆,刘昌华,
申请(专利权)人:武汉轻工大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。