入侵检测方法及装置制造方法及图纸

技术编号:27531877 阅读:12 留言:0更新日期:2021-03-03 11:10
本发明专利技术公开了一种入侵检测方法及装置。其中,该方法包括:获取第一特征数据集;对第一特征数据集进行降维处理,得到第二特征数据集,其中,第二特征数据集的维度小于第一特征数据集;利用第二特征数据集对入侵检测模型进行训练,得到训练好的入侵检测模型,其中,训练好的入侵检测模型用于对待检测数据进行入侵检测。本发明专利技术解决了相关技术中数据检测的准确率较低的技术问题。低的技术问题。低的技术问题。

【技术实现步骤摘要】
入侵检测方法及装置


[0001]本专利技术涉及数据处理领域,具体而言,涉及一种入侵检测方法及装置。

技术介绍

[0002]随着互联网的发展,数据的连接和流量越来越大,对于计算机和各种设备随之而来的恶意入侵及其带来的威胁也日益增加,因此需要对数据进行入侵检测。现有的入侵检测系统在遇到大量高维数据时,通常会遇到维数灾难的问题,从而导致数据检测的准确率较低;并且现有的入侵检测系统在数据检测的过程中无法识别未知的攻击,会对未知的攻击进行漏报,从而导致数据检测的准确率较低。因此,现有入侵检测系统数据检测的准确率较低。
[0003]针对上述的问题,目前尚未提出有效的解决方案。

技术实现思路

[0004]本专利技术实施例提供了一种入侵检测方法及装置,以至少解决相关技术中数据检测的准确率较低的技术问题。
[0005]根据本专利技术实施例的一个方面,提供了一种入侵检测方法,包括:获取第一特征数据集;对第一特征数据集进行降维处理,得到第二特征数据集,其中,第二特征数据集的维度小于第一特征数据集;利用第二特征数据集对入侵检测模型进行训练,得到训练好的入侵检测模型,其中,训练好的入侵检测模型用于对待检测数据进行入侵检测。
[0006]可选地,对第一特征数据集进行降维处理,得到第二特征数据集包括:利用交叉验证法对第一特征数据集进行划分,生成多组数据集,其中,任意两组数据集之间具备互斥关系;利用随机森林模型对多组数据集进行特征筛选,得到多组目标特征集,其中,每组目标特征集包括:多个目标特征;对多组目标特征集进行降维处理,得到第二特征数据集。
[0007]可选地,利用随机森林模型对多组数据集进行特征筛选,得到多组目标特征集包括:利用随机森林模型对多组数据集进行预测,得到多组原始特征集中包含的每个原始特征的评分值,其中,评分值用于表征每个原始特征的重要程度;基于多组原始特征集中包含的每个原始特征的评分值,得到每个原始特征的评分均值;基于每个原始特征的评分均值,确定多组目标特征集。
[0008]可选地,基于每个原始特征的评分均值,确定多组目标特征集包括:按照每个原始特征的评分均值,对多个原始特征进行升序排序;获取排序后的多个原始特征中的最前面的第一预设数量的原始特征,得到多个目标特征。
[0009]可选地,对多组目标特征集进行降维处理,得到第二特征数据集包括:基于多组目标特征集构建第一矩阵;获取第一矩阵的协方差矩阵;基于协方差矩阵,确定第二矩阵;获取第一矩阵和第二矩阵的乘积,得到第二特征数据集。
[0010]可选地,基于协方差矩阵,确定第二矩阵包括:获取协方差矩阵的特征值和特征向量;将特征向量按照特征值的大小进行排序,生成第三矩阵;获取第三矩阵中最前面的第二
预设数量的行矩阵,生成第二矩阵。
[0011]可选地,在获取第一矩阵的协方差矩阵之前,该方法还包括:对第一矩阵进行零均值化处理,得到第四矩阵;获取第四矩阵的协方差矩阵。
[0012]可选地,在获取第一矩阵和第二矩阵的乘积,得到第二特征数据集之前,该方法还包括:对第一矩阵进行中心化处理,得到第五矩阵;获取第五矩阵和第二矩阵的乘积,得到第二特征数据集。
[0013]可选地,在利用随机森林模型对多组数据集进行特征筛选,得到多组目标特征集之前,方法还包括:随机对多组数据集进行多次划分,得到多组训练集和测试集;利用多组训练集对随机森林模型进行训练;利用测试集对训练好的随机森林模型进行测试,得到训练好的随机森林模型的总得分;基于总得分确定随机森林模型的训练是否完成。
[0014]可选地,利用第二特征数据集对入侵检测模型进行训练,得到训练好的入侵检测模型包括:对于第二特征数据集进行误用检测,得到第三特征数据集,其中,第三特征数据集中包含的特征数据用于表征非攻击数据或正常数据;基于第三特征数据集利用集成学习算法对多个基分类器进行迭代训练,得到训练好的入侵检测模型。
[0015]可选地,对于第二特征数据集进行误用检测,得到第三特征数据集包括:利用第二特征数据集对多种不同类型的预设模型进行预测,确定多种不同类型的预设模型的检测率;确定最大检测率对应的预设模型为目标模型;利用目标模型对第二特征数据集进行误用检测,得到第二特征数据集的检测结果;基于第二特征数据集的检测结果,得到第三特征数据集。
[0016]可选地,多种不同类型的预设模型包括:决策树模型、支持向量机模型和朴素贝叶斯模型。
[0017]可选地,在获取第一特征数据集之后,该方法还包括:对第一特征数据集进行格式化处理,得到处理后的第一特征数据集,其中,处理后的第一特征数据集中包含的变量的类型相同。
[0018]根据本专利技术实施例的另一方面,还提供了一种入侵检测装置,包括:获取模块,用于获取第一特征数据集;处理模块,用于对第一特征数据集进行降维处理,得到第二特征数据集,其中,第二特征数据集的维度小于第一特征数据集;训练模块,用于利用第二特征数据集对入侵检测模型进行训练,得到训练好的入侵检测模型,其中,训练好的入侵检测模型用于对待检测数据进行入侵检测。
[0019]根据本专利技术实施例的另一方面,还提供了一种计算机可读存储介质,计算机可读存储介质包括存储的程序,其中,在程序运行时控制计算机可读存储介质所在设备执行上述的入侵检测方法。
[0020]根据本专利技术实施例的另一方面,还提供了一种处理器,处理器用于运行程序,其中,程序运行时执行上述的入侵检测方法。
[0021]在本专利技术实施例中,首先获取到第一特征数据集,然后对第一特征数据集进行降维处理,得到第二特征数据集,其中,第二特征数据集的维度小于第一特征数据集,最后利用第二特征数据集对入侵检测模型进行训练,得到训练好的入侵检测模型,其中,训练好的入侵检测模型用于对待检测数据进行入侵检测,通过对第一特征数据集进行降维处理避免了维数灾难的问题,从而提高了数据检测的准确率,另外,根据获取到的特征数据集实时的
对入侵检测模型进行训练可以使入侵检测模型及时的检测到未知的数据攻击,避免对未知的数据攻击进行漏报,也可以进一步的提高数据检测的准确率,进而解决了相关技术中数据检测的准确率较低的技术问题。
附图说明
[0022]此处所说明的附图用来提供对本专利技术的进一步理解,构成本申请的一部分,本专利技术的示意性实施例及其说明用于解释本专利技术,并不构成对本专利技术的不当限定。在附图中:
[0023]图1是根据本专利技术实施例的一种入侵检测方法的流程图;
[0024]图2是根据本专利技术实施例的另一种入侵检测方法的流程图;
[0025]图3是根据本专利技术实施例的一种入侵检测装置的示意图;
[0026]图4是根据本专利技术实施例的另一种入侵检测装置的示意图。
具体实施方式
[0027]为了使本
的人员更好地理解本专利技术方案,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分的实施例,而不是全部的实施例。基于本发本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种入侵检测方法,其特征在于,包括:获取第一特征数据集;对所述第一特征数据集进行降维处理,得到第二特征数据集,其中,所述第二特征数据集的维度小于所述第一特征数据集;利用所述第二特征数据集对入侵检测模型进行训练,得到训练好的入侵检测模型,其中,所述训练好的入侵检测模型用于对待检测数据进行入侵检测。2.根据权利要求1所述的方法,其特征在于,对所述第一特征数据集进行降维处理,得到第二特征数据集包括:利用交叉验证法对所述第一特征数据集进行划分,生成多组数据集,其中,任意两组数据集之间具备互斥关系;利用随机森林模型对所述多组数据集进行特征筛选,得到多组目标特征集,其中,每组目标特征集包括:多个目标特征;对所述多组目标特征集进行降维处理,得到所述第二特征数据集。3.根据权利要求2所述的方法,其特征在于,利用所述随机森林模型对所述多组数据集进行特征筛选,得到多组目标特征集包括:利用所述随机森林模型对所述多组数据集进行预测,得到多组原始特征集中包含的每个原始特征的评分值,其中,所述评分值用于表征所述每个原始特征的重要程度;基于所述多组原始特征集中包含的每个原始特征的评分值,得到所述每个原始特征的评分均值;基于所述每个原始特征的评分均值,确定所述多组目标特征集。4.根据权利要求3所述的方法,其特征在于,基于所述每个原始特征的评分均值,确定所述多组目标特征集包括:按照所述每个原始特征的评分均值,对多个原始特征进行升序排序;获取排序后的多个原始特征中的最前面的第一预设数量的原始特征,得到所述多个目标特征。5.根据权利要求2所述的方法,其特征在于,对所述多组目标特征集进行降维处理,得到所述第二特征数据集包括:基于所述多组目标特征集构建第一矩阵;获取所述第一矩阵的协方差矩阵;基于所述协方差矩阵,确定第二矩阵;获取所述第一矩阵和所述第二矩阵的乘积,得到所述第二特征数据集。6.根据权利要求5所述的方法,其特征在于,基于所述协方差矩阵,确定第二矩阵包括:获取所述协方差矩阵的特征值和特征向量;将所述特征向量按照所述特征值的大小进行排序,生成第三矩阵;获取所述第三矩阵中最前面的第二预设数量的行矩阵,生成所述第二矩阵。7.根据权利要求5所述的方法,其特征在于,在获取所述第一矩阵的协方差矩阵之前,所述方法还包括:对所述第一矩阵进行零均值化处理,得到第四矩阵;获取所述第四矩阵的所述协方差矩阵。
8.根据权利要求5所述的方法,其特征在于,在获取所述第一矩阵和所述第二矩阵的乘积,得到所述第二特征数据集之前,所述方法还包括:对所述第一矩阵进行中心化处理,得到第五矩阵...

【专利技术属性】
技术研发人员:周献飞徐楷焦建林董宁韩盟徐浩陈奕倩
申请(专利权)人:国家电网有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1