【技术实现步骤摘要】
入侵检测模型的构建方法及装置
[0001]本专利技术涉及网络安全
,特别是涉及一种入侵检测模型的构建方法及装置。
技术介绍
[0002]随着信息技术的发展,网上生活越来越普及,互联网用户和互联网业务在不断快速增长,网络数据流量激增,与此同时,网络安全问题也越来越受到全社会的关注。网络入侵是互联网黑客通过网络对电脑进行远程操控或者破坏,严重威胁网络安全。而网络入侵技术随着信息技术的发展也在不断地提高,入侵的多样性和隐蔽性不断增强,入侵场景越来越复杂,使得网络入侵检测变得越来越困难。
[0003]网络入侵检测是通过对网络入侵数据进行分类识别,以及时有效地处理网络安全问题。网络入侵数据往往数量大、种类多、碎片化,现有技术中,主要是通过简单集成各个分类器得到入侵检测模型,以实现对入侵数据的检测分类,并没有深入研究分类器的选取,因而容易导致模型的过拟合和计算资源的浪费,使得检测效率下降。
技术实现思路
[0004]有鉴于此,本专利技术提供一种入侵检测模型的构建方法,通过该方法,可以构建出一个具有较好泛化能 ...
【技术保护点】
【技术特征摘要】
1.一种入侵检测模型的构建方法,其特征在于,包括:获取各个分类器,并获取各个测试数据组成的测试数据集以及所述测试数据集对应的验证数据集;将所述测试数据集中的各个测试数据分别输入到每个所述分类器中,获得每个所述分类器输出的测试结果,并通过验证数据集对每个所述测试结果进行验证,得到每个所述分类器对应的混淆矩阵;基于每个所述分类器对应的混淆矩阵,计算得到该分类器的F1值、接受者操作特征曲线下方的面积AUC值和熵值;基于各个所述分类器的F1值、AUC值和熵值,对各个所述分类器进行层次聚类,得到多个类簇;确定每个所述类簇中F1值与AUC值的调和平均数值最高的分类器为个体学习器;确定各个所述个体学习器的组合权重,并根据各个所述个体学习器的组合权重,运用预设的加权投票法集成各个所述个体学习器,得到入侵检测模型。2.根据权利要求1所述的方法,其特征在于,所述获取各个分类器,包括:获取需要进行集成的各个初始分类器,并获取各个训练数据组成的训练数据集;基于所述训练数据集,对各个所述初始分类器进行迭代训练,直至训练后的各个所述初始分类器满足预设的停止迭代条件,得到各个所述分类器。3.根据权利要求1所述的方法,其特征在于,所述基于每个所述分类器对应的混淆矩阵,计算该分类器的熵值,包括:根据所述验证数据集,确定所述测试数据集中包含的各个样本类别;根据所述分类器对应的混淆矩阵,确定所述测试数据集中各个测试数据划分至各个样本类别中的数据个数;根据划分至各个所述样本类别中的数据个数,确定各个所述样本类别的熵值,并确定所述分类器的熵值为各个所述样本类别的熵值的平均值。4.根据权利要求1所述的方法,其特征在于,所述确定各个所述个体学习器的组合权重,包括:根据每个所述个体学习器的F1值和AUC值,确定每个所述个体学习器的分类性能数值,所述分类性能数值为F1值和AUC值的调和平均值;根据每个所述个体学习器的熵值和预设的最大熵值,确定每个所述个体学习器的适用性数值;基于每个所述个体学习器的分类性能数值和适用性数值,运用预先设置的组合权重计算公式计算得到该个体学习器的组合权重。5.根据权利要求4所述的方法,其特征在于,所述根据每个所述个体学习器的熵值和预设的最大熵值,确定每个所述个体学习器的适用性数值,包括:确定每个所述个体学习器的熵值与所述最大熵值的比值为该个体学习器的熵值等级;根据每个所述个体学习器的熵值等级,确定该个体学习器的适用性数值,所述适用性数值为数值1减去熵值等级。6.根据权利要求1所述的方法,其特征在于,所述根据各个所述个体学习器的组合权重,运用预设的加权投票法集成...
【专利技术属性】
技术研发人员:李霄夏,阳文燕,曾颖,
申请(专利权)人:启明星辰信息技术集团股份有限公司北京网御星云信息技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。