基于集成分类器的网络安全态势评估方法技术

技术编号:17444587 阅读:43 留言:0更新日期:2018-03-10 18:11
本发明专利技术公开了一种基于集成分类器的网络安全态势评估方法,其中,包括:采集网络安全态势评估数据;进行数据预处理和维度选取;数据预处理和维度选取后的数据按照ID3分类器进行评估分类;ID3分类器进行评估分类后的结果按照朴素贝叶斯分类器进行评估分类;加权计算网络安全态势评估分数,对每个网络样本的三个渠道的评估分类进行加权,以得到每个网络样本最后的安全评估分数。本发明专利技术基于集成分类器的网络安全态势评估方法,有效的提高网络的安全预警水平。

【技术实现步骤摘要】
基于集成分类器的网络安全态势评估方法
本专利技术属于网络安全
,特别涉及一种基于集成分类器的网络安全态势评估方法。
技术介绍
随着互联网技术的迅猛发展,各种信息安全问题也相继出现,网络安全问题日益严重。网络安全态势评估技术可以从整体上反映网络安全状况,对安全情况的发展趋势进行预测及预警,为加强网络安全提供方法,是网络安全体系中的关键环节。近年来,网络安全态势评估技术已成为国内外网络安全领域的研究热点,以期提高网络的安全预警水平。
技术实现思路
本专利技术的目的在于提供一种基于集成分类器的网络安全态势评估方法,用于解决上述现有技术的问题。本专利技术的一种基于集成分类器的网络安全态势评估方法,其中,包括:采集网络安全态势评估数据;进行数据预处理和维度选取;数据预处理和维度选取后的数据按照ID3分类器进行评估分类;ID3分类器进行评估分类后的结果按照朴素贝叶斯分类器进行评估分类;加权计算网络安全态势评估分数,对每个网络样本的三个渠道的评估分类进行加权,以得到每个网络样本最后的安全评估分数。根据的基于集成分类器的网络安全态势评估方法的一实施例,其中,维度选取包括:选定训练集记为A,A中数据量为n,选取m个组件进行安全评估,评估维度数为s=s1+s2+s3,其中S1为配置数据的维度数,S2为运行数据的维度数,S3为入侵数据的维度数;将网络样本集A划分为A1、A2、A3,其中A1表示配置数据集,有s1个维度,A2表示运行数据集,有s2个维度,A3表示入侵检测数据,有s3个维度,对组件和网络样本安全分3个渠道进行评估分类。根据的基于集成分类器的网络安全态势评估方法的一实施例,其中,采集网络安全态势评估数据通过通过专业检测系统获取。根据的基于集成分类器的网络安全态势评估方法的一实施例,其中,进行数据预处理包括:异常值处理、数据离散化和标准化处理、缺失值处理以及相关性处理。根据的基于集成分类器的网络安全态势评估方法的一实施例,其中,进行异常值处理,包括:将数据由大到小排列,计算其上四分位数Q3,中位数,下四分位数Q1,进一步计算异常值上下界限:Q3+3IQR(四分位距),A1-3IQR,在界限以外的值定义为极端异常值;对于检测到的异常值,采用数值修正和删除数据两种方法进行处理。根据的基于集成分类器的网络安全态势评估方法的一实施例,其中,进行数据离散化和标准化处理包括:第一步:将网络安全态势评估数据的非数值型数据按设定规则,转换为数值1-10;第二步:使用属性构造法,使网络安全态势评估数据的所有维度数值与网络安全性呈正相关,转化为数值1-10。根据的基于集成分类器的网络安全态势评估方法的一实施例,其中,进行缺失值处理步骤包括:对于网络安全态势评估数据的缺失数据,采用数据插补和删除数据两种手段,根据缺失值的实际意义选择处理方法。根据的基于集成分类器的网络安全态势评估方法的一实施例,其中,进行相关性处理是通过SPSS或Python进行相关性处理。根据的基于集成分类器的网络安全态势评估方法的一实施例,其中,数据预处理和维度选取后的数据按照ID3分类器进行评估分类包括:将网络样本集A1、A2、A3按组件进一步划分,得到Ai,j,i=1,2,3;j=1,2,…,m;类别集:B={1,2,3,4,5},1-5对应的实际意义为:安全性低、中低、中、中高、高。根据的基于集成分类器的网络安全态势评估方法的一实施例,其中,ID3分类器进行评估分类后的结果按照朴素贝叶斯分类器进行评估分类包括:第一步:确定网络样本集C={C1,C2,...,Cm},包含m个条件属性,即m个组件,每个元素记为c,c=(c1,c2,...,cm);第二步:类别集合H={1,2,3,4,5},每个元素记为hk(1≤k≤5);第三步:当且仅当P(hk|c)>P(hj|c),1≤k,j≤m,j≠k,将给定的网络样本c=(c1,c2,...,cm)分配到类hk,P为概率值;根据贝叶斯定理,有因为P(c)对于所有的类别均为常数,故只需最大化P(hk)P(c|hk),又有其中,nk是类hk在训练样本集中的实例数,n是训练样本总数;P(ci|hk)=nki/nk,nki是属性ci上分类为hk的网络样本数量。综上,本专利技术的一种基于集成分类器的网络安全态势评估方法,结合ID3决策树分类器和朴素贝叶斯分类器建立模型,对采集到的网络样本硬件数据进行两次分类,最后通过加权计算得到安全态势评估值,有效的提高网络的安全预警水平。附图说明图1所示为一组件的3种渠道多维度网络安全态势评估数据结构图;图2a-图2c所示为分类器f处理流程图;图3a-图3c所示为分类器g的处理流程图。具体实施方式为使本专利技术的目的、内容、和优点更加清楚,下面结合附图和实施例,对本专利技术的具体实施方式作进一步详细描述。本专利技术的一种基于集成分类器的网络安全态势评估方法,结合ID3决策树分类器和朴素贝叶斯分类器建立模型,对采集到的网络样本硬件数据进行两次分类,最后通过加权计算得到安全态势评估值。本专利技术的一种基于集成分类器的网络安全态势评估方法包括:采集网络安全态势评估数据包括:图1所示为一组件的3种渠道多维度网络安全态势评估数据结构图,如图1所示,计算机网络结构中存在大量的主机、服务器、路由器、防火墙和入侵检测系统等各种网络硬件,称之为组件。网络安全态势评估数据主要取自3种渠道:配置信息、运行信息、入侵信息。通过安装在各个网络组件上的检测软件获取网络安全态势评估数据,其中,入侵信息可通过Snort入侵检测系统、360安全检测系统等获取。进行数据预处理和维度选取:基础数据:训练网络样本集A0,A0包含多个样本(即多个网络),网络样本集A0中每条数据包含m0个组件信息,每个组件信息又包含3种渠道共s0个维度数据。数据预处理:不同维度数据意义不同;朴素贝叶斯分类器对缺失值不敏感,且要求维度之间相互独立;原始数据中存在异常值。因此,需要对原始数据进行预处理,即数据清洗。(1)进行异常值处理,包括:网络安全态势评估数据的所有维度数值,因数据集不一定呈正态分布,我们使用简单有效的箱线图法验证异常值。箱线图原理:将数据由大到小排列,计算其上四分位数Q3,中位数,下四分位数Q1,进一步计算异常值上下界限:Q3+3IQR(四分位距),A1-3IQR,在界限以外的值定义为极端异常值。对于检测到的异常值,根据异常值的实际意义,采用数值修正和删除数据两种处理方法。数值修正方法与下述数据插值类似。(2)进行数据离散化和标准化处理:离散标准化所要达到的目标是:将所有数据标准化处理为1-10,其中,数值越大表示该组件的该维度安全性较高。离散标准化步骤包括:第一步:将网络安全态势评估数据的非数值型数据按设定规则,转换为数值1-10。第二步:使用属性构造法,使网络安全态势评估数据的所有维度数值与网络安全性呈正相关,转化为数值1-10。(3)缺失值处理步骤包括:对于网络安全态势评估数据的缺失数据,主要采用数据插补(即根据一定规则插入数值1-10)和删除数据两种手段,根据缺失值的实际意义选择处理方法。插值方法可用拉格朗日插值法等。(4)相关性处理包括:一个维度内为多个网络样本的同类数据的集合,两个有相关性的维度进行分类时易产生冗余。计算任意两个维本文档来自技高网...
基于集成分类器的网络安全态势评估方法

【技术保护点】
一种基于集成分类器的网络安全态势评估方法,其特征在于,包括:采集网络安全态势评估数据;进行数据预处理和维度选取;数据预处理和维度选取后的数据按照ID3分类器进行评估分类;ID3分类器进行评估分类后的结果按照朴素贝叶斯分类器进行评估分类;加权计算网络安全态势评估分数,对每个网络样本的三个渠道的评估分类进行加权,以得到每个网络样本最后的安全评估分数。

【技术特征摘要】
1.一种基于集成分类器的网络安全态势评估方法,其特征在于,包括:采集网络安全态势评估数据;进行数据预处理和维度选取;数据预处理和维度选取后的数据按照ID3分类器进行评估分类;ID3分类器进行评估分类后的结果按照朴素贝叶斯分类器进行评估分类;加权计算网络安全态势评估分数,对每个网络样本的三个渠道的评估分类进行加权,以得到每个网络样本最后的安全评估分数。2.如权利要求1所述的基于集成分类器的网络安全态势评估方法,其特征在于,维度选取包括:选定训练集记为A,A中数据量为n,选取m个组件进行安全评估,评估维度数为s=s1+s2+s3,其中S1为配置数据的维度数,S2为运行数据的维度数,S3为入侵数据的维度数;将网络样本集A划分为A1、A2、A3,其中A1表示配置数据集,有s1个维度,A2表示运行数据集,有s2个维度,A3表示入侵检测数据,有s3个维度,对组件和网络样本安全分3个渠道进行评估分类。3.如权利要求1所述的基于集成分类器的网络安全态势评估方法,其特征在于,采集网络安全态势评估数据通过通过专业检测系统获取。4.如权利要求1所述的基于集成分类器的网络安全态势评估方法,其特征在于,进行数据预处理包括:异常值处理、数据离散化和标准化处理、缺失值处理以及相关性处理。5.如权利要求4所述的基于集成分类器的网络安全态势评估方法,其特征在于,进行异常值处理,包括:将数据由大到小排列,计算其上四分位数Q3,中位数,下四分位数Q1,进一步计算异常值上下界限:Q3+3IQR(四分位距),A1-3IQR,在界限以外的值定义为极端异常值;对于检测到的异常值,采用数值修正和删除数据两种方法进行处理。6.如权利要求4所述的基于集成分类器的网络安全态势评估方法,其特征在于,进行数据离散化和标准化处理包括:第一步:将网络安全态势评估数据...

【专利技术属性】
技术研发人员:郭敏曾颖明姚金利
申请(专利权)人:北京计算机技术及应用研究所
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1