一种网络信息安全风险评估系统及其方法技术方案

技术编号:33529837 阅读:16 留言:0更新日期:2022-05-19 01:58
本发明专利技术涉及一种网络信息安全风险评估系统及其方法,是针对现有网络安全行业中缺少对已具有的安全保障能力的有效评估机制,无法实现对系统安全态势的准确感知,难以及时发现并消除安全隐患的技术问题。该系统以输出训练集和特征集,计算新的特征选择标准AS进行节点分裂生成决策树模型、建立决策树模型规则集、通过决策树模型和决策树模型规则集对网络信息安全进行评估;其要点是所述决策树模型为改进决策树模型,改进决策树模型算法及流程,引入强化学习的思想,将每个特征的标准化互信息和马修斯相关系数加权,输出决策树模型,并生成决策树,利用生成的决策树模型和规则集对网络信息数据进行安全风险评估,输出网络信息数据的风险评估结果。的风险评估结果。的风险评估结果。

【技术实现步骤摘要】
一种网络信息安全风险评估系统及其方法


[0001]本专利技术涉及网络信息安全风险评估系统,是一种网络信息安全风险评估系统及其方法。

技术介绍

[0002]网络信息安全是一门涉及计算机科学、网络技术、通信技术、密码技术、信息安全技术、应用数学等多种学科的综合性学科,主要是指网络系统的硬件、软件及其系统中的数据受到保护,不受偶然的或者恶意的原因而遭到破坏、更改、泄露,系统连续可靠正常地运行,网络服务不中断。网络信息安全的主要特征包括完整性、保密性、可用性、不可否认性和可控性,其模型框架包括网络安全模型和信息安全框架,通过模型和算法输出网络信息数据评估结果。现有网络安全感知分析系统及其方法如中国专利文献中披露的申请号202010549375.9,申请公布日2020.10.02,专利技术名称“一种网络安全态势感知系统及方法”;再如中国专利文献中披露的申请号201910654813.5,申请公布日2019.10.25,专利技术名称“一种基于LDA机器学习的网络安全威胁分析方法及系统”。但上述系统及其方法缺少对已具有的安全保障能力的有效评估机制,无法实现对系统安全态势的准确感知,难以及时发现并消除安全隐患。

技术实现思路

[0003]为克服上述不足,本专利技术的目的是向本领域提供一种网络信息安全风险评估系统及其方法,使其主要解决现有网络安全行业中缺少对已具有的安全保障能力的有效评估机制,无法实现对系统安全态势的准确感知,难以及时发现并消除安全隐患的技术问题。其目的是通过如下技术方案实现的。
[0004]一种网络信息安全风险评估系统,该系统以输出训练集和特征集,计算新的特征选择标准AS进行节点分裂生成决策树模型、建立决策树模型规则集、通过决策树模型和决策树模型规则集对网络信息安全进行评估;其特征在于所述决策树模型为改进决策树模型,改进决策树模型算法的流程具体如下:
[0005]设S为样本集,样本集的个数为n,样本集S中有m个类别D
j
(j=1,2,

,m),d
j
为D
j
类的样本个数;则数据集的类别信息熵Bnt(S)表示为:
[0006][0007]公式(1)中:P
j
为任意样本属于D
j
的概率,P
j

d
j
/n;
[0008]设特征a有k个离散值(a1,a2,

,a
k
},根据(S1,S2,

,S
k
},其中S
i
是S中特征为a
j
的数据集;如果a
j
被选为当前节点,那么用特征a
j
对当前样本进行划分;S
ij
为子集S
i
中属于D
j
类的个数,则按特征a
j
划分数据集的条件信息熵为:
[0009][0010][0011][0012]由上述公式得出特征A划分前后的信息熵之差为信息增益,表达式为:
[0013]Gain(S,A)=Ent(S) Ent(S|a)
ꢀꢀ
(5)
[0014]按照特征A划分后的信息增益率为:
[0015][0016]公式(6)中A的分裂信息为
[0017][0018]为了解决决策树模型算法为获得高的准确率,计算结果会偏向样本数多的类别的问题,现引入标准化互信息、马修斯相关系数及强化学习的思想改进决策树模型算法;
[0019]标准化互信息公式如下:
[0020][0021]公式(8)中:I(X,Y)为X与Y之间的互信息;H(X)为X的熵;H(Y)为Y的熵;
[0022]马修斯相关系数公式如下:
[0023][0024]公式(9)中:cov()为协方差函数;
[0025]引入强化学习的思想,将每个特征的标准化互信息和马修斯相关系数加权,并与信息增益率相结合作为新的特征选择标准AS;并设两个类别(X,Y)的联合分布为p(i,j),即各类别判断正确的样本数占总样本数的概率;设边缘分布分别为p(i),即在预测结果中各类别样本数占总样本数的概率;设互信息MI(X,Y)是联合分布p(i,j)与边缘分布乘积p(i)p(j)的相对熵,公式如下:
[0026][0027][0028][0029]设TP为真负类的数量,TN为真正类的数量,EP为假负类的数量,FN为假正类的数量;根据混淆矩阵得出C
MCC
为:
[0030][0031]公式(13)中:N为样本个数;W=(TP|PN)/N;V=(TP|PP)/N;
[0032]根据式(11)和(13)得到一个新的价值函数f:
[0033]f=ωC
MCC
|(1 ω)c
NM
I
ꢀꢀ
(14)
[0034]公式(14)中:ω为权重;
[0035]新的特征选择标准AS公式为:
[0036]AS=(2
Gain ratio 1)f
ꢀꢀ
(15)
[0037]输出决策树模型T,并生成决策树。
[0038]所述改进决策树模型算法得到的生成决策树通过规则集对信息保密性、信息完整性、信息威胁性、信息弱点性、信息安全控制措施等五项网络信息安全风险指标进行赋值,将网络信息安全风险分为低、较低、中、较高、高五个等级,得出规则集。
[0039]所述规则集与评估模型流程得到的决策树分类结合,输出风险评估结果,所述评估模型流程的主要流程具体如下:网络信息数据输入

数据预处理

待风险评估数据集

决策树分类

输出风险评估结果。
[0040]该网络信息安全风险评估系统的方法具体流程步骤如下:(1)第一部分,生成决策树模型;1、输入训练集S,特征集A;2、若则返回决策树模型T;3、若训练集S中所有样本都属于同一个类别,则T为单节点树,并将该类别作为该节点的类标记,返回T;4、若特征集A为空集,则T为单节点树,并将S中样本数最多的类别作为类标记,返回T;5、根据公式(15)计算S中各特征的AS,选择AS最大的特征,作为该节点的分裂特征;6、对于第i个节点,将作为新的训练集,对当前特征以外的特征回归步骤2至步骤5;7、输出决策树模型T,并生成决策树;(2)第二部分,决策树模型评估网络信息;1、对信息保密性、信完整性、信威胁性、信弱点性、信安全控制措施等五项关键网络信息安全风险指标进行赋值,生成决策树模型规则集;2、对采集的网络信息数据进行预处理去除无用信息;3、利用生成的决策树模型和规则集对网络信息数据进行安全风险评估;4、输出网络信息数据的风险评估结果。
[0041]本专利技术的建模方式科学,模型准确感知效果好,能及时发现并消除安全隐患,具有科学性、高效性、高精度性;其适合作为网络信息安全本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种网络信息安全风险评估系统,该系统以输出训练集和特征集,计算新的特征选择标准AS进行节点分裂生成决策树模型、建立决策树模型规则集、通过决策树模型和决策树模型规则集对网络信息安全进行评估;其特征在于所述决策树模型为改进决策树模型,改进决策树模型算法的流程具体如下:设S为样本集,样本集的个数为n,样本集S中有m个类别D
j
=(j=1,2,

,m),d
j
为D
j
类的样本个数;则数据集的类别信息熵Ent(S)表示为:公式(1)中:P
j
为任意样本属于D
j
的概率,P
j

d
j
/n;设特征a有k个离散值{a1,a2,

,a
k
},根据{S1,S2,

,S
k
},其中S
i
是S中特征为a
j
的数据集;如果a
j
被选为当前节点,那么用特征a
j
对当前样本进行划分;S
ij
为子集S
i
中属于D
j
类的个数,则按特征a
j
划分数据集的条件信息熵为:划分数据集的条件信息熵为:划分数据集的条件信息熵为:由上述公式得出特征A划分前后的信息熵之差为信息增益,表达式为:Cain(S,A)=Ent(S)Ent(S|a)
ꢀꢀꢀꢀ
(5)按照特征A划分后的信息增益率为:公式(6)中A的分裂信息为为了解决决策树模型算法为获得高的准确率,计算结果会偏向样本数多的类别的问题,现引入标准化互信息、马修斯相关系数及强化学习的思想改进决策树模型算法;标准化互信息公式如下:公式(8)中:I(X,Y)为X与Y之间的互信息;H(X)为X的熵;H(Y)为Y的熵;马修斯相关系数公式如下:公式(9)中:cov()为协方差函数;引入强化学习的思想,将每个特征的标准化互信息和马修斯相关系数加权,并与信息增益率相结合作为新的特征选择标准AS;并设两个类别(X,Y)的联合分布为p(i,j),即各类别判断正确的样本数占总样本数的概率;设边缘分布分别为p(i),即在预测结果中各类别样本数占总样本数的概率;设互信息MI(X,Y)是联合分...

【专利技术属性】
技术研发人员:姚灏叶其革唐宗顺张德方严晓玲
申请(专利权)人:广州电力设计院有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1