基于大数据威胁感知的安全防护构建方法及系统技术方案

技术编号:38717022 阅读:13 留言:0更新日期:2023-09-08 14:59
本发明专利技术涉及人工智能技术领域,揭露了一种基于大数据威胁感知的安全防护构建方法及系统,包括:获取业务平台的威胁感知数据,对所述威胁感知数据进行特征提取,得到所述威胁感知数据的数据特征;计算所述数据特征的信息增益,利用信息增益生成所述威胁感知数据的增益序列;利用预设的权重更新算法生成所述数据特征的权重序列;利用所述增益序列和所述权重序列对所述数据特征进行特征选择,得到所述数据特征的目标特征;对所述目标特征进行特征分类,得到所述目标特征的分类特征;获取所述分类特征的威胁类别,根据所述威胁类别对所述业务平台进行安全防护强化构建。本发明专利技术可以提高基于大数据威胁感知的安全防护构建的效率。基于大数据威胁感知的安全防护构建的效率。基于大数据威胁感知的安全防护构建的效率。

【技术实现步骤摘要】
基于大数据威胁感知的安全防护构建方法及系统


[0001]本专利技术涉及人工智能
,尤其涉及一种基于大数据威胁感知的安全防护构建方法及系统。

技术介绍

[0002]随着网络技术和计算机技术的日益发达,在数字应用基础业务越来越丰富的大环境下,中国互联网应用规模日益扩大,网络用户不断增多,人们的日常生活离不开互联网的使用,与此同时网络中的数据量和数据类型也在飞速增长,由于网络环境具有开放性和复杂性等特点,网络安全问题日益突出。
[0003]现如今,网络安全代表着企业的抗打击能力,用户信息是企业的宝贵财富,同时,当金融企业受到不法分子的攻击时,会对用户的财产造成威胁,因此如何提升基于大数据威胁感知的安全防护构建效率,成为了亟待解决的问题。

技术实现思路

[0004]本专利技术提供一种基于大数据威胁感知的安全防护构建方法及系统,其主要目的在于解决基于大数据威胁感知的安全防护构建时效率较低的问题。
[0005]为实现上述目的,本专利技术提供的一种基于大数据威胁感知的安全防护构建方法,包括:
[0006]获取业务平台的威胁感知数据,对所述威胁感知数据进行特征提取,得到所述威胁感知数据的数据特征;
[0007]计算所述数据特征的信息增益,利用信息增益生成所述威胁感知数据的增益序列;
[0008]利用预设的权重更新算法生成所述数据特征的权重序列,其中,所述预设的权重更新算法为:
[0009][0010]其中,W'(B)是由所述数据特征确定的特征因素的更新权重,W(B)是所述特征因素的初始权重,B是所述特征因素,T是由所述数据特征确定的目标特征,H
j
是所述目标特征的同类最邻近样本中的第j个样本,M
j
(C)是所述目标特征的不同类最邻近样本中的第j个样本,C是所述不同类最邻近样本的因素类别标识,l是所述同类最邻近样本的样本总数,class(T)是所述目标特征的特征因素类别,m是从所述数据特征中选取目标特征的取样次数,P(C)是所述数据特征中的特征数据与所述目标特征不属于同一类别的概率,P(class(T))是所述数据特征中的特征数据与所述目标特征属于同一类别的概率,diff(B,T,M
j
(C))是在特征因素B上所述目标特征与所述不同类最邻近样本中的第j个样本的距离,diff(B,T,H
j
)是在特征因素B上所述目标特征与所述同类最邻近样本中的第j个样本的距离,j
是所述同类最邻近样本的样本标识;
[0011]利用所述增益序列和所述权重序列对所述数据特征进行特征选择,得到所述数据特征的目标特征;
[0012]对所述目标特征进行特征分类,得到所述目标特征的分类特征;
[0013]获取所述分类特征的威胁类别,根据所述威胁类别对所述业务平台进行安全防护强化构建。
[0014]可选地,所述对所述威胁感知数据进行特征提取,得到所述威胁感知数据的数据特征,包括:
[0015]对所述威胁感知数据进行数据清洗,得到所述威胁感知数据的清洗数据;
[0016]对所述清洗数据进行平衡检验,得到所述清洗数据的平衡检验结果,根据所述平衡检验结果对所述清洗数据进行数据平衡处理,得到所述清洗数据的平衡数据;
[0017]对所述平衡数据进行向量化转化,得到所述平衡数据的数据向量,确定所述数据向量是所述威胁感知数据的数据特征。
[0018]可选地,所述计算所述数据特征的信息增益,包括:
[0019]按照预设的属性标签对所述数据特征进行属性筛选,得到所述数据特征的属性特征;
[0020]根据所述属性特征中的类别属性和如下信息熵算法计算所述数据特征的特征信息熵:
[0021][0022]其中,H(D)是所述数据特征的特征信息熵,K是所述预设的属性标签中的类别属性的属性总数,k是所述预设的属性标签中的类别属性的属性标识,|C
k
|是第k个类别属性对应的数据特征出现次数,C
k
是第k个类别属性对应的数据特征,D是根据所述数据特征生成的训练集,|D|是所述训练集的样本容量,log(*)是对数函数;
[0023]根据所述特征信息熵生成所述数据特征的信息增益。
[0024]可选地,所述根据所述特征信息熵生成所述数据特征的信息增益,包括:
[0025]利用如下条件熵算法生成所述数据特征的特征条件熵:
[0026][0027]其中,H(D∣A)是所述数据特征的特征条件熵,A是所述预设的属性标签中的因素属性,D是根据所述数据特征生成的训练集,|D|是所述训练集的样本容量,D
i
是根据所述数据特征生成的第i个训练子集,|D
i
|是第i个所述训练子集的样本容量,i是所述训练子集的标识,n是所述训练子集的总数,K是所述预设的属性标签中的类别属性的属性总数,k是所述预设的属性标签中的类别属性的属性标识,log(*)是对数函数,D
ik
是在第i个所述训练子集中属于第k个类别属性的因素属性所对应的数据特征生成的样本集合,|D
ik
|是在第i个所述训练子集中属于第k个类别属性的因素属性所对应的数据特征生成的样本集合的样本容量;
[0028]确定所述特征信息熵减去所述特征条件熵得到的差值为所述数据特征的信息增益。
[0029]可选地,所述利用信息增益生成所述威胁感知数据的增益序列,包括:
[0030]利用如下经验熵算法根据所述数据特征生成所述威胁感知数据的因素经验熵:
[0031][0032]其中,H
A
(D)是所述威胁感知数据的因素经验熵,A是所述预设的属性标签中的因素属性,D是根据所述数据特征生成的训练集,|D|是所述训练集的样本容量,D
i
是根据所述数据特征生成的第i个训练子集,|D
i
|是第i个所述训练子集的样本容量,i是所述训练子集的标识,n是所述训练子集的总数,log(*)是对数函数;
[0033]将所述信息增益除以所述因素经验熵得到的商确定所述威胁感知数据的信息增益比;
[0034]按照所述信息增益比的大小对所述信息增益比进行降序排列,得到所述威胁感知数据的增益序列。
[0035]可选地,所述利用预设的权重更新算法生成所述数据特征的权重序列,包括:
[0036]对所述数据特征的特征因素进行权重初始化,得到所述特征因素的初始权重;
[0037]选取所述数据特征中的其中一个数据特征为目标特征,生成所述目标特征的同类最邻近样本;
[0038]生成所述目标特征的不同类最邻近样本,根据所述同类最邻近样本、所述不同类最邻近样本和预设的权重更新算法对所述初始权重进行权重更新,得到所述初始权重的更新权重;
[0039]根据所述更新权重的权重值大小对所述更新权重进行降序排列,得到所述数据特征的权重序列。
[0040]可选地,所述根据所本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于大数据威胁感知的安全防护构建方法,其特征在于,所述方法包括:获取业务平台的威胁感知数据,对所述威胁感知数据进行特征提取,得到所述威胁感知数据的数据特征;计算所述数据特征的信息增益,利用信息增益生成所述威胁感知数据的增益序列;利用预设的权重更新算法生成所述数据特征的权重序列,其中,所述预设的权重更新算法为:其中,W'(B)是由所述数据特征确定的特征因素的更新权重,W(B)是所述特征因素的初始权重,B是所述特征因素,T是由所述数据特征确定的目标特征,H
j
是所述目标特征的同类最邻近样本中的第j个样本,M
j
(C)是所述目标特征的不同类最邻近样本中的第j个样本,C是所述不同类最邻近样本的因素类别标识,l是所述同类最邻近样本的样本总数,class(T)是所述目标特征的特征因素类别,m是从所述数据特征中选取目标特征的取样次数,P(C)是所述数据特征中的特征数据与所述目标特征不属于同一类别的概率,P(class(T))是所述数据特征中的特征数据与所述目标特征属于同一类别的概率,diff(B,T,M
j
(C))是在特征因素B上所述目标特征与所述不同类最邻近样本中的第j个样本的距离,diff(B,T,H
j
)是在特征因素B上所述目标特征与所述同类最邻近样本中的第j个样本的距离,j是所述同类最邻近样本的样本标识;利用所述增益序列和所述权重序列对所述数据特征进行特征选择,得到所述数据特征的目标特征;对所述目标特征进行特征分类,得到所述目标特征的分类特征;获取所述分类特征的威胁类别,根据所述威胁类别对所述业务平台进行安全防护强化构建。2.如权利要求1所述的基于大数据威胁感知的安全防护构建方法,其特征在于,所述对所述威胁感知数据进行特征提取,得到所述威胁感知数据的数据特征,包括:对所述威胁感知数据进行数据清洗,得到所述威胁感知数据的清洗数据;对所述清洗数据进行平衡检验,得到所述清洗数据的平衡检验结果,根据所述平衡检验结果对所述清洗数据进行数据平衡处理,得到所述清洗数据的平衡数据;对所述平衡数据进行向量化转化,得到所述平衡数据的数据向量,确定所述数据向量是所述威胁感知数据的数据特征。3.如权利要求1所述的基于大数据威胁感知的安全防护构建方法,其特征在于,所述计算所述数据特征的信息增益,包括:按照预设的属性标签对所述数据特征进行属性筛选,得到所述数据特征的属性特征;根据所述属性特征中的类别属性和如下信息熵算法计算所述数据特征的特征信息熵:其中,H(D)是所述数据特征的特征信息熵,K是所述预设的属性标签中的类别属性的属
性总数,k是所述预设的属性标签中的类别属性的属性标识,|C
k
|是第k个类别属性对应的数据特征出现次数,C
k
是第k个类别属性对应的数据特征,D是根据所述数据特征生成的训练集,|D|是所述训练集的样本容量,log(*)是对数函数;根据所述特征信息熵生成所述数据特征的信息增益。4.如权利要求3所述的基于大数据威胁感知的安全防护构建方法,其特征在于,所述根据所述特征信息熵生成所述数据特征的信息增益,包括:利用如下条件熵算法生成所述数据特征的特征条件熵:其中,H(D∣A)是所述数据特征的特征条件熵,A是所述预设的属性标签中的因素属性,D是根据所述数据特征生成的训练集,|D|是所述训练集的样本容量,D
i
是根据所述数据特征生成的第i个训练子集,|D
i
|是第i个所述训练子集的样本容量,i是所述训练子集的标识,n是所述训练子集的总数,K是所述预设的属性标签中的类别属性的属性总数,k是所述预设的属性标签中的类别属性的属性标识,log(*)是对数函数,D
ik
是在第i个所述训练子集中属于第k个类别属性的因素属性所对应的数据特征生成的样本集合,|D
ik
|是在第i个所述训练子集中属于第k个类别属性的因素属性所对应的数据特征生成的样本集合的样本容量;确定所述特征信息熵减去所述特征条件熵得到的差值为所述数据特征的信息增益。5.如权利要求1所述的基于大数据威胁感知的安全防护构建方法,其特征在于,所述利用信息增益生成所述威胁感知数据的增益序列,包括:利用如下经验熵算法根据所述数据特征生成所述威胁感知数据的因素经验熵:其中,H
A
(D)是所述威胁感知数据的因素经验熵,A是所述预设的属性标签中的因素属性,D是根据所述数据特征生成的训练集,|D|是所述训练集的样...

【专利技术属性】
技术研发人员:段保平谢维高向先虎
申请(专利权)人:云浮市宝逸技术开发有限公司
类型:发明
国别省市:

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1