【技术实现步骤摘要】
一种数据安全性分级方法、装置、存储介质和电子装置
[0001]本申请实施例涉及数据处理领域,尤指一种数据安全性分级方法、装置、存储介质和电子装置。
技术介绍
[0002]数据在经济社会发展具有非常高的重要性,一旦遭到非法利用,会造成较大危害程度,因此,对数据实行分类分级保护。
[0003]由于人工逐字段进行数据安全分级,效率太低,且误差较大,目前可以借助数据安全分级算法实现自动化或半自动化的安全分级,极大地减少人工工作量,同时可避免人为操作的主观性和不稳定性。
[0004]采用基于本体论和词频的数据分级方法的分级准确率有待进一步提高。
技术实现思路
[0005]为了解决上述任一技术问题,本申请实施例提供了一种数据安全性分级方法、装置、存储介质和电子装置。
[0006]为了达到本申请实施例目的,本申请实施例提供了一种数据安全性分级方法,包括:
[0007]获取m个样本数据,其中第i个样本数据包括n维的特征向量x
i
以及与n维特征向量x
i
一一对应的标签值y
i
,其中,i=1,2,3,...,m,n和m均为大于或等于2的整数,y
i
=1,2,3,...,R,其中R为等级的最大值;
[0008]利用m个样本数据的特征向量以及对应的标签值建立分级模型;
[0009]利用所述分级模型对待分级数据的特征向量进行处理,得到所述待分级数据对应的等级;
[0010]其中,所述分级模型的表达式如 ...
【技术保护点】
【技术特征摘要】 【专利技术属性】
1.一种数据安全性分级方法,包括:获取m个样本数据,其中第i个样本数据包括n维的特征向量x
i
以及与n维特征向量x
i
一一对应的标签值y
i
,其中,i=1,2,3,...,m,n和m均为大于或等于2的整数,y
i
=1,2,3,...,R,其中R为等级的最大值;利用m个样本数据的特征向量以及对应的标签值建立分级模型;利用所述分级模型对待分级数据的特征向量进行处理,得到所述待分级数据对应的等级;其中,所述分级模型的表达式如下:在上述表达式中,f(x)为对待分级数据x进行分级操作确定的等级,G
k
(x)为第k个决策树模型基于m个样本数据确定的分级参考结果,α
k
为第k个决策树模型对应的权重系数,其中,k=1,2,3,......,K,K和R均为大于或等于2的整数;其中,权重系数α
k
是基于第k个决策树模型分级操作对应的分类误差e
k
以及等级最大值R确定的。2.根据权利要求1所述的方法,其特征在于,权重系数α
k
是通过如下计算表达式得到的,包括:3.根据权利要求2所述的方法,其特征在于,第k个决策树模型分级操作对应的分类误差e
k
是通过如下计算表达式得到的,包括:在上述表达式中,w
k,i
表示第k个决策树模型中第i个特征向量的权重,G
k
(x
i
)为第k个决策树模型基于第i个特征向量中的特征确定的标签参考结果。4.根据权利要求3所述的方法,其特征在于:在k等于1时,m组特征向量的权重w
1,i
为预设值;在k大于1时,第k个决策树模型分级操作m组特征向量的权重w
k,i
是通过如下方式得到的,包括:在上述表达式中,w
k
‑
1,i
表示第k
‑
1个决策树模型中第i个特征向量的权重,G
k
‑1(x
技术研发人员:张毅,杨敬轩,晏松,何泓霖,陈宝刚,杨锐,马超,
申请(专利权)人:中国民用航空局空中交通管理局,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。