一种数据安全性分级方法、装置、存储介质和电子装置制造方法及图纸

技术编号:37473198 阅读:19 留言:0更新日期:2023-05-06 09:57
本申请实施例公开了一种数据安全性分级方法、装置、存储介质和电子装置。所述方法包括:获取m个样本数据,其中第i个样本数据包括n维的特征向量x

【技术实现步骤摘要】
一种数据安全性分级方法、装置、存储介质和电子装置


[0001]本申请实施例涉及数据处理领域,尤指一种数据安全性分级方法、装置、存储介质和电子装置。

技术介绍

[0002]数据在经济社会发展具有非常高的重要性,一旦遭到非法利用,会造成较大危害程度,因此,对数据实行分类分级保护。
[0003]由于人工逐字段进行数据安全分级,效率太低,且误差较大,目前可以借助数据安全分级算法实现自动化或半自动化的安全分级,极大地减少人工工作量,同时可避免人为操作的主观性和不稳定性。
[0004]采用基于本体论和词频的数据分级方法的分级准确率有待进一步提高。

技术实现思路

[0005]为了解决上述任一技术问题,本申请实施例提供了一种数据安全性分级方法、装置、存储介质和电子装置。
[0006]为了达到本申请实施例目的,本申请实施例提供了一种数据安全性分级方法,包括:
[0007]获取m个样本数据,其中第i个样本数据包括n维的特征向量x
i
以及与n维特征向量x
i
一一对应的标签值y
i
,其中,i=1,2,3,...,m,n和m均为大于或等于2的整数,y
i
=1,2,3,...,R,其中R为等级的最大值;
[0008]利用m个样本数据的特征向量以及对应的标签值建立分级模型;
[0009]利用所述分级模型对待分级数据的特征向量进行处理,得到所述待分级数据对应的等级;
[0010]其中,所述分级模型的表达式如下:
[0011][0012]在上述表达式中,f(x)为对待分级数据x进行分级操作确定的等级,G
k
(x)为第k个决策树模型基于m个样本数据确定的分级参考结果,α
k
为第k个决策树模型对应的权重系数,其中,k=1,2,3,......,K,K和R均为大于或等于2的整数;
[0013]其中,权重系数α
k
是基于第k个决策树模型分级操作对应的分类误差e
k
以及等级最大值R确定的。
[0014]一种数据安全性分级装置,包括:
[0015]获取模块,设置为获取m个样本数据,其中第i个样本数据包括n维的特征向量x
i
以及与n维特征向量x
i
一一对应的标签值y
i
,其中,i=1,2,3,...,m,n和m均为大于或等于2的整数,y
i
=1,2,3,...,R,其中R为等级的最大值;
[0016]建立模块,设置为利用m个样本数据的特征向量以及对应的标签值建立分级模型;
[0017]分级模块,设置为利用所述分级模型对待分级数据的特征向量进行处理,得到所述待分级数据对应的等级;
[0018]其中,所述分级模型的表达式如下:
[0019][0020]在上述表达式中,f(x)为对待分级数据x进行分级操作确定的等级,G
k
(x)为第k个决策树模型基于m个样本数据确定的分级参考结果,α
k
为第k个决策树模型对应的权重系数,其中,k=1,2,3,......,K,K和R均为大于或等于2的整数;
[0021]其中,权重系数α
k
是基于第k个决策树模型分级操作对应的分类误差e
k
以及等级最大值R确定的。
[0022]一种存储介质,所述存储介质中存储有计算机程序,其中,所述计算机程序被设置为运行时执行上文所述的方法。
[0023]一种电子装置,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器被设置为运行所述计算机程序以执行上文所述的方法。
[0024]上述技术方案中的一个技术方案具有如下优点或有益效果:
[0025]由于系数α
k
是决策树在第k次分级操作对应的分类误差e
k
确定的,因此,分级模型能够体现决策树的分类准确度,使得确定的输入数据的等级具有较高的准确度,达到提高分级操作的准确度的目的。
[0026]本申请实施例的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本申请实施例而了解。本申请实施例的目的和其他优点可通过在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。
附图说明
[0027]附图用来提供对本申请实施例技术方案的进一步理解,并且构成说明书的一部分,与本申请实施例的实施例一起用于解释本申请实施例的技术方案,并不构成对本申请实施例技术方案的限制。
[0028]图1为本申请实施例提供的数据安全性分级方法的流程图;
[0029]图2为本申请实施例提供的特征向量与分级属性信息的对应关系示意图;
[0030]图3为本申请实施例提供的数据集中标签值的分布示意图;
[0031]图4为本申请实施例提供的测试集的标签图;
[0032]图5为本申请实施例提供的测试集分级结果的准确度的对比图;
[0033]图6为本申请实施例提供的数据安全性分级装置的结构示意图。
具体实施方式
[0034]为使本申请实施例的目的、技术方案和优点更加清楚明白,下文中将结合附图对本申请实施例的实施例进行详细说明。需要说明的是,在不冲突的情况下,本申请实施例中的实施例及实施例中的特征可以相互任意组合。
[0035]图1为本申请实施例提供的数据安全性分级方法的流程图。如图1所示,所述方法包括:
[0036]步骤101、获取m个样本数据,其中第i个样本数据包括n维的特征向量x
i
以及与n维特征向量x
i
一一对应的标签值y
i
,其中,i=1,2,3,...,m,n和m均为大于或等于2的整数,y
i
=1,2,3,...,R,其中R为等级的最大值;
[0037]步骤102、利用m个样本数据的特征向量以及对应的标签值建立分级模型;
[0038]步骤103、利用所述分级模型对待分级数据的特征向量进行处理,得到所述待分级数据对应的等级;
[0039]其中,所述分级模型的表达式如下:
[0040][0041]在上述表达式中,f(x)为对待分级数据x进行分级操作确定的等级,G
k
(x)为第k个决策树模型基于m个样本数据确定的分级参考结果,α
k
为第k个决策树模型对应的权重系数,其中,k=1,2,3,......,K,K和R均为大于或等于2的整数;
[0042]其中,权重系数α
k
是基于第k个决策树模型分级操作对应的分类误差e
k
以及等级最大值R确定的;
[0043]在上述示例性实施例中,
[0044]其中,可以使用ID3(Iterative Dichotomiser 3,二叉树三代)、C4.5、C5.0、CART本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种数据安全性分级方法,包括:获取m个样本数据,其中第i个样本数据包括n维的特征向量x
i
以及与n维特征向量x
i
一一对应的标签值y
i
,其中,i=1,2,3,...,m,n和m均为大于或等于2的整数,y
i
=1,2,3,...,R,其中R为等级的最大值;利用m个样本数据的特征向量以及对应的标签值建立分级模型;利用所述分级模型对待分级数据的特征向量进行处理,得到所述待分级数据对应的等级;其中,所述分级模型的表达式如下:在上述表达式中,f(x)为对待分级数据x进行分级操作确定的等级,G
k
(x)为第k个决策树模型基于m个样本数据确定的分级参考结果,α
k
为第k个决策树模型对应的权重系数,其中,k=1,2,3,......,K,K和R均为大于或等于2的整数;其中,权重系数α
k
是基于第k个决策树模型分级操作对应的分类误差e
k
以及等级最大值R确定的。2.根据权利要求1所述的方法,其特征在于,权重系数α
k
是通过如下计算表达式得到的,包括:3.根据权利要求2所述的方法,其特征在于,第k个决策树模型分级操作对应的分类误差e
k
是通过如下计算表达式得到的,包括:在上述表达式中,w
k,i
表示第k个决策树模型中第i个特征向量的权重,G
k
(x
i
)为第k个决策树模型基于第i个特征向量中的特征确定的标签参考结果。4.根据权利要求3所述的方法,其特征在于:在k等于1时,m组特征向量的权重w
1,i
为预设值;在k大于1时,第k个决策树模型分级操作m组特征向量的权重w
k,i
是通过如下方式得到的,包括:在上述表达式中,w
k

1,i
表示第k

1个决策树模型中第i个特征向量的权重,G
k
‑1(x

【专利技术属性】
技术研发人员:张毅杨敬轩晏松何泓霖陈宝刚杨锐马超
申请(专利权)人:中国民用航空局空中交通管理局
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1