数据分类分级的方法和装置制造方法及图纸

技术编号:36605630 阅读:15 留言:0更新日期:2023-02-04 18:27
本发明专利技术公开了一种数据分类分级的方法和装置,涉及计算机技术领域。该方法的一具体实施方式包括:使用第一数据分类规则对待分类分级的数据进行第一分类得到数据所属的第一类别;使用第一类别对应的第二数据分类规则对数据进行第二分类得到数据所属的第二类别;根据预设的分类分级规则获取第二类别对应的级别,分类分级规则用于标示数据所属的类别与级别之间的映射关系;将第二类别和与第二类别对应的级别作为数据的分类分级结果。该实施方式根据分类分级规则和数据的类别来确定数据所属的级别,可以在不同行业中使用,可移植性和灵活性强。活性强。活性强。

【技术实现步骤摘要】
数据分类分级的方法和装置


[0001]本专利技术涉及计算机
,尤其涉及一种数据分类分级的方法和装置。

技术介绍

[0002]随着《个人信息保护法》和《数据安全法》等网络安全法案的出台,企业需要对其保存的数据进行分类分级,从而实现更精细化的信息安全管理。目前的数据分类分级多是针对特定行业的数据,通过固定的分类分级规则或者人工智能数据模型来进行分类分级。
[0003]在实现本专利技术过程中,专利技术人发现现有技术中至少存在如下问题:
[0004]通过固定的分类分级规则进行数据分类分级的方法只能在单一行业中使用,可移植性差,无法在不同行业中使用,难以快速移植到其他行业。使用人工智能数据模型来对数据进行分类分级,当加入新的数据类型或数据分类方法改变时,需要消耗大量时间和算力重新计算模型,难以灵活扩展和配置。

技术实现思路

[0005]有鉴于此,本专利技术实施例提供一种数据分类分级的方法和装置,能够将数据分类与数据分级分开进行,可以设置不同行业对应的分类分级规则,根据分类分级规则和数据的类别来确定数据所属的级别,可以在不同行业中使用,可移植性和灵活性强。同时,在对数据进行分类时,可以对不同的数据使用不同的分类规则进行分类,可灵活配置分类规则,从而在加入新的数据类型或数据分类方法改变时,可以灵活选取对应的数据分类规则,分类更灵活方便。另外,对于结构化数据,可以仅使用其元数据来进行数据分类,从而避免了对用户隐私的侵入,更好地保护了用户的隐私和数据安全,且适用于数据被加密的场景。
[0006]为实现上述目的,根据本专利技术实施例的一个方面,提供了一种数据分类分级的方法,包括:
[0007]使用第一数据分类规则对待分类分级的数据进行第一分类得到所述数据所属的第一类别;
[0008]使用所述第一类别对应的第二数据分类规则对所述数据进行第二分类得到所述数据所属的第二类别;
[0009]根据预设的分类分级规则获取所述第二类别对应的级别,所述分类分级规则用于标示数据所属的类别与级别之间的映射关系;
[0010]将所述第二类别和与所述第二类别对应的级别作为所述数据的分类分级结果。
[0011]可选地,使用第一数据分类规则对待分类分级的数据进行第一分类得到所述数据所属的第一类别,包括:根据数据的存储格式和数据结构对待分类分级的数据进行第一分类得到所述数据所属的第一类别,所述第一类别包括结构化数据、半结构化数据和非结构化数据。
[0012]可选地,在所述第一类别为结构化数据的情况下,所述第一类别对应的第二数据分类规则为使用基于元数据的数据字典进行数据分类;使用所述第一类别对应的第二数据
分类规则对所述数据进行第二分类得到所述数据所属的第二类别,包括:使用基于元数据的数据字典对所述数据进行第二分类得到所述数据所属的第二类别。
[0013]可选地,使用基于元数据的数据字典对所述数据进行第二分类得到所述数据所属的第二类别,包括:获取所述数据的元数据,并对所述元数据进行分词;将分词得到的不少于一个词语,分别与所述基于元数据的数据字典进行词语匹配以得到命中词语及每个命中词语的个数,根据所述命中词语的个数计算不同类别的命中词语对应的命中率;根据所述不同类别的命中词语对应的命中率确定所述数据所属的第二类别。
[0014]可选地,在所述第一类别为半结构化数据的情况下,所述第一类别对应的第二数据分类规则包括:使用基于内容的数据字典进行数据分类和基于正则表达式进行数据分类中的至少一种;在使用所述第一类别对应的第二数据分类规则对所述数据进行第二分类得到所述数据所属的第二类别之前,还包括:根据第三数据分类规则将所述数据划分为由特定规则组成的规则数据和非规则数据;使用所述第一类别对应的第二数据分类规则对所述数据进行第二分类得到所述数据所属的第二类别,包括:使用基于内容的数据字典对所述数据中的非规则数据进行第二分类得到所述数据所属的第三类别;基于正则表达式对所述数据中的规则数据进行第二分类得到所述数据所属的第四类别;根据所述数据所属的第三类别和第四类别生成所述数据所属的第二类别。
[0015]可选地,所述第一类别对应的第二数据分类规则还包括:使用基于元数据的数据字典进行数据分类;在使用所述第一类别对应的第二数据分类规则对所述数据进行第二分类得到所述数据所属的第二类别之前,还包括:获取所述数据的元数据;使用所述第一类别对应的第二数据分类规则对所述数据进行第二分类得到所述数据所属的第二类别,包括:使用基于元数据的数据字典对所述数据的元数据进行第二分类得到所述数据所属的第五类别;使用基于内容的数据字典对所述数据中的非规则数据进行第二分类得到所述数据所属的第三类别;基于正则表达式对所述数据中的规则数据进行第二分类得到所述数据所属的第四类别;根据所述数据所属的第五类别、第三类别和第四类别生成所述数据所属的第二类别。
[0016]可选地,在所述第一类别为非结构化数据的情况下,所述第一类别对应的第二数据分类规则包括:基于人工智能数据模型进行数据分类;使用所述第一类别对应的第二数据分类规则对所述数据进行第二分类得到所述数据所属的第二类别,包括:基于人工智能数据模型对所述数据进行第二分类得到所述数据所属的第二类别。
[0017]根据本专利技术实施例的另一方面,提供了一种数据分类分级的装置,包括:
[0018]第一分类模块,用于使用第一数据分类规则对待分类分级的数据进行第一分类得到所述数据所属的第一类别;
[0019]第二分类模块,用于使用所述第一类别对应的第二数据分类规则对所述数据进行第二分类得到所述数据所属的第二类别;
[0020]级别获取模块,用于根据预设的分类分级规则获取所述第二类别对应的级别,所述分类分级规则用于标示数据所属的类别与级别之间的映射关系;
[0021]结果确定模块,用于将所述第二类别和与所述第二类别对应的级别作为所述数据的分类分级结果。
[0022]根据本专利技术实施例的又一方面,提供了一种数据分类分级的电子设备,包括:一个
或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现本专利技术实施例所提供的数据分类分级的方法。
[0023]根据本专利技术实施例的再一方面,提供了一种计算机可读介质,其上存储有计算机程序,所述程序被处理器执行时实现本专利技术实施例所提供的数据分类分级的方法。
[0024]上述专利技术中的一个实施例具有如下优点或有益效果:通过使用第一数据分类规则对待分类分级的数据进行第一分类得到数据所属的第一类别;使用第一类别对应的第二数据分类规则对数据进行第二分类得到数据所属的第二类别;根据预设的分类分级规则获取第二类别对应的级别,分类分级规则用于标示数据所属的类别与级别之间的映射关系;将第二类别和与第二类别对应的级别作为数据的分类分级结果的技术方案,将数据分类与数据分级分开进行,可以设置不同行业对应的分类分级规则,根据分类分级规则和数据的类别来确定数据所属的级别,本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种数据分类分级的方法,其特征在于,包括:使用第一数据分类规则对待分类分级的数据进行第一分类得到所述数据所属的第一类别;使用所述第一类别对应的第二数据分类规则对所述数据进行第二分类得到所述数据所属的第二类别;根据预设的分类分级规则获取所述第二类别对应的级别,所述分类分级规则用于标示数据所属的类别与级别之间的映射关系;将所述第二类别和与所述第二类别对应的级别作为所述数据的分类分级结果。2.根据权利要求1所述的方法,其特征在于,使用第一数据分类规则对待分类分级的数据进行第一分类得到所述数据所属的第一类别,包括:根据数据的存储格式和数据结构对待分类分级的数据进行第一分类得到所述数据所属的第一类别,所述第一类别包括结构化数据、半结构化数据和非结构化数据。3.根据权利要求2所述的方法,其特征在于,在所述第一类别为结构化数据的情况下,所述第一类别对应的第二数据分类规则为使用基于元数据的数据字典进行数据分类;使用所述第一类别对应的第二数据分类规则对所述数据进行第二分类得到所述数据所属的第二类别,包括:使用基于元数据的数据字典对所述数据进行第二分类得到所述数据所属的第二类别。4.根据权利要求3所述的方法,其特征在于,使用基于元数据的数据字典对所述数据进行第二分类得到所述数据所属的第二类别,包括:获取所述数据的元数据,并对所述元数据进行分词;将分词得到的不少于一个词语,分别与所述基于元数据的数据字典进行词语匹配以得到命中词语及每个命中词语的个数,根据所述命中词语的个数计算不同类别的命中词语对应的命中率;根据所述不同类别的命中词语对应的命中率确定所述数据所属的第二类别。5.根据权利要求2所述的方法,其特征在于,在所述第一类别为半结构化数据的情况下,所述第一类别对应的第二数据分类规则包括:使用基于内容的数据字典进行数据分类和基于正则表达式进行数据分类中的至少一种;在使用所述第一类别对应的第二数据分类规则对所述数据进行第二分类得到所述数据所属的第二类别之前,还包括:根据第三数据分类规则将所述数据划分为由特定规则组成的规则数据和非规则数据;使用所述第一类别对应的第二数据分类规则对所述数据进行第二分类得到所述数据所属的第二类别,包括:使用基于内容的数据字典对所述数据中的非规则数据进行第二分类得到所述数据所属的第三类别;基于正则表达式对所述数据中的规则...

【专利技术属性】
技术研发人员:郭瑾仪
申请(专利权)人:京东科技信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1