数据库分级分类方法、系统、装置及存储介质制造方法及图纸

技术编号:35188068 阅读:13 留言:0更新日期:2022-10-12 18:01
本发明专利技术公开了一种数据库分级分类方法、系统、装置及存储介质,首先对数据库中数据属性字段对应的数据进行抽取,获得字段信息;根据数据属性字段和字段信息,构建数据库综合信息体;对数据库综合信息体内的字段信息进行数据识别,获得字段信息对应的识别标签;根据识别标签和预设的分级分类关联树,确定字段信息对应的分级分类结果;对分级分类结果进行展示。本申请实施例在对数据库进行分级分类时,考虑到数据库数据的属性信息,在数据库刚上线没有数据值等情况下,能够对数据库中的数据进行有效的分级分类。本方案中抽取部分数据进行数据识别,能够有效解决相关数据中识别海量数据的耗时较长的问题。耗时较长的问题。耗时较长的问题。

【技术实现步骤摘要】
数据库分级分类方法、系统、装置及存储介质


[0001]本申请涉及数据库
,尤其涉及一种数据库分级分类方法、系统、装置及存储介质。

技术介绍

[0002]随着大数据技术的发展,越来越多的数据被收集起来用于进行大数据分析。为了存储在数据库中的海量数据进行筛选,相关技术主要通过字典、正则匹配、人工标识的方式针对数据库中存储的数据值进行分类分级识别,但是相关技术的方案的准确度和效率都比较底下,难以匹配当前数据量极速增长的现状。

技术实现思路

[0003]本申请旨在至少在一定程度上解决相关技术中的技术问题之一。为此,本申请提出一种数据库分级分类方法、系统、装置及存储介质。
[0004]第一方面,本申请实施例提供了一种数据库分级分类方法,包括:对数据库中数据属性字段对应的数据进行抽取,获得字段信息;根据所述数据属性字段和所述字段信息,构建数据库综合信息体;对所述数据库综合信息体内的所述字段信息进行数据识别,获得所述字段信息对应的识别标签;根据所述识别标签和预设的分级分类关联树,确定所述字段信息对应的分级分类结果;对所述分级分类结果进行展示。
[0005]可选地,所述识别标签包括第一标签和第二标签,所述对所述数据库综合信息体内的数据进行数据识别,获得所述字段信息对应的识别标签,包括:将所述字段信息输入字典识别模型进行第一识别,获得所述第一标签;将在所述第一识别中的未识别字段信息输入关键字识别模型中进行第二识别,获得所述第二标签。
[0006]可选地,所述识别标签还包括第三标签,所述将所述第一识别中的未识别字段信息输入关键字识别模型中进行第二识别,获得所述第二标签这一步骤之后,还包括:将在所述第二识别中的所述未识别字段信息输入规则识别模型进行第三识别,获得第三标签;其中,所述第三识别包括正向规则匹配和逆向规则匹配。
[0007]可选地,所述识别标签还包括第四标签,将在所述第二识别中的未识别字段信息输入规则识别模型进行第三识别,获得第三标签这一步骤之后,还包括:将在所述第三识别中的所述未识别字段信息进行聚类,确定多组字段信息簇;其中,所述字段信息簇中包含多个所述字段信息;对所述字段信息簇的聚类中心进行人工识别,确定所述字段信息簇中所有字段信息对应的第四标签。
[0008]可选地,所述对所述数据库综合信息体内的所述字段信息进行数据识别,获得所述字段信息对应的识别标签,包括:根据所述识别过程中的命中频率和所述所述识别标签的权重,确定各个识别过程的置信度;根据所述置信度,确定需要进行下一阶段识别的所述未识别字段信息。
[0009]可选地,所述方法还包括:根据所述分级分类结果配置安全存储策略;根据所述安
全存储策略,确定数据库中的敏感分级分类;对所述敏感分级分类进行安全处理;其中,所述安全处理包括定时扫描、数据加密和数据脱敏;完成安全处理后,输出稽核报告。
[0010]可选地,所述方法还包括:存储所述敏感分级分类的访问记录;限制所述敏感分级分类的访问权限;存储所述敏感分级分类的数据的流向路径。
[0011]第二方面,本申请实施例提供了一种数据库分级分类系统,包括:第一模块,用于对数据库中数据属性字段对应的数据进行抽取,获得字段信息;第二模块,用于根据所述数据属性字段和所述字段信息,构建数据库综合信息体;第三模块,用于对所述数据库综合信息体内的所述字段信息进行数据识别,获得所述字段信息对应的识别标签;第四模块,用于根据所述识别标签和预设的分级分类关联树,确定所述字段信息对应的分级分类结果;第五模块,用于对所述分级分类结果进行展示。
[0012]第三方面,本申请实施例提供了一种数据库分级分类装置,包括:至少一个处理器;至少一个存储器,用于存储至少一个程序;当所述至少一个程序被所述至少一个处理器执行,使得所述至少一个处理器实现上述的数据库分级分类方法。
[0013]第四方面,本申请实施例提供了一种计算机存储介质,其中存储有处理器可执行的程序,所述处理器可执行的程序在由所述处理器执行时用于实现上述的数据库分级分类方法。
[0014]本申请实施例的有益效果如下:首先,对数据库中数据属性字段对应的数据进行抽取,获得字段信息;根据数据属性字段和字段信息,构建数据库综合信息体;对数据库综合信息体内的字段信息进行数据识别,获得字段信息对应的识别标签;根据识别标签和预设的分级分类关联树,确定字段信息对应的分级分类结果;对分级分类结果进行展示。本申请实施例在对数据库进行分级分类时,考虑到数据库数据的属性信息,在数据库刚上线没有数据值。或者是数据库中不同字段下的数据值具有相似性的情况下,能够对数据库中的数据进行有效的分级分类。并且,由于本方案中抽取部分数据进行数据识别,能够有效解决相关数据中识别海量数据的耗时较长的问题。
附图说明
[0015]附图用来提供对本申请技术方案的进一步理解,并且构成说明书的一部分,与本申请的实施例一起用于解释本申请的技术方案,并不构成对本申请技术方案的限制。
[0016]图1是本申请实施例提供的一种实施环境的示意图;
[0017]图2为本申请实施例提供的数据库分级分类方法的步骤流程;
[0018]图3为本申请实施例中的识别过程的步骤流程图;
[0019]图4为本申请实施例提供的数据库分级分类系统的示意图;
[0020]图5为本申请实施例提供的数据库分级分类装置的示意图。
具体实施方式
[0021]为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本申请,并不用于限定本申请。
[0022]需要说明的是,虽然在系统示意图中进行了功能模块划分,在流程图中示出了逻
辑顺序,但是在某些情况下,可以以不同于系统中的模块划分,或流程图中的顺序执行所示出或描述的步骤。说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。
[0023]随着大数据技术的发展,越来越多的数据被收集起来用于进行大数据分析。为了存储在数据库中的海量数据进行筛选,相关技术主要通过字典、正则匹配、人工标识的方式针对数据库中存储的数据值进行分类分级识别,但是相关技术的方案的准确度和效率都比较底下,难以匹配当前数据量极速增长的现状。
[0024]基于此,本申请实施例提供了一种数据库分级分类方法、系统、装置及存储介质,首先,对数据库中数据属性字段对应的数据进行抽取,获得字段信息;根据数据属性字段和字段信息,构建数据库综合信息体;对数据库综合信息体内的字段信息进行数据识别,获得字段信息对应的识别标签;根据识别标签和预设的分级分类关联树,确定字段信息对应的分级分类结果;对分级分类结果进行展示。本申请实施例在对数据库进行分级分类时,考虑到数据库数据的属性信息,在数据库刚上线没有数据值。或者是数据库中不同字段下的数据值具有相似性的情况下,能够对数据库中的数据进行有本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种数据库分级分类方法,其特征在于,包括:对数据库中数据属性字段对应的数据进行抽取,获得字段信息;根据所述数据属性字段和所述字段信息,构建数据库综合信息体;对所述数据库综合信息体内的所述字段信息进行数据识别,获得所述字段信息对应的识别标签;根据所述识别标签和预设的分级分类关联树,确定所述字段信息对应的分级分类结果;对所述分级分类结果进行展示。2.根据权利要求1所述的数据库分级分类方法,其特征在于,所述识别标签包括第一标签和第二标签,所述对所述数据库综合信息体内的数据进行数据识别,获得所述字段信息对应的识别标签,包括:将所述字段信息输入字典识别模型进行第一识别,获得所述第一标签;将在所述第一识别中的未识别字段信息输入关键字识别模型中进行第二识别,获得所述第二标签。3.根据权利要求2所述的数据库分级分类方法,其特征在于,所述识别标签还包括第三标签,所述将所述第一识别中的未识别字段信息输入关键字识别模型中进行第二识别,获得所述第二标签这一步骤之后,还包括:将在所述第二识别中的所述未识别字段信息输入规则识别模型进行第三识别,获得第三标签;其中,所述第三识别包括正向规则匹配和逆向规则匹配。4.根据权利要求3所述的数据库分级分类方法,其特征在于,所述识别标签还包括第四标签,将在所述第二识别中的未识别字段信息输入规则识别模型进行第三识别,获得第三标签这一步骤之后,还包括:将在所述第三识别中的所述未识别字段信息进行聚类,确定多组字段信息簇;其中,所述字段信息簇中包含多个所述字段信息;对所述字段信息簇的聚类中心进行人工识别,确定所述字段信息簇中所有字段信息对应的第四标签。5.根据权利要求2

4任一项所述的数据库分级分类方法,其特征在于,所述对所述数据库综合信息体内的所述字段信息进行...

【专利技术属性】
技术研发人员:袁征
申请(专利权)人:天翼爱音乐文化科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1