敏感数据分析方法、装置、电子设备及存储介质制造方法及图纸

技术编号:37122955 阅读:33 留言:0更新日期:2023-04-01 05:18
本申请提供敏感数据分析方法、装置、电子设备及存储介质,首先取第一数据库中被标定为敏感数据的第一字段;然后查找第一数据库中与第一字段所在第一数据表具有数据血缘关系的多个数据表,确定多个数据表中与第一字段相匹配的第一字段集,并将第一字段集中的所有字段标定为敏感数据;最后,至少依据第一字段和/或第一字段集中的所有字段查找其他系统中的各个数据库,得到与第一字段和/或第一字段集中的所有字段相匹配的第二字段集,并将第二字段集中的所有字段标定为敏感数据。本申请利用数据血缘关系和多数据系统采集对敏感数据进行全面分析,以数据库的维度全面查找出敏感数据,从根本上提高敏感数据在大数据汇聚交互共享过程中的安全性。享过程中的安全性。享过程中的安全性。

【技术实现步骤摘要】
敏感数据分析方法、装置、电子设备及存储介质


[0001]本申请涉及大数据
,尤其涉及敏感数据分析方法、装置、电子设备及存储介质。

技术介绍

[0002]大数据汇聚交换共享方式越来越普及,大数据侧可以通过API、库表交换、文件共享等多种实现方式来满足大数据汇聚交换共享的需求。但是,在大数据汇聚交换共享所带来便利的同时,在数据传输过程中例如身份信息等敏感数据的数据安全性无法得到有效保障。
[0003]相关技术中,如果发现API响应数据中携带有敏感数据,可以通过对API参数的修改对该敏感数据进行数据脱敏。但是,由于敏感数据还可能通过如库表交换、文件共享等其他方式泄漏,敏感数据的安全性仍然没有得到有效保障。

技术实现思路

[0004]为克服相关技术中存在的问题,本申请提供一种敏感数据分析方法、装置、电子设备及存储介质,该方法用以在数据库的维度全面查找出敏感数据,以实现从根本上提高敏感数据在大数据汇聚交互共享过程中的安全性。
[0005]本申请第一方面提供一种敏感数据分析方法,包括:获取第一数据库中被标定为敏感数据的第一字段,所述第一数据库存储于第一系统;
[0006]查找所述第一数据库中与所述第一字段所在第一数据表具有数据血缘关系的多个数据表,确定多个数据表中与所述第一字段相匹配的第一字段集,并将所述第一字段集中的所有字段标定为敏感数据;
[0007]至少依据所述第一字段和/或所述第一字段集中的所有字段查找其他系统中的各个数据库,得到与所述第一字段和/或所述第一字段集中的所有字段相匹配的第二字段集,并将所述第二字段集中的所有字段标定为敏感数据。
[0008]本申请第二方面提供一种敏感数据分析装置,包括:
[0009]第一处理模块,用于获取第一数据库中被标定为敏感数据的第一字段,所述第一数据库存储于第一系统;
[0010]第二处理模块,用于查找所述第一数据库中与所述第一字段所在第一数据表具有数据血缘关系的多个数据表,确定多个数据表中与所述第一字段相匹配的第一字段集,并将所述第一字段集中的所有字段标定为敏感数据;
[0011]第三处理模块,用于至少依据所述第一字段和/或所述第一字段集中的所有字段查找其他系统中的各个数据库,得到与所述第一字段和/或所述第一字段集中的所有字段相匹配的第二字段集,并将所述第二字段集中的所有字段标定为敏感数据。
[0012]本申请第三方面提供一种电子设备,包括:处理器;以及存储器,其上存储有可执行代码,当所述可执行代码被所述处理器执行时,使所述处理器执行如上所述的敏感数据
分析方法。
[0013]本申请第四方面提供一种非暂时性机器可读存储介质,其上存储有可执行代码,当所述可执行代码被电子设备的处理器执行时,使所述处理器执行如上所述的敏感数据分析方法。
[0014]本申请提供的一种敏感数据分析方法,该方法首先取第一数据库中被标定为敏感数据的第一字段;然后查找第一数据库中与第一字段所在第一数据表具有数据血缘关系的多个数据表,确定多个数据表中与第一字段相匹配的第一字段集,并将第一字段集中的所有字段标定为敏感数据;最后,至少依据第一字段和/或第一字段集中的所有字段查找其他系统中的各个数据库,得到与第一字段和/或第一字段集中的所有字段相匹配的第二字段集,并将第二字段集中的所有字段标定为敏感数据。本申请利用数据血缘关系和多数据系统采集对敏感数据进行全面分析,以数据库的维度全面查找出敏感数据,从根本上提高敏感数据在大数据汇聚交互共享过程中的安全性。
[0015]应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本申请。
附图说明
[0016]通过结合附图对本申请示例性实施方式进行更详细的描述,本申请的上述以及其它目的、特征和优势将变得更加明显,其中,在本申请示例性实施方式中,相同的参考标号通常代表相同部件。
[0017]图1为相关技术中大数据汇聚交换共享的场景示意图;
[0018]图2为本申请示出的一种敏感数据分析方法的流程示意图;
[0019]图3为本申请实施例示出的一种敏感数据分析方法中具有数据血缘关系的关系链的示例图;
[0020]图4为本申请实施例公开的一种敏感数据分析方法中具有数据血缘关系的数据表的示例图;
[0021]图5为本申请实施例公开的将第一字段标定为敏感数据的过程流程示意图;
[0022]图6为本申请实施例示出的一种敏感数据分析装置的结构示意图;
[0023]图7为本申请实施例示出的电子设备的结构示意图。
具体实施方式
[0024]下面将参照附图更详细地描述本申请的优选实施方式。虽然附图中显示了本申请的优选实施方式,然而应该理解,可以以各种形式实现本申请而不应被这里阐述的实施方式所限制。相反,提供这些实施方式是为了使本申请更加透彻和完整,并且能够将本申请的范围完整地传达给本领域的技术人员。
[0025]在本申请使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本申请。在本申请和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
[0026]应当理解,尽管在本申请可能采用术语“第一”、“第二”、“第三”等来描述各种信
息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本申请范围的情况下,第一信息也可以被称为第二信息,类似地,第二信息也可以被称为第一信息。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。在本申请的描述中,“多个”的含义是两个或两个以上,除非另有明确具体的限定。
[0027]本申请可以应用到大数据的相关场景下,例如大数据汇聚交换共享的场景中,参见图1,图1是相关技术中大数据汇聚交换共享的场景示意图。其中,通过API的方式访问中心数据库,数量大,系统多,敏感数据被泄漏的风险大。
[0028]相关技术中,通过对API响应数据进行敏感数据泄漏分析,从而对API的实现代码进行调整,可以对API中泄漏的敏感数据精准的保护。但是,通过图1可以看出,中心数据库中还可能通过其它多种方式对外提供包括敏感数据在内的其它数据,因此,当中心数据库采用其它方式时,仍存着敏感数据泄漏的风险。另外,大数据还存在多头采集即从多个系统的数据库同时对敏感数据进行采集的情况下,仅对于某一API的实现代码进行调整,也无法做到全面的分析排查。
[0029]本申请的核心思想是通过对API响应数据的监控,发现敏感数据后,直接对数据库中的相关字段均进行标记;再利用数据血缘对数据内在关系进行敏感数据的精准记录,并沿多叉树路径对上下游关联数据进行全面分析,进而可以根据不同的数据提供方式针对性的进行处理,例如,执行数据脱敏、字段加密或者删除字段等方式,从而从根源上本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种敏感数据分析方法,其特征在于,包括:获取第一数据库中被标定为敏感数据的第一字段,所述第一数据库存储于第一系统;查找所述第一数据库中与所述第一字段所在第一数据表具有数据血缘关系的多个数据表,确定多个数据表中与所述第一字段相匹配的第一字段集,并将所述第一字段集中的所有字段标定为敏感数据;至少依据所述第一字段和/或所述第一字段集中的所有字段查找其他系统中的各个数据库,得到与所述第一字段和/或所述第一字段集中的所有字段相匹配的第二字段集,并将所述第二字段集中的所有字段标定为敏感数据。2.根据权利要求1所述的方法,其特征在于,将所述第一字段标定为敏感数据的过程包括:获得针对于访问所述第一系统的所述第一数据库的API访问请求所返回的响应数据;当监测到所述响应数据中包括有敏感类型的第一数据时,确定所述第一数据在所述第一数据库中的位置信息;基于所述位置信息将所述第一数据库中的所述第一字段标定为敏感数据。3.根据权利要求2所述的方法,其特征在于,所述确定所述第一数据在所述第一数据库中的位置信息包括:查找所述第一数据在所述第一数据库中的位置信息,得到至少一个查找结果;将用户指定的查找结果作为所述位置信息。4.根据权利要求2所述的方法,其特征在于,所述基于所述位置信息将所述第一数据库中的第一字段标定为敏感数据包括:基于所述位置信息确定所述第一数据库中的第一数据表;确定所述第一数据表中与所述第一数据相匹配的第一字段;将所述第一字段对应的键名以及键值标定为敏感数据。5.根据权利要求4所述的方法,其特征在于,所述将所述第一字段对应的键名以及键值标定为敏感数据包括:将所述第一字段对应的键名以及键值写入敏感数据集合;或,将所述第一字段所在的位置信息添加...

【专利技术属性】
技术研发人员:彭碧波
申请(专利权)人:深信服科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1