一种敏感数据的管理方法和系统技术方案

技术编号:24251830 阅读:83 留言:0更新日期:2020-05-22 23:43
本发明专利技术公开了一种敏感数据的管理方法和系统,在所述管理方法中对敏感数据的管理方法包括以下步骤:根据自定义的字段敏感等级,在保存有存量表的数据资产管理系统中对所述字段进行批量检索,从所述存量表中检索出所述敏感等级对应的待标注字段;在所述存量表中标注所述待标注字段的敏感等级,并将所述存量表中字段的最高敏感等级标注为所述存量表的敏感等级。本发明专利技术实施例通过这些标注更好的管理包括字段和字段存量表的敏感数据,从而有效区分存量表及字段的敏感等级,在数据存储、传输、查询、导出等场景下实施不同的安全管控策略,确保数据安全及使用合规,可有效保障对存量表及字段敏感等级标注的准确性,且减少了人力投入。

A management method and system of sensitive data

【技术实现步骤摘要】
一种敏感数据的管理方法和系统
本专利技术涉及数据安全领域,具体涉及一种敏感数据的管理方法和系统。
技术介绍
数据安全目前已成为全社会广泛关注的话题,国内外政府机构对数据安全的监管也越来越严格,在这种背景下,企业数据安全管理,尤其是进行大数据关联、挖掘为主营业务的互联网企业而言,加强数据的安全保护及运营合规将成为企业数据治理的重中之重,互联网企业经过多年的发展,都积累了大量数据资源,但普遍缺乏有效的数据安全及敏感数据保护意识,没有合理区分数据的敏感性,在数据敏感等级确定,尤其是对大批量存量数据管理方面普遍缺乏切实可行的安全管理方法,从而企业在对这些敏感数据进行传输或者导出时很容易出现管理的不合规,导致很多敏感数据中出现信息的泄露和个人隐私的盗取;另一方面,虽然当前有部分企业在对敏感数据例如字段等进行了管理,但是这些都是人工进行的管理,管理效率低下且花费巨大的人力和物力,如何高效的对这些敏感数据的管理,需要进一步的技术创新。
技术实现思路
为了解决现有技术的问题,本专利技术实施例提供了一种敏感数据的管理方法和系统,能够有效区分存量表及字段的敏感等级,保障对存量表及字段敏感等级标注的准确性,且减少了人力投入。为解决上述技术问题,本专利技术采用的技术方案是:第一方面,本专利技术实施例提供了一种敏感数据的管理方法,包括以下步骤:根据自定义的字段敏感等级,在保存有存量表的数据资产管理系统中对所述字段进行批量检索,从所述存量表中检索出所述敏感等级对应的待标注字段;在所述存量表中标注所述待标注字段的敏感等级,并将所述存量表中字段的最高敏感等级标注为所述存量表的敏感等级。进一步地,对所述字段进行批量检索前包括对所述字段构建最简匹配词,所述最简匹配词为所述字段及关联的同义词形成的保持字段语义完整的搜索关键词。进一步地,对所述待标注字段批量检索后包括对所述待标注字段进行筛选,所述筛选包括以下步骤:从所述存量表中输出所述待标注字段模糊匹配的检索结果,通过SQL语句对所述检索结果的干扰字段进行批量删除,得到精确匹配的待标注字段清单。进一步地,对精确匹配的所述待标注字段通过Hive工具进行存储后再进行标注,通过Hive工具完成对所述待标注字段的数据提取、转化、加载。进一步地,对所述字段的批量检索为分批次进行单一敏感等级的检索,每次输出的检索结果为单一敏感等级的所述待标注字段。另一方面,本专利技术实施例还提供了一种敏感数据的管理系统,包括:字段检索模块,用于根据自定义的字段敏感等级,在保存有存量表的数据资产管理系统中对所述字段进行批量检索,从所述存量表中检索出所述敏感等级对应的待标注字段;等级标注模块,用于在所述存量表中标注所述待标注字段的敏感等级,并将所述存量表中字段的最高敏感等级标注为所述存量表的敏感等级。进一步地,所述字段检索模块包括有字段规范单元,所述字段规范单元用于对所述字段进行批量检索前包括对所述字段构建最简匹配词,所述最简匹配词为所述字段及关联的同义词形成的保持字段语义完整的搜索关键词。进一步地,对所述待标注字段批量检索后包括所述字段检索模块对所述待标注字段进行筛选,所述字段检索模块对所述待标注字段的筛选包括以下步骤:从所述存量表中输出所述待标注字段模糊匹配的检索结果,通过SQL语句对所述检索结果的干扰字段进行批量删除,得到精确匹配的待标注字段清单。进一步地,对精确匹配的所述待标注字段通过Hive工具进行存储后再进行标注,通过Hive工具完成对所述待标注字段的数据提取、转化、加载。进一步地,所述字段检索模块对所述字段的批量检索为分批次进行单一敏感等级的检索,每次输出的检索结果为单一敏感等级的所述待标注字段。本专利技术实施例提供的技术方案带来的有益效果是:本专利技术实施例提供的一种敏感数据的管理方法和系统,在所述管理方法中根据企业对于数据敏感程度的要求不同,首先自定义需要管理的字段的敏感等级,在企业内部的数据资产管理系统中对该自定义的字段进行检索和筛选,最后对企业内部的数据资产管理系统中进行字段和字段所在的存量表进行敏感等级的标注,通过这些标注更好的管理包括字段和字段存量表的敏感数据,从而有效区分存量表及字段的敏感等级,在数据存储、传输、查询、导出等场景下实施不同的安全管控策略,确保数据安全及使用合规,与当前普遍的由表负责人进行人工标注敏感等级的方式相比,可有效保障对存量表及字段敏感等级标注的准确性,且减少了人力投入。附图说明为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1是本专利技术实施例公开的敏感数据的管理方法的流程示意图;图2是本专利技术实施例公开的敏感数据的管理方法的逻辑示意图。具体实施方式为使本专利技术的目的、技术方案和优点更加清楚,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。实施例一:如图1和图2所示,本实施例提供了一种敏感数据的管理方法,包括以下步骤:S1:根据自定义的字段敏感等级,在保存有存量表的数据资产管理系统中对所述字段进行批量检索,从所述存量表中检索出所述敏感等级对应的待标注字段;S2:在所述存量表中标注所述待标注字段的敏感等级,并将所述存量表中字段的最高敏感等级标注为所述存量表的敏感等级。具体地,在所述管理方法中根据企业对于数据敏感程度的不同,首先自定义需要管理的字段的敏感等级,在企业内部的数据资产管理系统中对该自定义的字段进行检索和筛选,最后对企业内部的数据资产管理系统中进行字段和字段所在的存量表进行敏感等级的标注,通过这些标注更好的管理包括字段和字段存量表的敏感数据,从而有效区分存量表及字段的敏感等级,在数据存储、传输、查询、导出等场景下实施不同的安全管控策略,确保数据安全及使用合规,与当前普遍的由表负责人进行人工标注敏感等级的方式相比,可有效保障对存量表及字段敏感等级标注的准确性,且减少了人力投入。优选地,对所述字段自定义的敏感等级依次为:对外公开、内部公开、一般敏感、特别敏感、高度机密,并依次对应于1~5五个自然数字,可以参照行业标准,以及国家立法部门在数据安全方面的相关法规,定义企业自己的数据敏感等级标准。需要说明的是,敏感等级数目的确定,既要有利于数据敏感度的合理区分,也要考虑基于不同敏感等级实施安全管控措施的可行性,一般4-5级是比较合理的,本实施例中,选取的是5级,从高到低分别为:5(高度机密)、4(特别敏感)、3(一般敏感)、2(内部公开)、1(对外公开)。另外,这里敏感等级的定义,对于数据表本文档来自技高网...

【技术保护点】
1.一种敏感数据的管理方法,其特征在于,包括以下步骤:/n根据自定义的字段敏感等级,在保存有存量表的数据资产管理系统中对所述字段进行批量检索,从所述存量表中检索出所述敏感等级对应的待标注字段;/n在所述存量表中标注所述待标注字段的敏感等级,并将所述存量表中字段的最高敏感等级标注为所述存量表的敏感等级。/n

【技术特征摘要】
1.一种敏感数据的管理方法,其特征在于,包括以下步骤:
根据自定义的字段敏感等级,在保存有存量表的数据资产管理系统中对所述字段进行批量检索,从所述存量表中检索出所述敏感等级对应的待标注字段;
在所述存量表中标注所述待标注字段的敏感等级,并将所述存量表中字段的最高敏感等级标注为所述存量表的敏感等级。


2.根据权利要求1所述的敏感数据的管理方法,其特征在于,对所述字段进行批量检索前包括对所述字段构建最简匹配词,所述最简匹配词为所述字段及关联的同义词形成的保持字段语义完整的搜索关键词。


3.根据权利要求1所述的敏感数据的管理方法,其特征在于,对所述待标注字段批量检索后包括对所述待标注字段进行筛选,所述筛选包括以下步骤:从所述存量表中输出所述待标注字段模糊匹配的检索结果,通过SQL语句对所述检索结果的干扰字段进行批量删除,得到精确匹配的待标注字段清单。


4.根据权利要求3所述的敏感数据的管理方法,其特征在于,对精确匹配的所述待标注字段通过Hive工具进行存储后再进行标注,通过Hive工具完成对所述待标注字段的数据提取、转化、加载。


5.根据权利要求1所述的敏感数据的管理方法,其特征在于,对所述字段的批量检索为分批次进行单一敏感等级的检索,每次输出的检索结果为单一敏感等级的所述待标注字段。


6.一种敏感数据的管理系统,其特征在于,包括:
字段检索...

【专利技术属性】
技术研发人员:胡中贵武程刘峰
申请(专利权)人:苏宁云计算有限公司
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1