一种数据敏感性的检测方法及服务器技术

技术编号:20589402 阅读:44 留言:0更新日期:2019-03-16 07:19
本发明专利技术公开一种数据敏感性的检测方法及服务器。其中,所述方法包括:获取至少一张数据表,数据表的每一个字段都预先设定对应的数据敏感权值,数据敏感权值表示与其对应的字段在数据表中的敏感性;根据数据表中的字段对应的数据敏感权值获得数据表的数据敏感权值;根据每张数据表的数据敏感权值获得所述至少一张数据表对应的敏感值;若判断获知敏感值大于预设值,则所述至少一张数据表存在敏感字段。所述服务器用于执行上述方法。本发明专利技术提供的数据敏感性的检测方法及服务器,能够通过数据表中的字段对应的数据敏感权值获得至少一张数据表对应的敏感值,根据敏感值判断出数据表中字段的敏感性,提高了对数据敏感性检测的准确性。

【技术实现步骤摘要】
一种数据敏感性的检测方法及服务器
本专利技术涉及信息安全
,具体涉及一种数据敏感性的检测方法及服务器。
技术介绍
随着云计算、大数据技术的应用和发展,传统企业开始部署越来越大规模的云计算集群,并且每天会有大量的业务数据和日志文件通过批处理或者定时任务流转到云平台上来。流转到大数据平台的数据中会包含企业的业务敏感信息、用户的个人隐私信息等敏感数据,需要被脱敏处理。目前,通常数据脱敏的处理方法是数据管理员把个人属性数据的关键字段比如用户手机号、姓名,身份证号、薪水,或者机密商业信息配置成需要进行脱敏处理的数据。数据脱敏的具体方法是将上述关键字段用替换、随机化、或者加密处理的方式进行处理,以达到对关键或者隐私数据保护的目的。例如,根据指定的数据字段进行脱敏处理、根据某些规则判断数据字段需要脱敏处理然后用脱敏算法进行脱敏处理,或者检测数据的内容根据模式匹配确定需要进行脱敏处理的数据然后进行脱敏处理。然而,有些数据根据现有技术的脱敏处理方法是不需要进行脱敏处理的,但实际上有必要对数据进行保护。例如:在一份报告的数据里面提到了女性用户占微博全量活跃用户的30%,在另外一份报告的数据里面提到微博全量活跃用户有六千万,如果这两份数据被关联进行分析,可以推断出微博的女性用户的数量,如果做进一步数据分析可以推断出不同年龄段的用户数量,甚至定位到具体某个位置小区的用户数据。也就是说,某些数据如果单个显示比如微博的活跃用户数量,这个可以公开披露,数据敏感性比较低,通过数据分析,可以公开的数据字段内容的敏感性会增大,成为需要进行脱敏处理的数据。因此,如何提出一种方法,能够提高对数据敏感性检测的准确性,成为业界亟待解决的重要课题。
技术实现思路
针对现有技术中的缺陷,本专利技术提供一种数据敏感性的检测方法及服务器。一方面,本专利技术提出一种数据敏感性的检测方法,包括:获取至少一张数据表,所述数据表的每一个字段都预先设定对应的数据敏感权值,所述数据敏感权值表示与其对应的字段在所述数据表中的敏感性;根据所述数据表中的字段对应的数据敏感权值获得所述数据表的数据敏感权值;根据每张所述数据表的数据敏感权值获得所述至少一张数据表对应的敏感值;若判断获知所述敏感值大于等于预设值,则所述至少一张数据表存在敏感字段。另一方面,本专利技术提供一种服务器,包括:获取模块,用于获取至少一张数据表,所述数据表的每一个字段都预先设定对应的数据敏感权值,所述数据敏感权值表示与其对应的字段在所述数据表中的敏感性;第一计算模块,用于根据所述字段对应的数据敏感权值获得所述数据表的数据敏感权值;第二计算模块,用于根据所述数据表的数据敏感权值获得所述至少一张数据表对应的敏感值;判断模块,用于若判断获知所述敏感值大于等于预设值,则所述至少一张数据表存在敏感字段。本专利技术提供的数据敏感性的检测方法及服务器,由于能够获取包含字段对应的数据敏感权值的至少一张数据表,并通过所述字段对应的数据敏感权值获得至少一张数据表对应的敏感值,从而根据敏感值判断出数据表中字段的敏感性,提高了对数据敏感性检测的准确性。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术一实施例数据敏感性的检测方法的流程示意图;图2为本专利技术一实施例服务器的结构示意图;图3为本专利技术另一实施例服务器的结构示意图;图4为本专利技术又一实施例服务器的结构示意图;图5为本专利技术实施例服务器的实体结构示意图。具体实施方式为使本专利技术的目的、技术方案和优点更加清楚,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。图1为本专利技术一实施例数据敏感性的检测方法的流程示意图,如图1所示,本专利技术提供的数据敏感性的检测方法,包括:S101、获取至少一张数据表,所述数据表的每一个字段都预先设定对应的数据敏感权值,所述数据敏感权值表示与其对应的字段在所述数据表中的敏感性;具体地,服务器从数据库或者大数据平台获取至少一张数据表,在所述数据表中的每一个字段都对应有数据敏感权值,所述数据敏感权值是数据最初导入到所述数据库或者大数据平台时设定的,所述数据敏感权值表示与所述敏感权值对应的所述字段的敏感性,例如一个所述数据表中包括用户手机号、姓名、工作部门、所属城市等字段,所述用户手机号和姓名属于敏感性最高的字段,可以设置最高的数据敏感权值,所述工作部门和所属城市属于敏感性较低的字段,可以设置较低的敏感权值。其中,所述字段对应的数据敏感权值可以在所述数据表的元数据中设定。例如,表1为用户信息表,如表1所示,身份证和姓名属于敏感性最高的字段,对应的数据敏感权值设置为最大数据敏感权值10,薪水的敏感性相对较低,对应的数据敏感权值可以设置为3,部门和职位的敏感性最低,对应的数据敏感权值可以设置为最小据敏感权值1。表1用户信息表名称数据类型数据敏感权值身份证整型10姓名字符型10薪水整型3部门字符型1职位字符型1S102、根据所述数据表中的字段对应的数据敏感权值获得所述数据表的数据敏感权值;具体地,所述服务器根据所述数据表中的字段对应的数据敏感权值获得所述数据表的数据敏感权值,例如将所述数据表中的字段对应的数据敏感权值的最大值作为所述数据表的数据敏感权值。S103、根据每张所述数据表的数据敏感权值获得所述至少一张数据表对应的敏感值;具体地,所述服务器在获得所述数据表的数据敏感权值后,根据每个所述数据表的数据敏感权值,获得所述至少一张数据表对应的敏感值。例如,所述服务器获得三张数据表的数据敏感权值分别为5、6和7,那么所述三张数据表对应的敏感值为5+6+7=18。S104、若判断获知所述敏感值大于等于预设值,则所述至少一张数据表存在敏感字段。具体地,所述服务器将获得的所述至少一张数据表对应的敏感值与预设值进行比较,如果所述敏感值大于等于预设值,则说明所述至少一张数据表中存在敏感字段,所述敏感性字段即需要保密的数据,不应该被共享或者公开。其中,所述预设值根据实际经验进行设置,本专利技术实施例不做限制。例如,所述服务器计算获得三张数据表对应的敏感值为18大于所述预设值为10,则所述三张数据表中存在敏感字段。本专利技术提供的数据敏感性的检测方法,由于能够获取包含字段对应的数据敏感权值的至少一张数据表,并通过所述字段对应的数据敏感权值获得至少一张数据表对应的敏感值,从而根据敏感值判断出数据表中数据的敏感性,提高了对数据敏感性检测的准确性。在上述实施例的基础上,进一步地,所述根据所述字段对应的数据敏感权值获得所述数据表的数据敏感权值包括:将所述数据表中的字段对应的数据敏感权值的最大值作为所述数据表的数据敏感权值;相应地,所述根据所述数据表的数据敏感权值获得所述至少一张数据表对应的敏感值包括:计算每张所述数据表的数据敏感权值之和,作为所述敏感值。具体地,所述服务器可以将所述数据本文档来自技高网
...

【技术保护点】
1.一种数据敏感性的检测方法,其特征在于,包括:获取至少一张数据表,所述数据表的每一个字段都预先设定对应的数据敏感权值,所述数据敏感权值表示与其对应的字段在所述数据表中的敏感性;根据所述数据表中的字段对应的数据敏感权值获得所述数据表的数据敏感权值;根据每张所述数据表的数据敏感权值获得所述至少一张数据表对应的敏感值;若判断获知所述敏感值大于等于预设值,则所述至少一张数据表存在敏感字段。

【技术特征摘要】
1.一种数据敏感性的检测方法,其特征在于,包括:获取至少一张数据表,所述数据表的每一个字段都预先设定对应的数据敏感权值,所述数据敏感权值表示与其对应的字段在所述数据表中的敏感性;根据所述数据表中的字段对应的数据敏感权值获得所述数据表的数据敏感权值;根据每张所述数据表的数据敏感权值获得所述至少一张数据表对应的敏感值;若判断获知所述敏感值大于等于预设值,则所述至少一张数据表存在敏感字段。2.根据权利要求1所述的方法,其特征在于,根据所述数据表中的字段对应的数据敏感权值获得所述数据表的数据敏感权值包括:将所述数据表中的字段对应的数据敏感权值的最大值作为所述数据表的数据敏感权值;相应地,所述根据每张所述数据表的数据敏感权值获得所述至少一张数据表对应的敏感值包括:计算每个所述数据表的数据敏感权值之和,作为所述敏感值。3.根据权利要求1所述的方法,其特征在于,还包括对所述至少一张数据表进行保密处理。4.根据权利要求1所述的方法,其特征在于,所述数据表的每个字段对应的数据敏感权值通过如下方式设定:若判断获知所述字段为关键字字段,则设定所述字段对应的数据敏感权值为最大数据敏感权值;若判断获知所述字段为外关键字段,则所述字段对应的数据敏感权值DFKey根据公式DFKey=DMax/STable获得,其中,DMax表示最大数据敏感权值,STable表示与所述外关键字段相关的所述数据表的数量;其中,所述外关键字段为所述相关的所述数据表共有的字段;若判断获知所述字段为一般性字段,则根据预设规则获得所述字段对应的数据敏感值;其中,所述一般性字段为除了所述关键字字段和所述外关键字段以...

【专利技术属性】
技术研发人员:周实奇尹华华吴列宏
申请(专利权)人:中国移动通信集团广东有限公司中国移动通信集团公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1