基于机器学习的数据脱敏方法、装置及存储介质制造方法及图纸

技术编号:19545859 阅读:24 留言:0更新日期:2018-11-24 20:57
本发明专利技术提供一种基于机器学习的数据脱敏方法、装置及存储介质,其中方法包括:获取待处理数据的属性信息,根据所述属性信息通过机器学习确定第一脱敏规则,根据第一脱敏规则对待处理数据进行脱敏处理。本发明专利技术提供的基于机器学习的数据脱敏方法、装置及存储介质,能够在对数据进行脱敏处理前不需要人工确认脱敏规则,不需采用大量的人力时间成本去对脱敏规则进行设置,进而提高了数据脱敏时的效率。

Data desensitization method, device and storage medium based on machine learning

The invention provides a data desensitization method, device and storage medium based on machine learning. The method includes acquiring attribute information of data to be processed, determining the first desensitization rule by machine learning according to the attribute information, and desensitization treatment of the processed data according to the first desensitization rule. The data desensitization method, device and storage medium based on machine learning provided by the invention can desensitize data without manual confirmation of desensitization rules before desensitization processing, and need not use a large amount of human time cost to set desensitization rules, thereby improving the efficiency of data desensitization.

【技术实现步骤摘要】
基于机器学习的数据脱敏方法、装置及存储介质
本专利技术涉及数据处理
,尤其涉及一种基于机器学习的数据脱敏方法、装置及存储介质。
技术介绍
数据脱敏是指对数据中包含的秘密或隐私信息进行特殊处理,达到数据变形的效果,使得攻击者无法从中直接获得敏感信息。在医疗、电力、金融、电信等诸多行业中,数据脱敏都有着广泛的应用。现有技术中,数据脱敏时使用的脱敏规则与数据的匹配都是手动设置的,并且需要提交管理员并进行多次审核,审核通过后脱敏规则才与数据的匹配正式有效,并可以进行数据脱敏操作。采用现有技术,对数据进行脱敏处理前,需要确认脱敏规则,不仅需要大量的人力时间成本而且工作重复冗余,造成了数据脱敏时的效率较低。
技术实现思路
本专利技术提供一种基于机器学习的数据脱敏方法、装置及存储介质,提高了数据脱敏时的效率。本专利技术第一方面提供一种基于机器学习的数据脱敏方法,包括:获取待处理数据的属性信息;根据所述属性信息通过机器学习确定第一脱敏规则;根据所述第一脱敏规则对所述待处理数据进行脱敏处理。在本专利技术第一方面一实施例中,所述通过机器学习确定所述待处理数据的第一脱敏规则,包括:将所述属性信息送入分类器,由所述分类器输出所述第一脱敏规则;其中,所述分类器用于根据已学习数据的属性信息与脱敏规则的匹配关系确定所述待处理数据所对应的第一脱敏规则。在本专利技术第一方面一实施例中,所述分类器中存储N种已学习数据的属性信息、M种脱敏规则以及所述已学习数据的属性信息与所述脱敏规则的匹配关系,所述N和M为正整数,所述N和M相同或不同。在本专利技术第一方面一实施例中,所述分类器中存储所述第一脱敏规则;或者,所述分类器中未存储所述第一脱敏规则。在本专利技术第一方面一实施例中,若所述分类器中未存储所述第一脱敏规则,所述方法还包括:将所述待处理数据的属性信息、所述第一脱敏规则以及所述待处理数据的属性信息与所述第一脱敏规则的匹配关系存储至所述分类器中。在本专利技术第一方面一实施例中,将所述待处理数据的属性信息与所述第一脱敏规则的匹配关系发送至审批设备;当接收所述审批设备发送的确认指示,将所述待处理数据的属性信息、所述第一脱敏规则以及所述待处理数据的属性信息与所述第一脱敏规则的匹配关系存储至所述分类器中。在本专利技术第一方面一实施例中,所述将所述待处理数据的属性信息与所述第一脱敏规则的匹配关系发送至审批设备之后,还包括:当接收所述审批设备发送的第二脱敏规则,根据所述第二脱敏规则对所述待处理数据进行脱敏处理;将所述待处理数据的属性信息、所述第二脱敏规则以及所述待处理数据的属性信息与所述第二脱敏规则的匹配关系存储至所述分类器中。综上,本专利技术第一方面提供的基于机器学习的数据脱敏方法中,在获取待处理数据的属性信息后,根据所述属性信息通过机器学习确定第一脱敏规则,并根据第一脱敏规则对待处理数据进行脱敏处理。从而在对数据进行脱敏处理前不需要人工确认脱敏规则,因此不需采用大量的人力时间成本去对脱敏规则进行设置,提高了数据脱敏时的效率。本专利技术第二方面提供一种基于机器学习的数据脱敏装置,包括:获取模块,用于获取待处理数据的属性信息;确定模块,用于根据所述属性信息通过机器学习确定第一脱敏规则;处理模块,用于根据所述第一脱敏规则对所述待处理数据进行脱敏处理。在本专利技术第二方面一实施例中,所述确定模块具体用于,将所述属性信息送入分类器,由所述分类器输出所述第一脱敏规则;其中,所述分类器用于根据已学习数据的属性信息与脱敏规则的匹配关系确定所述待处理数据所对应的第一脱敏规则。在本专利技术第二方面一实施例中,所述分类器中存储N种已学习数据的属性信息、M种脱敏规则以及所述已学习数据的属性信息与所述脱敏规则的匹配关系,所述N和M为正整数,所述N和M相同或不同。在本专利技术第二方面一实施例中,所述分类器中存储所述第一脱敏规则;或者,所述分类器中未存储所述第一脱敏规则。在本专利技术第二方面一实施例中,若所述分类器中未存储所述第一脱敏规则,所述确定模块还用于:将所述待处理数据的属性信息、所述第一脱敏规则以及所述待处理数据的属性信息与所述第一脱敏规则的匹配关系存储至所述分类器中。在本专利技术第二方面一实施例中,所述确定模块还用于,将所述待处理数据的属性信息与所述第一脱敏规则的匹配关系发送至审批设备;当接收所述审批设备发送的确认指示,将所述待处理数据的属性信息、所述第一脱敏规则以及所述待处理数据的属性信息与所述第一脱敏规则的匹配关系存储至所述分类器中。在本专利技术第二方面一实施例中,所述确定模块还用于,当接收所述审批设备发送的第二脱敏规则,根据所述第二脱敏规则对所述待处理数据进行脱敏处理;将所述待处理数据的属性信息、所述第二脱敏规则以及所述待处理数据的属性信息与所述第二脱敏规则的匹配关系存储至所述分类器中。综上,本专利技术第二方面提供的基于机器学习的数据脱敏装置中,通过获取模块获取待处理数据的属性信息后,确定模块根据属性信息通过机器学习确定第一脱敏规则,使得处理模块根据第一脱敏规则对待处理数据进行脱敏处理。从而在对数据进行脱敏处理前不需要人工确认脱敏规则,因此不需采用大量的人力时间成本去对脱敏规则进行设置,提高了数据脱敏时的效率。本专利技术第三方面提供一种基于机器学习的数据脱敏装置,包括:处理器;以及,存储器,用于存储所述处理器的可执行指令;其中,所述处理器配置为经由执行所述可执行指令来执行上述第一方面任一项所述的基于机器学习的数据脱敏方法。本专利技术第四方面提供一种存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述第一方面任一项所述的基于机器学习的数据脱敏方法。上述说明仅是本专利技术技术方案的概述,为了能够更清楚了解本专利技术的技术手段,并可依照说明书的内容予以实施,以下以本专利技术的较佳实施例并配合附图详细说明如后。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术基于机器学习的数据脱敏方法实施例一的流程示意图;图2为本专利技术基于机器学习的数据脱敏系统实施例一的结构示意图;图3为本专利技术基于机器学习的数据脱敏方法实施例二的流程示意图;图4为本专利技术基于机器学习的数据脱敏装置实施例一的流程示意图。通过上述附图,已示出本公开明确的实施例,后文中将有更详细的描述。这些附图和文字描述并不是为了通过任何方式限制本公开构思的范围,而是通过参考特定实施例为本领域技术人员说明本公开的概念。下面以具体地实施例对本专利技术的技术方案进行详细说明。下面的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例不再赘述。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。本专利技术的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。本文档来自技高网...

【技术保护点】
1.一种基于机器学习的数据脱敏方法,其特征在于,包括:获取待处理数据的属性信息;根据所述属性信息通过机器学习确定第一脱敏规则;根据所述第一脱敏规则对所述待处理数据进行脱敏处理。

【技术特征摘要】
1.一种基于机器学习的数据脱敏方法,其特征在于,包括:获取待处理数据的属性信息;根据所述属性信息通过机器学习确定第一脱敏规则;根据所述第一脱敏规则对所述待处理数据进行脱敏处理。2.根据权利要求1所述的方法,其特征在于,所述根据所述属性信息通过机器学习确定第一脱敏规则,包括:将所述属性信息送入分类器,由所述分类器输出所述第一脱敏规则;其中,所述分类器用于根据已学习数据的属性信息与脱敏规则的匹配关系确定所述待处理数据所对应的第一脱敏规则。3.根据权利要求2所述的方法,其特征在于,所述分类器中存储N种已学习数据的属性信息、M种脱敏规则以及所述已学习数据的属性信息与所述脱敏规则的匹配关系,所述N和M为正整数,所述N和M相同或不同。4.根据权利要求2或3所述的方法,其特征在于,所述分类器中存储所述第一脱敏规则;或者,所述分类器中未存储所述第一脱敏规则。5.根据权利要求4所述的方法,其特征在于,若所述分类器中未存储所述第一脱敏规则,所述方法还包括:将所述待处理数据的属性信息、所述第一脱敏规则以及所述待处理数据的属性信息与所述第一脱敏规则的匹配关系存储至所述分类器中。6.根据权利要求4所述的方法,其特征在于,还包括:将所述待处理数据的属性信息与所述第一脱敏规则的匹配关系发...

【专利技术属性】
技术研发人员:张金玲龙岳郭佳睿
申请(专利权)人:中国联合网络通信集团有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1