The invention provides a data desensitization method, device and storage medium based on machine learning. The method includes acquiring attribute information of data to be processed, determining the first desensitization rule by machine learning according to the attribute information, and desensitization treatment of the processed data according to the first desensitization rule. The data desensitization method, device and storage medium based on machine learning provided by the invention can desensitize data without manual confirmation of desensitization rules before desensitization processing, and need not use a large amount of human time cost to set desensitization rules, thereby improving the efficiency of data desensitization.
【技术实现步骤摘要】
基于机器学习的数据脱敏方法、装置及存储介质
本专利技术涉及数据处理
,尤其涉及一种基于机器学习的数据脱敏方法、装置及存储介质。
技术介绍
数据脱敏是指对数据中包含的秘密或隐私信息进行特殊处理,达到数据变形的效果,使得攻击者无法从中直接获得敏感信息。在医疗、电力、金融、电信等诸多行业中,数据脱敏都有着广泛的应用。现有技术中,数据脱敏时使用的脱敏规则与数据的匹配都是手动设置的,并且需要提交管理员并进行多次审核,审核通过后脱敏规则才与数据的匹配正式有效,并可以进行数据脱敏操作。采用现有技术,对数据进行脱敏处理前,需要确认脱敏规则,不仅需要大量的人力时间成本而且工作重复冗余,造成了数据脱敏时的效率较低。
技术实现思路
本专利技术提供一种基于机器学习的数据脱敏方法、装置及存储介质,提高了数据脱敏时的效率。本专利技术第一方面提供一种基于机器学习的数据脱敏方法,包括:获取待处理数据的属性信息;根据所述属性信息通过机器学习确定第一脱敏规则;根据所述第一脱敏规则对所述待处理数据进行脱敏处理。在本专利技术第一方面一实施例中,所述通过机器学习确定所述待处理数据的第一脱敏规则,包括:将所述属性信息送入分类器,由所述分类器输出所述第一脱敏规则;其中,所述分类器用于根据已学习数据的属性信息与脱敏规则的匹配关系确定所述待处理数据所对应的第一脱敏规则。在本专利技术第一方面一实施例中,所述分类器中存储N种已学习数据的属性信息、M种脱敏规则以及所述已学习数据的属性信息与所述脱敏规则的匹配关系,所述N和M为正整数,所述N和M相同或不同。在本专利技术第一方面一实施例中,所述分类器中存储所述第一 ...
【技术保护点】
1.一种基于机器学习的数据脱敏方法,其特征在于,包括:获取待处理数据的属性信息;根据所述属性信息通过机器学习确定第一脱敏规则;根据所述第一脱敏规则对所述待处理数据进行脱敏处理。
【技术特征摘要】
1.一种基于机器学习的数据脱敏方法,其特征在于,包括:获取待处理数据的属性信息;根据所述属性信息通过机器学习确定第一脱敏规则;根据所述第一脱敏规则对所述待处理数据进行脱敏处理。2.根据权利要求1所述的方法,其特征在于,所述根据所述属性信息通过机器学习确定第一脱敏规则,包括:将所述属性信息送入分类器,由所述分类器输出所述第一脱敏规则;其中,所述分类器用于根据已学习数据的属性信息与脱敏规则的匹配关系确定所述待处理数据所对应的第一脱敏规则。3.根据权利要求2所述的方法,其特征在于,所述分类器中存储N种已学习数据的属性信息、M种脱敏规则以及所述已学习数据的属性信息与所述脱敏规则的匹配关系,所述N和M为正整数,所述N和M相同或不同。4.根据权利要求2或3所述的方法,其特征在于,所述分类器中存储所述第一脱敏规则;或者,所述分类器中未存储所述第一脱敏规则。5.根据权利要求4所述的方法,其特征在于,若所述分类器中未存储所述第一脱敏规则,所述方法还包括:将所述待处理数据的属性信息、所述第一脱敏规则以及所述待处理数据的属性信息与所述第一脱敏规则的匹配关系存储至所述分类器中。6.根据权利要求4所述的方法,其特征在于,还包括:将所述待处理数据的属性信息与所述第一脱敏规则的匹配关系发...
【专利技术属性】
技术研发人员:张金玲,龙岳,郭佳睿,
申请(专利权)人:中国联合网络通信集团有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。