【技术实现步骤摘要】
一种数据脱敏的方法、装置及电子设备
[0001]本申请涉及数据处理
,尤其涉及一种数据脱敏的方法、装置及电子设备。
技术介绍
[0002]科技进步在为大众便捷性的同时,也带来了一些隐患。尤其在互联网时代,信息安全问题首当其冲。为了进行规划、总结、便于管理,企业、事业单位等大小部门都通过大数据技术进行数据的收集、存储与共享。而一旦这些数据被收集,便面临着泄露并被违规利用的风险。
[0003]目前,Hive数据库作为一种基于Hadoop的数据仓库工具是主流数据存储工具之一。其在日常数据集成或传输使用中,通常会包含一些隐私敏感数据。例如,个人身份证信息、银行信息、酒店入住记录、交通行驶记录、支付信息、人脸信息等,这些信息一旦泄露,将对个人隐私安全及生命财产安全造成威胁。
[0004]由于Hive并不具备数据脱敏能力,因此为了降低敏感数据泄露风险,采用的方法是在用户获取数据之前进行二次处理:在不影响数据查询等功能的前提下,将真实数据转化为虚假数据。处理方法具体可分为动态脱敏和静态脱敏处理。由于静态脱敏不够灵活且存在占内存的问题,动态脱敏是普遍采用的脱敏方式。但现有技术在采用动态脱敏时,由于识别敏感数据的形式较为单一,因而存在无法灵敏感知脱敏信息的问题,导致输出应当脱敏而未被脱敏的数据,致使敏感数据的安全性受到威胁。
技术实现思路
[0005]本申请实施例提供一种数据脱敏的方法、装置及电子设备,用以降低现有技术中数据脱敏方法因遗漏敏感数据而引起的安全风险。
[0006]第一方面,本 ...
【技术保护点】
【技术特征摘要】
1.一种数据脱敏的方法,其特征在于,包括:读取待处理字段,并确定所述待处理字段在待处理数据表中的位置;其中,所述待处理字段为待处理数据表中的字段;基于所述位置,查询对应于所述待处理字段的脱敏规则,并基于所述脱敏规则中的脱敏类型,确定是否利用所述脱敏规则对所述待处理字段进行脱敏;其中,所述脱敏类型包括样本集脱敏、和/或列字段脱敏;若是,基于所述脱敏规则对所述待处理字段进行脱敏,并利用脱敏得到的脱敏字段更新所述待处理字段。2.如权利要求1所述的方法,其特征在于,所述读取待处理字段之前,还包括:基于UDTF函数,为所述待处理数据表中的列字段添加待填充标记列;其中,所述待填充标记列中的待填充标记与所述列字段中的所述待处理字段一一对应,所述待填充标记用于标记所述待处理字段中待脱敏字段的脱敏规则;则所述利用脱敏得到的脱敏字段更新所述待处理字段之后,还包括:将所述脱敏规则添加至对应于所述脱敏字段的待填充标记中。3.如权利要求1或2所述的方法,其特征在于,所述基于所述位置,查询对应于所述待处理字段的脱敏规则,并基于所述脱敏规则中的脱敏类型,确定是否利用所述脱敏规则对所述待处理字段进行脱敏,包括:响应于所述脱敏规则为第一脱敏规则,且所述第一脱敏规则中的第一脱敏类型为样本集脱敏,基于所述第一脱敏规则中的第一样本集标记,下载第一敏感样本集;其中,所述第一样本集标记与所述第一敏感样本集一一对应;将所述第一敏感样本集中的敏感字段与所述待处理字段进行比对;响应于所述待处理字段与所述第一敏感样本集中任一所述敏感字段相同,确定利用所述第一脱敏规则中的第一脱敏算法针对所述待处理字段进行脱敏;或者,响应于所述待处理字段与所述第一敏感样本集中任一所述敏感字段均不同,确定所述待处理字段非敏感字段。4.如权利要求1或2所述的方法,其特征在于,所述基于所述位置,查询对应于所述待处理字段的脱敏规则,并基于所述脱敏规则中的脱敏类型,确定是否利用所述脱敏规则中的脱敏算法对所述待处理字段进行脱敏,包括:响应于所述脱敏规则为第二脱敏规则,且所述第二脱敏规则中的第二脱敏类型为列字段脱敏,确定利用所述第二脱敏规则中的第二脱敏算法针对所述待处理字段进行脱敏。5.如权利要求1或2所述的方法,其特征在于,所述基于所述位置,查询对应于所述待处理字段的脱敏规则,并基于所述脱敏规则中的脱敏类型,确定是否利用所述脱敏规则对所述待处理字段进行脱敏,包括:响应于所述脱敏规则依次包括第三脱敏规则和第四脱敏规则,且所述第三脱敏规则的第三脱敏类型为样本集脱敏,所述第四脱敏规则的第四脱敏类型为列字段脱敏,获取所述第三脱敏规则中的第三样本集标记;基于所述第三样本集标记,下载所述第三敏感样本集;确定所述待处理字段是否与所述第三敏感样本集中任一敏感字段相同;若是,则确定利用所述第三脱敏规则中的第三脱敏算法针对所述待处理字段进行脱敏;若否,则确定利
用所述第四脱敏规则中的第四脱敏算法针对所述待处理字段进行脱敏。6.如权利要求2所述的方法,其特征在于,所述基于UDTF函数,为所述待处理数据表中的列字段添加待填充标记列之前,包括:接收脱敏任务;其中,所述脱敏任务包括访问对象的安全等级、待导出数据,所述待导出数据包括库名称、表名称、和/或...
【专利技术属性】
技术研发人员:张仕彬,
申请(专利权)人:浙江大华技术股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。