一种数据脱敏方法、系统、设备以及存储介质技术方案

技术编号:38757284 阅读:9 留言:0更新日期:2023-09-10 09:42
本发明专利技术公开了一种数据脱敏方法,包括以下步骤:在集群的每一个数据节点上部署脱敏装置并在所述集群中部署脱敏管理器;接收用户实时配置的脱敏策略并推送到所述脱敏管理器中;响应于所述脱敏管理器接收到所述脱敏策略,将所述脱敏策略同步到每一个所述脱敏装置上;响应于所述数据节点接收到数据访问请求,利用所述脱敏装置基于所述脱敏策略对所述数据访问请求对应的数据进行脱敏处理以使所述数据节点返回脱敏处理后的数据。本发明专利技术还公开了一种系统、计算机设备以及可读存储介质。本发明专利技术提出的方案能够实时应用用户修改的脱敏策略,且分布式部署在每一个数据节点上的脱敏装置,大大提高了对于数据脱敏的处理速度。提高了对于数据脱敏的处理速度。提高了对于数据脱敏的处理速度。

【技术实现步骤摘要】
一种数据脱敏方法、系统、设备以及存储介质


[0001]本专利技术涉及数据处理领域,具体涉及一种数据脱敏方法、系统、设备以及存储介质。

技术介绍

[0002]大数据集群在使用过程中一直存在数据安全风险,因此在用户访问时会对数据进行脱敏处理,现有技术是基于权限鉴定来控制用户访问,很难满足用户多样化的需求,尤其针对敏感数据,例如:电话号码,身份证号,家庭地址等敏感信息很难使用权限来限制用户访问使用。
[0003]针对以上问题,一般的处理方式是:读取HDFS(Hadoop Distributed File System,一种分布式文件系统)数据,根据脱敏规则进行多线程处理,写入存储库,当用户请求时从存储库返回给用户。该方式中的脱敏规则配置不灵活,不支持实时修改生效,一经修改则需要重新执行程序并重新生成数据,此外,该方式也需要额外的存储来保存脱敏后的数据,增加了存储成本。
[0004]因此,针对大数据集群,例如HDFS集群,现有数据脱敏处理,不仅不灵活,且效率低下,不能满足用户需求。

技术实现思路

[0005]有鉴于此,为了克服上述问题的至少一个方面,本专利技术实施例提出一种数据脱敏方法,包括以下步骤:
[0006]在集群的每一个数据节点上部署脱敏装置并在所述集群中部署脱敏管理器;
[0007]接收用户实时配置的脱敏策略并推送到所述脱敏管理器中;
[0008]响应于所述脱敏管理器接收到所述脱敏策略,将所述脱敏策略同步到每一个所述脱敏装置上;
[0009]响应于所述数据节点接收到数据访问请求,利用所述脱敏装置基于所述脱敏策略对所述数据访问请求对应的数据进行脱敏处理以使所述数据节点返回脱敏处理后的数据。
[0010]在一些实施例中,在所述集群中部署脱敏管理器,进一步包括:
[0011]根据所述集群的规模确定部署脱敏管理器的节点数量或者从所述集群中选择多个节点部署脱敏管理器;
[0012]将多个所述脱敏管理器中的一个所述脱敏管理器设置为活跃状态,并将其余所述脱敏管理器设置为休眠状态以利用活跃状态的所述脱敏管理器接收用户实时配置的脱敏策略以及向休眠状态的所述脱敏管理器同步所述脱敏策略。
[0013]在一些实施例中,将多个所述脱敏管理器中的一个所述脱敏管理器设置为活跃状态,并将其余所述脱敏管理器设置为休眠状态以利用活跃状态的所述脱敏管理器接收用户实时配置的脱敏策略以及向休眠状态的所述脱敏管理器同步所述脱敏策略,进一步包括:
[0014]响应于多个所述脱敏管理器第一次启动,将启动时间最早的所述脱敏管理器设置
为活跃状态,其余所述脱敏管理器设置为休眠状态。
[0015]在一些实施例中,还包括:
[0016]响应于活跃状态的脱敏管理器故障,比较每一个处于休眠状态的所述脱敏管理器同步所述脱敏策略的时间并将具有最新同步时间的脱敏管理器设置为活跃状态;
[0017]响应于若干个休眠状态的所述脱敏管理器的同步时间最新且相同,比较所述若干个休眠状态的脱敏管理器对应节点的编号并将对应节点的编号最大的脱敏管理器设置为活跃状态。
[0018]在一些实施例中,接收用户实时配置的脱敏策略并推送到所述脱敏管理器中,进一步包括:
[0019]部署可视化页面,所述可视化页面中包括脱敏管理中心、用户管理中心、脱敏策略配置中心,其中所述脱敏管理中心用于提供所述集群的目录和文件信息,包括路径、所属用户和所属用户组;所述用户管理中心用于管理所述集群的用户信息;所述脱敏策略配置中心用于创建管理脱敏策略,包括路径、用户、用户组、脱敏匹配项和脱敏伪装选项,所述脱敏匹配项包括关键字和正则表达式。
[0020]在一些实施例中,响应于所述脱敏管理器接收到所述脱敏策略,将所述脱敏策略同步到每一个所述脱敏装置上,进一步包括:
[0021]在每一个所述脱敏装置部署定时任务以每隔预设时间段在所述脱敏管理器中主动获取所述脱敏策略。
[0022]在一些实施例中,响应于所述数据节点接收到数据访问请求,利用所述脱敏装置基于所述脱敏策略对所述数据访问请求对应的数据进行脱敏处理以使所述数据节点返回脱敏处理后的数据,进一步包括:
[0023]响应于所述脱敏装置中没有所述脱敏策略,主动去处于活跃状态的脱敏管理器中获取所述脱敏策略以进行二次判定。
[0024]基于同一专利技术构思,根据本专利技术的另一个方面,本专利技术的实施例还提供了一种数据脱敏系统,包括:
[0025]部署模块,配置为在集群的每一个数据节点上部署脱敏装置并在所述集群中部署脱敏管理器;
[0026]脱敏策略配置中心,配置为接收用户实时配置的脱敏策略并推送到所述脱敏管理器中;
[0027]脱敏管理器模块,配置为响应于所述脱敏管理器接收到所述脱敏策略,将所述脱敏策略同步到每一个所述脱敏装置上;
[0028]脱敏装置模块,配置为响应于所述数据节点接收到数据访问请求,利用所述脱敏装置基于所述脱敏策略对所述数据访问请求对应的数据进行脱敏处理以使所述数据节点返回脱敏处理后的数据。
[0029]基于同一专利技术构思,根据本专利技术的另一个方面,本专利技术的实施例还提供了一种计算机设备,包括:
[0030]至少一个处理器;以及
[0031]存储器,所述存储器存储有可在所述处理器上运行的计算机程序,所述处理器执行所述程序时执行如上所述的任一种数据脱敏方法的步骤。
[0032]基于同一专利技术构思,根据本专利技术的另一个方面,本专利技术的实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时执行如上所述的任一种数据脱敏方法的步骤。
[0033]本专利技术具有以下有益技术效果之一:本专利技术提出的方案能够实时应用用户修改的脱敏策略,且采用在每一个数据节点上分布式部署脱敏装置,大大提高了对于数据脱敏的处理速度。
附图说明
[0034]为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的实施例。
[0035]图1为本专利技术的实施例提供的数据脱敏方法的流程示意图;
[0036]图2为本专利技术的实施例提供的可视化页面、脱敏管理器、脱敏装置以及存储装置的连接示意图;
[0037]图3为本专利技术的实施例提供的可视化页面中的脱敏管理中心的示意图;
[0038]图4为本专利技术的实施例提供的可视化页面中的用户管理中心的示意图;
[0039]图5为本专利技术的实施例提供的可视化页面中的脱敏策略配置中心的示意图;
[0040]图6为本专利技术的实施例提供的数据脱敏系统的结构示意图;
[0041]图7为本专利技术的实施例提供的计算机设备的结构示意图;
[0042]图8为本专利技术的实施例提供的计算机可读存储介质的结本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种数据脱敏方法,其特征在于,包括以下步骤:在集群的每一个数据节点上部署脱敏装置并在所述集群中部署脱敏管理器;接收用户实时配置的脱敏策略并推送到所述脱敏管理器中;响应于所述脱敏管理器接收到所述脱敏策略,将所述脱敏策略同步到每一个所述脱敏装置上;响应于所述数据节点接收到数据访问请求,利用所述脱敏装置基于所述脱敏策略对所述数据访问请求对应的数据进行脱敏处理以使所述数据节点返回脱敏处理后的数据。2.如权利要求1所述的方法,其特征在于,在所述集群中部署脱敏管理器,进一步包括:根据所述集群的规模确定部署脱敏管理器的节点数量或者从所述集群中选择多个节点部署脱敏管理器;将多个所述脱敏管理器中的一个所述脱敏管理器设置为活跃状态,并将其余所述脱敏管理器设置为休眠状态以利用活跃状态的所述脱敏管理器接收用户实时配置的脱敏策略以及向休眠状态的所述脱敏管理器同步所述脱敏策略。3.如权利要求2所述的方法,其特征在于,将多个所述脱敏管理器中的一个所述脱敏管理器设置为活跃状态,并将其余所述脱敏管理器设置为休眠状态以利用活跃状态的所述脱敏管理器接收用户实时配置的脱敏策略以及向休眠状态的所述脱敏管理器同步所述脱敏策略,进一步包括:响应于多个所述脱敏管理器第一次启动,将启动时间最早的所述脱敏管理器设置为活跃状态,其余所述脱敏管理器设置为休眠状态。4.如权利要求3所述的方法,其特征在于,还包括:响应于活跃状态的脱敏管理器故障,比较每一个处于休眠状态的所述脱敏管理器同步所述脱敏策略的时间并将具有最新同步时间的脱敏管理器设置为活跃状态;响应于若干个休眠状态的所述脱敏管理器的同步时间最新且相同,比较所述若干个休眠状态的脱敏管理器对应节点的编号并将对应节点的编号最大的脱敏管理器设置为活跃状态。5.如权利要求1所述的方法,其特征在于,接收用户实时配置的脱敏策略并推送到所述脱敏管理器中,进一步包括:部署可视化页面,所述可视化页面中包括脱敏管理中心、用户管理中心、脱敏策略配置中心,其中所述脱敏管理中心用...

【专利技术属性】
技术研发人员:孙保峰汤高蒙
申请(专利权)人:济南浪潮数据技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1