一种基于大数据的数据脱敏方法和Hbase脱敏处理系统技术方案

技术编号:17008378 阅读:53 留言:0更新日期:2018-01-11 04:25
本发明专利技术提供了一种基于大数据的数据脱敏方法和系统,应用于Hbase脱敏处理系统,Hbase脱敏处理系统包括Hbase协处理系统,该方法包括:Hbase协处理系统截获业务用户对Hbase的数据访问请求;Hbase协处理系统根据数据访问请求确定业务用户的标识信息和目标操作对象;Hbase协处理系统根据标识信息获取业务用户的至少一条脱敏策略信息;Hbase协处理系统在至少一条脱敏策略信息中查找是否存在与目标操作对象匹配的至少一条目标脱敏策略信息;若存在,则Hbase协处理系统从Hbase获取目标操作对象对应的目标数据;Hbase协处理系统根据至少一条目标脱敏策略信息中的至少一个目标脱敏规则对目标数据进行动态脱敏处理;Hbase协处理系统将动态脱敏后的目标数据返回至业务用户。

【技术实现步骤摘要】
一种基于大数据的数据脱敏方法和Hbase脱敏处理系统
本专利技术涉及大数据脱敏处理
,特别是涉及一种基于大数据的数据脱敏方法和一种Hbase脱敏处理系统。
技术介绍
随着大数据时代的到来,大数据中蕴藏的巨大价值得以挖掘,同时也带来了隐私信息保护方面的难题,如何在实现大数据高效共享的同时,保护敏感信息不被泄露,也将是数据脱敏必须解决的难题。Hbase是一个分布式的、面向列的开源数据库,而针对Hbase数据库中大数据访问的动态脱敏问题,目前尚未提出有效的解决方案。
技术实现思路
本专利技术提供了一种基于大数据的数据脱敏方法和一种Hbase脱敏处理系统,以解决现有技术中无法对Hbase数据库中的访问数据进行动态脱敏的问题。为了解决上述问题,根据本专利技术的一个方面,本专利技术公开了一种基于大数据的数据脱敏方法,应用于Hbase脱敏处理系统,所述Hbase脱敏处理系统包括Hbase协处理系统,所述方法包括:所述Hbase协处理系统截获业务用户对Hbase的数据访问请求;所述Hbase协处理系统根据所述数据访问请求确定所述业务用户的标识信息和目标操作对象;所述Hbase协处理系统根据所述标识信息获取所述业务用户的至少一条脱敏策略信息,所述脱敏策略信息包括用户的标识信息、操作对象和至少一个脱敏规则;所述Hbase协处理系统在所述至少一条脱敏策略信息中查找是否存在与所述目标操作对象匹配的至少一条目标脱敏策略信息;若存在,则所述Hbase协处理系统从所述Hbase获取所述目标操作对象对应的目标数据;所述Hbase协处理系统根据所述至少一条目标脱敏策略信息中的至少一个目标脱敏规则对所述目标数据进行动态脱敏处理;所述Hbase协处理系统将动态脱敏后的目标数据返回至所述业务用户。根据本专利技术的另一方面,本专利技术还公开了一种Hbase脱敏处理系统,包括:Hbase协处理系统;所述Hbase协处理系统,用于截获业务用户对Hbase的数据访问请求;所述Hbase协处理系统,用于根据所述数据访问请求确定所述业务用户的标识信息和目标操作对象;所述Hbase协处理系统,用于根据所述标识信息获取所述业务用户的至少一条脱敏策略信息,所述脱敏策略信息包括用户的标识信息、操作对象和至少一个脱敏规则;所述Hbase协处理系统,用于在所述至少一条脱敏策略信息中查找是否存在与所述目标操作对象匹配的至少一条目标脱敏策略信息;所述Hbase协处理系统,还用于若在所述至少一条脱敏策略信息中查找到与所述目标操作对象匹配的至少一条目标脱敏策略信息,则从所述Hbase获取所述目标操作对象对应的目标数据;所述Hbase协处理系统,还用于根据所述至少一条目标脱敏策略信息中的至少一个目标脱敏规则对所述目标数据进行动态脱敏处理;所述Hbase协处理系统,还用于将动态脱敏后的目标数据返回至所述业务用户。与现有技术相比,本专利技术包括以下优点:本专利技术借助于Hbase协处理系统将访问Hbase的数据访问请求进行拦截,以确定业务用户的标识信息和目标操作对象,然后在预先制定的脱敏策略信息中查找与所述标识信息和目标操作对象对应的目标脱敏策略信息,并采用目标脱敏策略信息中的目标脱敏规则来对待访问的目标数据进行脱敏处理,最后将脱敏处理后的数据返回至业务用户,实现了对Hbase数据库的访问数据的动态脱敏,保证了Hbase数据库的数据安全。附图说明图1是本专利技术的一种基于大数据的数据脱敏方法实施例的步骤流程图;图2是本专利技术的一种Hbase脱敏处理系统实施例的结构框图。具体实施方式为使本专利技术的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本专利技术作进一步详细的说明。参照图1,示出了本专利技术的一种基于大数据的数据脱敏方法实施例的步骤流程图,应用于Hbase脱敏处理系统,所述Hbase脱敏处理系统包括Hbase协处理系统,具体可以包括如下步骤:步骤101,所述Hbase协处理系统截获业务用户对Hbase的数据访问请求;其中,该Hbase协处理系统实现了协处理器接口以及数据脱敏功能。在一个具体实例中,该Hbase协处理系统可以设置在Hbase协处理器上。当业务用户想要访问Hbase数据库中的大数据时,本专利技术实施例的Hbase协处理系统会拦截业务用户的数据访问请求。其中,业务用户所使用的客户端安装有Linux操作系统和Hbase客户端,当业务用户以自己的用户名登录该Hbase客户端后,就可以访问Hbase集群来获取数据,其中,Hbase集群包括多个RegionServer节点,多个RegionServer节点之间的信息共享。步骤102,所述Hbase协处理系统根据所述数据访问请求确定所述业务用户的标识信息和目标操作对象;其中,该数据访问请求可以包括该业务用户的标识信息,以及目标操作对象。其中,该业务用户的标识信息可以是业务用户的用户名、用户ID等标识信息。该目标操作对象可以是该业务用户想要访问的Hbase数据库中目标元数据所指向的数据目标。例如:目标元数据为Hbase数据库A中数据表A的b列,则目标操作对象则为Hbase数据库A中数据表A的b列中的数据。步骤103,所述Hbase协处理系统根据所述标识信息获取所述业务用户的至少一条脱敏策略信息;其中,本专利技术实施例会预先制定脱敏策略信息;脱敏策略信息包括用户的标识信息(即作用的人)、操作对象(即作用的数据目标)和至少一个脱敏规则(即作用方式);其中,在一条脱敏策略信息中,针对某个业务用户需要访问的某个操作对象可以涉及多个脱敏规则。其中,在执行步骤103时,可以通过以下子步骤来实现:S11,所述Hbase协处理系统根据所述标识信息获取所述业务用户的至少一条脱敏策略信息;其中,本专利技术实施例预先针对不同的业务用户制定了各自的脱敏策略信息,其中,一个业务用户的脱敏策略信息不限于一条,可以是多条,而一条脱敏策略信息中涉及的脱敏规则也不限于一个,可以是多个。此外,一个业务用户的多条脱敏策略信息可以存储在一个文件中,从而加快策略的检索速度。举例来说,一个业务用户的策略信息可以存储在一个XML文件中,该业务用户的每条脱敏策略信息就是该XML文件中的一个xml节点。每次添加新内容都会给XML文件计算出一个新的哈希值,让Hbase协处理系统可以通过判断hash值来知道这个XML文件是否被更改过了。其中,Hbase协处理系统可以包括脱敏策略解析组件,该脱敏策略解析组件可以根据当前需要访问数据的业务用户的标识信息,来获取对应该标识信息的至少一条脱敏策略信息。举例来说,该业务用户的标识为C,那么就可以在预先存储的很多脱敏策略信息中查找该C业务用户的脱敏策略信息,可能有多条脱敏策略信息,包括脱敏策略信息1、脱敏策略信息2和脱敏策略信息3。S12,所述Hbase协处理系统对所述业务用户的每条脱敏策略信息进行解析,确定每条脱敏策略信息中所包括的用户的标识信息、操作对象和至少一个脱敏规则。其中,该脱敏策略解析组件还可以对脱敏策略信息1、脱敏策略信息2和脱敏策略信息3分别进行解析,来确定每条脱敏策略信息中所包含的业务用户的标识信息、操作对象以及至少一个脱敏规则。步骤104,所述Hbase协处理系统在所述至少一条脱敏策略信息中查找是否存在与所述目标操作对象匹配的至少一条目标脱敏策略本文档来自技高网...
一种基于大数据的数据脱敏方法和Hbase脱敏处理系统

【技术保护点】
一种基于大数据的数据脱敏方法,其特征在于,应用于Hbase脱敏处理系统,所述Hbase脱敏处理系统包括Hbase协处理系统,所述方法包括:所述Hbase协处理系统截获业务用户对Hbase的数据访问请求;所述Hbase协处理系统根据所述数据访问请求确定所述业务用户的标识信息和目标操作对象;所述Hbase协处理系统根据所述标识信息获取所述业务用户的至少一条脱敏策略信息,所述脱敏策略信息包括用户的标识信息、操作对象和至少一个脱敏规则;所述Hbase协处理系统在所述至少一条脱敏策略信息中查找是否存在与所述目标操作对象匹配的至少一条目标脱敏策略信息;若存在,则所述Hbase协处理系统从所述Hbase获取所述目标操作对象对应的目标数据;所述Hbase协处理系统根据所述至少一条目标脱敏策略信息中的至少一个目标脱敏规则对所述目标数据进行动态脱敏处理;所述Hbase协处理系统将动态脱敏后的目标数据返回至所述业务用户。

【技术特征摘要】
1.一种基于大数据的数据脱敏方法,其特征在于,应用于Hbase脱敏处理系统,所述Hbase脱敏处理系统包括Hbase协处理系统,所述方法包括:所述Hbase协处理系统截获业务用户对Hbase的数据访问请求;所述Hbase协处理系统根据所述数据访问请求确定所述业务用户的标识信息和目标操作对象;所述Hbase协处理系统根据所述标识信息获取所述业务用户的至少一条脱敏策略信息,所述脱敏策略信息包括用户的标识信息、操作对象和至少一个脱敏规则;所述Hbase协处理系统在所述至少一条脱敏策略信息中查找是否存在与所述目标操作对象匹配的至少一条目标脱敏策略信息;若存在,则所述Hbase协处理系统从所述Hbase获取所述目标操作对象对应的目标数据;所述Hbase协处理系统根据所述至少一条目标脱敏策略信息中的至少一个目标脱敏规则对所述目标数据进行动态脱敏处理;所述Hbase协处理系统将动态脱敏后的目标数据返回至所述业务用户。2.根据权利要求1所述的方法,其特征在于,所述Hbase脱敏处理系统还包括Hbase脱敏业务系统,所述Hbase协处理系统截获业务用户对Hbase的数据访问请求之前,所述方法还包括:所述Hbase脱敏业务系统采集Hbase中每个数据表的元数据信息并存储;所述Hbase脱敏业务系统根据所述每个数据表的元数据信息确定操作对象,所述操作对象包括所述Hbase的数据表中存储的数据的元数据信息;所述Hbase脱敏业务系统定期采集业务用户的标识信息;所述Hbase脱敏业务系统对所述操作对象制定至少一个脱敏规则;所述Hbase脱敏业务系统根据所述操作对象、制定的所述至少一个脱敏规则和定期采集的所述业务用户的标识信息,生成针对每个业务用户的至少一条脱敏策略信息;所述Hbase脱敏业务系统将针对每个业务用户的至少一条脱敏策略信息下发至HDFS系统。3.根据权利要求2所述的方法,其特征在于,所述Hbase协处理系统截获业务用户对Hbase的数据访问请求之前,所述方法还包括:所述Hbase协处理系统监测Hbase中数据表的元数据信息是否发生变化;若监测到发生变化,则所述Hbase协处理系统通知所述Hbase脱敏业务系统对Hbase中数据表的元数据信息进行数据同步;所述Hbase脱敏业务系统采集Hbase中存在变化的数据表的元数据信息,并根据所述存在变化的数据表的元数据信息对存储的相应数据表的元数据信息进行数据同步。4.根据权利要求1所述的方法,其特征在于,所述Hbase协处理系统根据所述标识信息获取所述业务用户的至少一条脱敏策略信息,包括:所述Hbase协处理系统根据所述标识信息获取所述业务用户的至少一条脱敏策略信息;所述Hbase协处理系统对所述业务用户的每条脱敏策略信息进行解析,确定每条脱敏策略信息中所包括的用户的标识信息、操作对象和至少...

【专利技术属性】
技术研发人员:张晓东喻波王志海袁灿王志华秦凯
申请(专利权)人:北京明朝万达科技股份有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1