一种数据脱敏方法与装置制造方法及图纸

技术编号:22689310 阅读:26 留言:0更新日期:2019-11-30 03:48
本发明专利技术公开了一种数据脱敏方法与装置包括:读取并解析配置文件的脱敏策略,脱敏策略包括替换策略;为脱敏策略所涉及的数据库的表生成索引创建语句,并将索引创建语句写入语句执行列表;针对替换策略所涉及的真值生成双向映射表,构造使用双向映射表将真值替换为仿真值的动态更新语句,并将动态更新语句写入语句执行列表;在数据库中按照被写入所述语句执行列表的顺序来执行语句执行列表中的所有语句。本发明专利技术能够针对不同数据库中的敏感数据自动脱敏,生成的假数据高度仿真,并提高工作效率。

A data desensitization method and device

The invention discloses a data desensitization method and device, which includes: reading and analyzing the desensitization strategy of the configuration file, the desensitization strategy including the replacement strategy; generating index creation statements for the tables of the database involved in the desensitization strategy, and writing the index creation statements into the statement execution list; generating a bidirectional mapping table for the truth value involved in the replacement strategy, and constructing a bidirectional mapping table to The true value is replaced by the dynamic update statement of the simulation value, and the dynamic update statement is written to the statement execution list; all statements in the statement execution list are executed in the database according to the order in which the statement execution list is written. The invention can automatically desensitize sensitive data in different databases, generate high simulation of false data, and improve work efficiency.

【技术实现步骤摘要】
一种数据脱敏方法与装置
本专利技术涉及数据安全领域,更具体地,特别是指一种数据脱敏方法与装置。
技术介绍
随着大数据时代的来临和政府政务数据的逐渐公开,越来越多的数据需要对公众开放。大数据信息中隐藏巨大的价值,同时也包含很多敏感数据,一些涉及公民隐私信息的数据如身份证号、地址等信息一旦被不慎放出,将会面临信息泄露的严重问题,给企业或政府造成很大损失。因此一个简单高效的数据脱敏工具是必不可少的。现有技术的数据脱敏方法主要是使用SQL语句进行数据替换和清空等操作,该方法存在以下问题:第一,无法对特殊敏感数据进行个性化定制,比如身份证号,只能替换为一个固定值,无法按照身份证的校验规则生成仿真的“假身份证号”,如此便丢失了数据库中各个表之间的关联关系;第二,执行效率低下,使用固定SQL替换数据将会遍历所有数据,造成很多额外的开销;第三,执行过程全程手动,需要占用人力资源,无法自动运行。针对现有技术中数据脱敏无仿真功能、效率低、消耗人工等问题,目前尚未有有效的解决方案。
技术实现思路
有鉴于此,本专利技术实施例的目的在于提出一种数据脱敏方法与装置,能够针对不同数据库中的敏感数据自动脱敏,生成的假数据高度仿真,并提高工作效率。基于上述目的,本专利技术实施例的第一方面提供了一种数据脱敏方法,包括执行以下步骤:读取并解析配置文件的脱敏策略,脱敏策略包括替换策略;为脱敏策略所涉及的数据库的表生成索引创建语句,并将索引创建语句写入语句执行列表;针对替换策略所涉及的真值生成双向映射表,构造使用双向映射表将真值替换为仿真值的动态更新语句,并将动态更新语句写入语句执行列表;在数据库中按照被写入语句执行列表的顺序来执行语句执行列表中的所有语句。在一些实施方式中,针对替换策略所涉及的真值生成双向映射表包括:针对每一个真值,均生成与真值具有相同校验结果的一个仿真值;响应于一个仿真值与任一真值相同、或与其它仿真值相同,而使用Put方法和Contain方法重新生成该仿真值;响应于一个仿真值与任一真值不同、且与其它仿真值不同,而将该仿真值和相对应的真值成对地记入双向映射表。在一些实施方式中,确定一个仿真值与任一真值和/或与其它仿真值相同或不同包括:使用双向映射表通过非遍历直接查找确定。在一些实施方式中,脱敏策略还包括覆盖策略;方法还包括:在生成索引创建语句之后、和生成索引删除语句之前,还生成用于删除覆盖策略所涉及的真值的第一覆盖语句和用于向被删除位置写入覆盖策略中的固定值的第二覆盖语句,并将第一覆盖语句和第二覆盖语句写入语句执行列表。在一些实施方式中,脱敏策略还包括删除策略;方法还包括:在生成索引创建语句之后、和生成索引删除语句之前,还生成用于截除删除策略所涉及的真值的截短语句,并将截短语句写入语句执行列表。在一些实施方式中,脱敏策略还包括丢弃策略;方法还包括:在生成索引创建语句之后、和生成索引删除语句之前,还根据丢弃策略中的关键字生成用于丢弃丢弃策略所涉及的真值中的关键字的丢弃语句,并将丢弃语句写入语句执行列表。在一些实施方式中,在执行语句执行列表中的所有语句之前,生成用于删除由索引创建语句创建的索引的索引删除语句,并将索引删除语句写入语句执行列表。在一些实施方式中,数据库是备份数据库;在依次执行语句执行列表中的所有语句的同时,还显示并以日志形式存储脱敏策略的执行情况和执行进度信息。本专利技术实施例的第二方面提供了一种数据脱敏装置,包括:载入模块,用于读取并解析配置文件的脱敏策略,所述脱敏策略包括替换策略;上索引模块,用于为所述脱敏策略所涉及的数据库的表生成索引创建语句,并将所述索引创建语句写入语句执行列表;替换模块,用于针对所述替换策略所涉及的真值生成双向映射表,构造使用所述双向映射表将所述真值替换为仿真值的动态更新语句,并将所述动态更新语句写入语句执行列表;执行模块,用于在所述数据库中按照被写入语句执行列表的顺序来执行所述语句执行列表中的所有语句。本专利技术实施例的第三方面提供了一种数据库,包括:处理器;和存储器,存储有处理器可运行的程序代码,程序代码在被运行时执上述的数据脱敏方法。本专利技术具有以下有益技术效果:本专利技术实施例提供的数据脱敏方法与装置,通过读取并解析配置文件的脱敏策略,脱敏策略包括替换策略;为脱敏策略所涉及的数据库的表生成索引创建语句,并将索引创建语句写入语句执行列表;针对替换策略所涉及的真值生成双向映射表,构造使用双向映射表将真值替换为仿真值的动态更新语句,并将动态更新语句写入语句执行列表;在数据库中按照被写入语句执行列表的顺序来执行语句执行列表中的所有语句的技术方案,能够针对不同数据库中的敏感数据自动脱敏,生成的假数据高度仿真,并提高工作效率。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术提供的数据脱敏方法的流程示意图;图2为本专利技术提供的数据脱敏方法的配置文件示意图;图3为本专利技术提供的数据脱敏方法的模块化示意图。具体实施方式为使本专利技术的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本专利技术实施例进一步详细说明。需要说明的是,本专利技术实施例中所有使用“第一”和“第二”的表述均是为了区分两个相同名称非相同的实体或者非相同的参量,可见“第一”“第二”仅为了表述的方便,不应理解为对本专利技术实施例的限定,后续实施例对此不再一一说明。基于上述目的,本专利技术实施例的第一个方面,提出了一种能够针对不同数据库中的敏感数据自动脱敏的方法的一个实施例。图1示出的是本专利技术提供的数据脱敏方法的流程示意图。所述数据脱敏方法,如图1所示,包括以下步骤:步骤S101:读取并解析配置文件的脱敏策略,脱敏策略包括替换策略;步骤S103:为脱敏策略所涉及的数据库的表生成索引创建语句,并将索引创建语句写入语句执行列表;步骤S105:针对替换策略所涉及的真值生成双向映射表,构造使用双向映射表将真值替换为仿真值的动态更新语句,并将动态更新语句写入语句执行列表;步骤S107:在数据库中按照被写入语句执行列表的顺序来执行语句执行列表中的所有语句。其中,配置文件是指脱敏要使用到的一系列设置,可以是json格式的文本文件,记载要脱敏的数据表、列、脱敏策略、规则等。本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,可以通过计算机程序来指令相关硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(ROM)或随机本文档来自技高网...

【技术保护点】
1.一种数据脱敏方法,其特征在于,包括以下步骤:/n读取并解析配置文件的脱敏策略,所述脱敏策略包括替换策略;/n为所述脱敏策略所涉及的数据库的表生成索引创建语句,并将所述索引创建语句写入语句执行列表;/n针对所述替换策略所涉及的真值生成双向映射表,构造使用所述双向映射表将所述真值替换为仿真值的动态更新语句,并将所述动态更新语句写入语句执行列表;/n在所述数据库中按照被写入所述语句执行列表的顺序来执行所述语句执行列表中的所有语句。/n

【技术特征摘要】
1.一种数据脱敏方法,其特征在于,包括以下步骤:
读取并解析配置文件的脱敏策略,所述脱敏策略包括替换策略;
为所述脱敏策略所涉及的数据库的表生成索引创建语句,并将所述索引创建语句写入语句执行列表;
针对所述替换策略所涉及的真值生成双向映射表,构造使用所述双向映射表将所述真值替换为仿真值的动态更新语句,并将所述动态更新语句写入语句执行列表;
在所述数据库中按照被写入所述语句执行列表的顺序来执行所述语句执行列表中的所有语句。


2.根据权利要求1所述的方法,其特征在于,针对所述替换策略所涉及的真值生成所述双向映射表包括:
针对每一个所述真值,均生成与所述真值具有相同校验结果的一个所述仿真值;
响应于一个所述仿真值与任一所述真值相同、或与其它仿真值相同,而使用Put方法和Contain方法重新生成该仿真值;
响应于一个所述仿真值与任一所述真值不同、且与其它仿真值不同,而将该仿真值和相对应的所述真值成对地记入所述双向映射表。


3.根据权利要求2所述的方法,其特征在于,确定一个所述仿真值与任一所述真值和/或与其它仿真值相同或不同包括:使用所述双向映射表通过非遍历直接查找确定。


4.根据权利要求1所述的方法,其特征在于,所述脱敏策略还包括覆盖策略;
所述方法还包括:在生成所述索引创建语句之后、和生成所述索引删除语句之前,还生成用于删除所述覆盖策略所涉及的真值的第一覆盖语句和用于向被删除位置写入所述覆盖策略中的固定值的第二覆盖语句,并将所述第一覆盖语句和所述第二覆盖语句写入语句执行列表。


5.根据权利要求1所述的方法,其特征在于,所述脱敏策略还包括删除策略;
所述方法还包括:在生成所述索引创建语句之...

【专利技术属性】
技术研发人员:李松李锋刘成平
申请(专利权)人:苏州浪潮智能科技有限公司
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1