The invention discloses a data desensitization method and device, which includes: reading and analyzing the desensitization strategy of the configuration file, the desensitization strategy including the replacement strategy; generating index creation statements for the tables of the database involved in the desensitization strategy, and writing the index creation statements into the statement execution list; generating a bidirectional mapping table for the truth value involved in the replacement strategy, and constructing a bidirectional mapping table to The true value is replaced by the dynamic update statement of the simulation value, and the dynamic update statement is written to the statement execution list; all statements in the statement execution list are executed in the database according to the order in which the statement execution list is written. The invention can automatically desensitize sensitive data in different databases, generate high simulation of false data, and improve work efficiency.
【技术实现步骤摘要】
一种数据脱敏方法与装置
本专利技术涉及数据安全领域,更具体地,特别是指一种数据脱敏方法与装置。
技术介绍
随着大数据时代的来临和政府政务数据的逐渐公开,越来越多的数据需要对公众开放。大数据信息中隐藏巨大的价值,同时也包含很多敏感数据,一些涉及公民隐私信息的数据如身份证号、地址等信息一旦被不慎放出,将会面临信息泄露的严重问题,给企业或政府造成很大损失。因此一个简单高效的数据脱敏工具是必不可少的。现有技术的数据脱敏方法主要是使用SQL语句进行数据替换和清空等操作,该方法存在以下问题:第一,无法对特殊敏感数据进行个性化定制,比如身份证号,只能替换为一个固定值,无法按照身份证的校验规则生成仿真的“假身份证号”,如此便丢失了数据库中各个表之间的关联关系;第二,执行效率低下,使用固定SQL替换数据将会遍历所有数据,造成很多额外的开销;第三,执行过程全程手动,需要占用人力资源,无法自动运行。针对现有技术中数据脱敏无仿真功能、效率低、消耗人工等问题,目前尚未有有效的解决方案。
技术实现思路
有鉴于此,本专利技术实施例的目的在于提出一种数据脱敏方法与装置,能够针对不同数据库中的敏感数据自动脱敏,生成的假数据高度仿真,并提高工作效率。基于上述目的,本专利技术实施例的第一方面提供了一种数据脱敏方法,包括执行以下步骤:读取并解析配置文件的脱敏策略,脱敏策略包括替换策略;为脱敏策略所涉及的数据库的表生成索引创建语句,并将索引创建语句写入语句执行列表;针对替换策略所涉及 ...
【技术保护点】
1.一种数据脱敏方法,其特征在于,包括以下步骤:/n读取并解析配置文件的脱敏策略,所述脱敏策略包括替换策略;/n为所述脱敏策略所涉及的数据库的表生成索引创建语句,并将所述索引创建语句写入语句执行列表;/n针对所述替换策略所涉及的真值生成双向映射表,构造使用所述双向映射表将所述真值替换为仿真值的动态更新语句,并将所述动态更新语句写入语句执行列表;/n在所述数据库中按照被写入所述语句执行列表的顺序来执行所述语句执行列表中的所有语句。/n
【技术特征摘要】
1.一种数据脱敏方法,其特征在于,包括以下步骤:
读取并解析配置文件的脱敏策略,所述脱敏策略包括替换策略;
为所述脱敏策略所涉及的数据库的表生成索引创建语句,并将所述索引创建语句写入语句执行列表;
针对所述替换策略所涉及的真值生成双向映射表,构造使用所述双向映射表将所述真值替换为仿真值的动态更新语句,并将所述动态更新语句写入语句执行列表;
在所述数据库中按照被写入所述语句执行列表的顺序来执行所述语句执行列表中的所有语句。
2.根据权利要求1所述的方法,其特征在于,针对所述替换策略所涉及的真值生成所述双向映射表包括:
针对每一个所述真值,均生成与所述真值具有相同校验结果的一个所述仿真值;
响应于一个所述仿真值与任一所述真值相同、或与其它仿真值相同,而使用Put方法和Contain方法重新生成该仿真值;
响应于一个所述仿真值与任一所述真值不同、且与其它仿真值不同,而将该仿真值和相对应的所述真值成对地记入所述双向映射表。
3.根据权利要求2所述的方法,其特征在于,确定一个所述仿真值与任一所述真值和/或与其它仿真值相同或不同包括:使用所述双向映射表通过非遍历直接查找确定。
4.根据权利要求1所述的方法,其特征在于,所述脱敏策略还包括覆盖策略;
所述方法还包括:在生成所述索引创建语句之后、和生成所述索引删除语句之前,还生成用于删除所述覆盖策略所涉及的真值的第一覆盖语句和用于向被删除位置写入所述覆盖策略中的固定值的第二覆盖语句,并将所述第一覆盖语句和所述第二覆盖语句写入语句执行列表。
5.根据权利要求1所述的方法,其特征在于,所述脱敏策略还包括删除策略;
所述方法还包括:在生成所述索引创建语句之...
【专利技术属性】
技术研发人员:李松,李锋,刘成平,
申请(专利权)人:苏州浪潮智能科技有限公司,
类型:发明
国别省市:江苏;32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。