数据脱敏方法和相关装置制造方法及图纸

技术编号:21606406 阅读:65 留言:0更新日期:2019-07-13 18:31
本发明专利技术提供数据脱敏方法和相关装置,其中,方法包括:确定第一数据对应的数据字典和脱敏密钥,数据字典包括数据序列和第一标识序列的对应关系,数据序列中的数据对应第一标识序列中的标识;根据数据字典确定与第一数据对应的第一标识;根据脱敏密钥确定标识字典,标识字典包括第一标识序列和第二标识序列的对应关系,第二标识序列为对第一标识序列进行重排序得到的序列,第二标识序列中的标识对应第一标识序列中的标识;根据标识字典在第二标识序列中确定与第一标识对应的第二标识;根据数据字典确定与第二标识对应的第二数据,并将第二数据确定为第一数据对应的脱敏数据。该方案可同时兼顾未脱敏数据的安全性和脱敏数据的可还原性。

Data desensitization methods and related devices

【技术实现步骤摘要】
数据脱敏方法和相关装置
本专利技术涉及信息安全
,尤其数据脱敏方法和相关装置。
技术介绍
数据脱敏,又称数据漂白、数据去隐私化或数据变形,是指对某些敏感信息按照一定规则进行数据的变形,使得数据变换为另一个数据,以实现对敏感隐私数据的可靠保护。在涉及客户安全数据或者一些商业性敏感数据的场景下,在不违反系统规则条件下,在利用真实数据进行改造并提供测试使用时需要对如身份证号、手机号、卡号、客户号等个人信息进行数据脱敏后才能使用。数据脱敏按脱敏规则划分可分为可恢复脱敏与不可恢复脱敏。其中,可恢复脱敏是指脱敏后的数据通过一定的方式,可以恢复成原来的敏感数据;不可恢复脱敏是指脱敏后的数据被脱敏的部分使用任何方式都不能恢复出。目前,数据脱敏一般是通过建立一个数据字典,然后根据该数据字典进行一定的映射,得到脱敏后的数据。一种方式是根据数据字典随机映射,这种方式即为不可恢复脱敏,但存在的问题在于进行随机脱敏后的数据无法还原为原始数据;另一种方式是根据数据字典按照一定的映射规则进行映射,这种方式为可恢复脱敏,但存在的问题在于映射关系容易被获知的风险,安全性不足。
技术实现思路
本专利技术实施例提供数据脱敏方法和相关装置,解决目前的脱敏方法无法兼顾数据还原和数据安全的问题。第一方面,提供一种数据脱敏方法,包括:确定第一数据对应的数据字典和脱敏密钥,所述第一数据为待脱敏的数据,所述数据字典包括数据序列和第一标识序列的对应关系,所述数据序列包括多个数据,所述第一标识序列包括多个标识,所述数据序列中的一个标识对应所述第一标识序列中的一个数据,所述数据脱敏密钥包括至少一个所述第一标识序列中的标识;根据所述数据字典在所述第一标识序列中确定与所述第一数据对应的第一标识;根据所述脱敏密钥确定标识字典,所述标识字典包括所述第一标识序列和第二标识序列的对应关系,所述第二标识序列为根据所述脱敏密钥中的标识对所述第一标识序列进行重排序得到的序列,所述第二标识序列中的一个标识对应所述第一标识序列中的一个标识;根据所述标识字典在所述第二标识序列中确定与所述第一标识对应的第二标识;根据所述数据字典确定在所述数据序列中与所述第二标识对应的第二数据,并将所述第二数据确定为所述第一数据对应的脱敏数据。该技术方案通过根据数据脱敏密钥确定标识字典,然后利用数据字典和标识字典对数据进行多次映射得到脱敏后的数据,在标识字典中对标识的映射相当于打乱了数据与数据之间的映射顺序,使得映射具备随机映射的特性,其他人根据脱敏后的数据无法推导出映射关系,保证了数据的安全性,由于是通过数据脱敏密钥中的标识得到标识字典,那么根据脱敏密钥可确定标识字典,然后根据逆向的映射过程,可以对脱敏后的数据进行还原,保证了脱敏后的数据的可还原性,即,该技术方案的数据脱敏方案可同时兼顾数据的安全性和脱敏数据的可还原性。结合第一方面,在一种可能的实现方式中,所述脱敏密钥包括m个标识,所述标识字典包括M个子标识字典,所述M个子标识字典由可重复排列的m个子标识字典排列组合得到,所述m个子标识字典分别为根据所述m个标识确定的子标识字典,m、M均为正整数,M大于或等于m;所述M个子标识字典中的第i个子标识字典包括所述第一标识序列和第i标识序列的对应关系,所述第i标识序列为对所述第一标识序列进行重排序得到的序列,所述第i标识序列中的一个标识对应所述第一标识序列中的一个标识,i为正整数,i大于或等于1并且小于或等于M;所述根据所述标识字典在所述第二标识序列中确定与所述第一标识对应的第二标识,包括:根据所述第i个子标识字典在所述第i标识序列中确定与所述第i标识对应的第(i+1)标识,其中,当i=1时,所述第i标识为所述第一标识;将第M标识序列中的第(M+1)标识确定为所述第二标识。通过根据脱敏密钥中的多个标识,分别确定多个子标识字典,多个子标识字典经过可重复性地排列组合得到标识字典,依次利用标识字典中的子标识字典对标识进行多次映射,进一步打乱了数据与数据之间的映射关系,提高了安全性。结合第一方面,在一种可能的实现方式中,所述第i个子标识字典为根据所述脱敏密钥中的第j个标识确定的子标识字典,j为正整数,j大于或等于1并且小于或等于m;其中,M=m,i=j,或者,M=2m-1,结合第一方面,在一种可能的实现方式中,所述第i标识序列为对所述第一标识序列进行按顺序移位得到的序列,并且,所述第j个标识在所述第i个子标识字典的第i标识序列中位于第k位,k为大于或等于1并且小于或等于N的任一正整数,N等于所述第一标识序列中的标识的个数。标识字典中的除第一标识序列外的另一个标识序列为对第一标识序列进行按顺序移位的序列,起到了更改标识序列中的标识的顺序的作用,将一个标识固定在一个固定位置,建立其标识与某个移序后的标识序列之间的对应关系。结合第一方面,在一种可能的实现方式中,所述确定第一数据对应的数据字典和脱敏密钥之后,包括:确定所述M个子标识字典中的第A个子标识字典,所述第A个子标识字典为根据所述脱敏密钥中的第a个标识确定的子标识字典,B为所述第一数据在待脱敏的数据整体中的排列顺序,所述数据整体包括至少两个数据,a和n均为正整数,N等于所述第一标识序列中的标识的个数;根据所述第A个子标识字典确定第A标识序列中的第三标识,所述第三标识在所述第A标识序列中位于所述第a个标识的后一位;在所述脱敏密钥中将所述第a个标识替换为所述第三标识;将替换得到的脱敏密钥确定为所述第一数据的下一个数据对应的脱敏密钥。按照一定的规则将前一个数据对应的脱敏密钥中的标识进行替换,得到后一个数据对应的脱敏密钥,则在对数据脱敏的过程中,仅需一个脱敏密钥即可实现数据脱敏,每个数据采用不同的脱敏密钥对其进行脱敏,增大了其他用户获知脱敏采用的映射关系的难度,增强了数据脱敏的安全性。第二方面,提供一种数据脱敏装置,包括:字典密钥确定模块,用于确定第一数据对应的数据字典和脱敏密钥,所述第一数据为待脱敏的数据所述数据字典包括数据序列和第一标识序列的对应关系,所述数据序列包括多个数据,所述第一标识序列包括多个标识,所述数据序列中的一个数据对应所述第一标识序列中的一个标识,所述脱敏密钥包括至少一个所述第一标识序列中的标识;第一标识确定模块,用于根据所述数据字典确定在所述第一标识序列中确定与所述第一数据对应的第一标识;标识字典确定模块,用于根据所述脱敏密钥确定标识字典,所述标识字典包括所述第一标识序列和第二标识序列的对应关系,所述第二标识序列为根据所述脱敏密钥中的标识对所述第一标识序列进行重排序得到的序列,所述第二标识序列中的一个标识对应所述第一标识序列中的一个标识;第二标识确定模块,用于根据所述标识字典在所述第二标识序列中确定与所述第一标识对应的第二标识;脱敏数据确定模块,用于根据所述数据字典在所述数据序列中确定与所述第二标识对应的第二数据,并将所述第二数据确定为所述第一数据对应的脱敏数据。第三方面,提供另一种数据脱敏装置,包括处理器、存储器以及输入输出接口,所述处理器、存储器和输入输出接口相互连接,其中,所述输入输出接口用于输入或输出数据,所述存储器用于存储数据脱敏装置执行上述方法的应用程序代码,所述处理器被配置用于执行上述第一方面的方法。第四方面,提供一种计算机可本文档来自技高网...

【技术保护点】
1.一种数据脱敏方法,其特征在于,包括:确定第一数据对应的数据字典和脱敏密钥,所述第一数据为待脱敏的数据,所述数据字典包括数据序列和第一标识序列的对应关系,所述数据序列包括多个数据,所述第一标识序列包括多个标识,所述数据序列中的一个数据对应所述第一标识序列中的一个标识,所述脱敏密钥包括至少一个所述第一标识序列中的标识;根据所述数据字典在所述第一标识序列中确定与所述第一数据对应的第一标识;根据所述脱敏密钥确定标识字典,所述标识字典包括所述第一标识序列和第二标识序列的对应关系,所述第二标识序列为根据所述脱敏密钥中的标识对所述第一标识序列进行重排序得到的序列,所述第二标识序列中的一个标识对应所述第一标识序列中的一个标识;根据所述标识字典在所述第二标识序列中确定与所述第一标识对应的第二标识;根据所述数据字典在所述数据序列中确定与所述第二标识对应的第二数据,并将所述第二数据确定为所述第一数据对应的脱敏数据。

【技术特征摘要】
1.一种数据脱敏方法,其特征在于,包括:确定第一数据对应的数据字典和脱敏密钥,所述第一数据为待脱敏的数据,所述数据字典包括数据序列和第一标识序列的对应关系,所述数据序列包括多个数据,所述第一标识序列包括多个标识,所述数据序列中的一个数据对应所述第一标识序列中的一个标识,所述脱敏密钥包括至少一个所述第一标识序列中的标识;根据所述数据字典在所述第一标识序列中确定与所述第一数据对应的第一标识;根据所述脱敏密钥确定标识字典,所述标识字典包括所述第一标识序列和第二标识序列的对应关系,所述第二标识序列为根据所述脱敏密钥中的标识对所述第一标识序列进行重排序得到的序列,所述第二标识序列中的一个标识对应所述第一标识序列中的一个标识;根据所述标识字典在所述第二标识序列中确定与所述第一标识对应的第二标识;根据所述数据字典在所述数据序列中确定与所述第二标识对应的第二数据,并将所述第二数据确定为所述第一数据对应的脱敏数据。2.根据权利要求1所述的方法,其特征在于,所述脱敏密钥包括m个标识,所述标识字典包括M个子标识字典,所述M个子标识字典由可重复排列的m个子标识字典排列组合得到,所述m个子标识字典为根据所述m个标识确定的子标识字典,m、M均为正整数,M大于或等于m;所述M个子标识字典中的第i个子标识字典包括所述第一标识序列和第i标识序列的对应关系,所述第i标识序列为对所述第一标识序列进行重排序得到的序列,所述第i标识序列中的一个标识对应所述第一标识序列中的一个标识,第M标识序列为所述第二标识序列,i为正整数,i大于或等于1并且小于或等于M;所述根据所述标识字典在所述第二标识序列中确定与所述第一标识对应的第二标识,包括:根据所述第i个子标识字典在所述第i标识序列中确定与第i标识对应的第(i+1)标识,其中,当i=1时,所述第i标识为所述第一标识;将第M标识序列中的第(M+1)标识确定为所述第二标识。3.根据权利要求2所述的方法,其特征在于,M=m,所述第i个子标识字典为根据所述脱敏密钥中的第j个标识确定的子标识字典,j=i,j为正整数,j大于或等于1并且小于或等于m;或者M=2m-1,所述第i个子标识字典为根据所述脱敏密钥中的第j个标识确定的子标识字典,4.根据权利要求3所述的方法,其特征在于,所述第i标识序列为对所述第一标识序列进行按顺序移位得到的序列,并且,所述第j个标识在所述第i个子标识字典的第i标识序列中位于第k位,k为大于或等于1并且小于或等于N的任一正整数,N等于所述第一标识序列中的标识的个数。5.根据权利要求2-4任一项所述的方法,其特征在于,所述确定第一数据对应的数据字典和脱敏密钥之后,包括:确定所述标识字典中的第A个子标识字典,所述第A个子标识字典为根据所述脱敏密钥中的第a个标识确定的子标识字典,B为所述第一数据在待脱敏的数据整体中的排列顺序,所述数据整体包括至少两个数据,a和n均为正整数,N等于所述第一标识序列中的标识的个数;根据所述第A个子标识字典确定第A标识序列中的第三标识,所述第三标...

【专利技术属性】
技术研发人员:高勇董晓琼
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1