【技术实现步骤摘要】
一种面向身份证号码的集成数据脱敏系统及方法
本专利技术涉及数据处理领域,尤其涉及一种面向身份证号码的集成数据脱敏系统及方法。
技术介绍
随着科技的发展、信息化技术的不断进步,大数据时代已经悄然来临,爆炸式增长的数据已然成为一种宝贵的资产。无论是各种企业还是政府,每天都或多或少的收集、存储各种各样的数据,在政府、企业,尤其是政府机构中,为了实现数据的利用最大化,各单位之间就必须要实现数据的共享交换,以打破数据壁垒,连通数据孤岛。在交换的数据之中,一定会存在各种各样的个人隐私数据,随着数据交换的不断进行,不可避免的,敏感数据泄露的风险也在与日俱增。数据脱敏又称数据变形、数据漂白。主要方法有算法转换、替代、混洗、数值变换、加密、模糊、截断等。一种好的脱敏方法能尽可能的保留数据价值,同时消除原始数据的痕迹,从而达到既能有效的保护数据,又能提高数据利用率的目的。在个人隐私数据的共享交换之中,个人身份证信息既是一个人最重要的隐私信息,又是连接同一个人在不同系统中的各种不同信息的关键所在。所以,做好身份证信息的脱敏工作十分重要。在一部分现有的脱敏方法中,首先,只对6位行政区域代码中的前两位(省级代码)进行置换脱敏,可能会产生无效的行政区域代码,如:342427→112427。其次,出生日期、顺序号随机生成,对于不同系统的同一身份证号码,极有可能脱敏成不同的结果,从而对数据融合分析造成影响。本专利的优势在于,以上两个问题都在本专利中得到了很好的解决。还有一部分现有的脱敏方法中,算法相关参数固定,没有跟原身份证号关联;其次,出生日期脱敏后都会偏大;最后也是最重要的一点,该方 ...
【技术保护点】
1.一种面向身份证号码的集成数据脱敏方法,其特征在于包括如下步骤:(1)收集待脱敏身份证号码;(2)采用脱敏方法I对待脱敏身份证号码进行脱敏处理;所述的脱敏方法I为将待脱敏身份证号码进行分割,取得行政区域代码、出生日期代码以及顺序码,根据行政区域代码设置参数;将行政区域代码与参数相乘、取余后查行政区域代码表,获得脱敏后的行政区域代码;将出生日期代码与参数相乘、取余后将原出生日期根据结果左右摇摆,得到脱敏后的出生日期代码;顺序码不作处理,最后一位校验码根据脱敏后的行政区域代码、脱敏后的出生日期代码、顺序码自动生成,获得一级脱敏身份证号码。
【技术特征摘要】
1.一种面向身份证号码的集成数据脱敏方法,其特征在于包括如下步骤:(1)收集待脱敏身份证号码;(2)采用脱敏方法I对待脱敏身份证号码进行脱敏处理;所述的脱敏方法I为将待脱敏身份证号码进行分割,取得行政区域代码、出生日期代码以及顺序码,根据行政区域代码设置参数;将行政区域代码与参数相乘、取余后查行政区域代码表,获得脱敏后的行政区域代码;将出生日期代码与参数相乘、取余后将原出生日期根据结果左右摇摆,得到脱敏后的出生日期代码;顺序码不作处理,最后一位校验码根据脱敏后的行政区域代码、脱敏后的出生日期代码、顺序码自动生成,获得一级脱敏身份证号码。2.一种面向身份证号码的集成数据脱敏方法,其特征在于包括如下步骤:(1)收集待脱敏身份证号码;(2)采用脱敏方法II对待脱敏身份证号码进行脱敏处理,具体如下:(a)将待脱敏身份证号码进行分割,取得行政区域代码、出生日期代码以及顺序码,根据行政区域代码设置参数;将行政区域代码与参数相乘、取余后查行政区域代码表,获得脱敏后的行政区域代码;将出生日期代码与参数相乘、取余后将原出生日期根据结果左右摇摆,得到脱敏后的出生日期代码;顺序码不作处理,最后一位校验码根据脱敏后的行政区域代码、脱敏后的出生日期代码、顺序码自动生成,获得一级脱敏身份证号码;(b)取一级脱敏身份证号码和待脱敏身份证号码,号码运算取余后查混淆码对照表获得混淆码,进行二级脱敏,获得最终脱敏后的身份证号码,其中,所述的号码运算采用以下一种或多种方式:相加;相乘;加设定值;其中,所述的二级脱敏采用以下任意一种或多种方式:将混淆码替换一级脱敏身份证号码;将混淆码添加到一级脱敏身份证号码;将待脱敏身份证号码的部分号码替换一级脱敏身份证号码;将待脱敏身份证号码的部分号码添加到一级脱敏身份证号码。3.根据权利要求2所述的一种面向身份证号码的集成数据脱敏方法,其特征在于:所述步骤(b)具体如下:(b.1)取待脱敏的身份证号码的前17位之和S1~17,根据如下算法获得余数Remainder,再根据Remainder查混淆码对照表I获取混淆码;Remainder=S1~17mod36其中,混淆码对照表I具体为:余数为0、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35对应的混淆码分别为Z、A、Q、X、S、W、C、D、E、V、F、R、B、G、T、N、H、Y、M、J、U、0、1、2、3、4、5、6、7、8、9、I、O、P、K、L;(b.2)将一级脱敏身份证号码的第15位置换为所获得的混淆码,将一级脱敏身份证号码的第16位置换为待脱敏身份证号码的第18位校验码,获得最终脱敏后的身份证号码。4.根据权利要求2所述的一种面向身份证号码的集成数据脱敏方法,其特征在于:所述步骤(b)具体还可如下:(b.1)取待脱敏身份证号码的第1-6位之和S1~6、第7-14位之和S7~14;根据如下算法获得余数Remainder1、Remainder2,根据Remainder1、Remainder2查混淆码对照表I获取混淆码:Remainder1=S1~6mod36Remainder2=S7~14mod36其中,混淆码对照表I具体为:余数为0、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35对应的混淆码分别为Z、A、Q、X、S、W、C、D、E、V、F、R、B、G、T、N、H、Y、M、J、U、0、1、2、3、4、5、6、7、8、9、I、O、P、K、L;(b.2)将一级脱敏身份证号码的后面追加所获得的2位混淆码,再在混淆码面追加一位待脱敏身份证号码的校验码,获得最终脱敏后的身份证号码。5.根据权利要求2所述的一种面向身份证号码的集成数据脱敏方法,其特征在于:所述步骤(b)具体还可如下:(b.1)取待脱敏的身份证号码的第1-6位之和S1~6、第7-14位之和S7~14,计算时若遇到某一位为0时则加10;根据如下算法计算获得余数Remainder1、Remainder2,再根据Remainder1、Remainder2查混淆码对照表I获取混淆码:Remainder1=S1~6mod36Remainder2=S7~14mod36其中,混淆码对照表I具体为:余数为0、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35对应的混淆码分别为Z、A、Q、X、S、W、C、D、E、V、F、R、B、G、T、N、H、Y、M、J、U、0、1、2、3、4、5、6、7、8、9、I、O、P、K、L;(b.2)取待脱敏身份证号码的第1~6位之积C1~6、第7~14位之积C7~14,在计算时若遇到某一位为0时则乘以10;根据如下算法计算获得余数Remainder3、Remainder4,再根据Remainder3、Remainder4查混淆码对照表II获取混淆码:Remainder3=C1~6mod37Remainder4=C7~14mod37其中,混淆码对照表II具体为:余数为36、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21...
【专利技术属性】
技术研发人员:张名民,李建元,于海龙,秦俊峰,张江鑫,王超群,
申请(专利权)人:银江股份有限公司,
类型:发明
国别省市:浙江,33
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。