一种面向身份证号码的集成数据脱敏系统及方法技术方案

技术编号:21060703 阅读:87 留言:0更新日期:2019-05-08 07:15
本发明专利技术涉及一种面向身份证号码的集成数据脱敏系统及方法,主要包括:(1)收集待脱敏身份证号码;(2)采用脱敏方法对待脱敏身份证号码进行脱敏处理,获得一级脱敏身份证号码。另外,还可根据实际需要进一步地进行脱敏操作获取二级脱敏身份证号码。本发明专利技术的脱敏结果都很好的保留了地域信息、年龄信息、性别信息等,具有很好的分析价值;本发明专利技术采用一种多策略的混合脱敏、扩展脱敏等方式来满足不同场景的脱敏需求,可以在亿万级别的数据量下,保证脱敏结果的一致性,同时满足不同需求的身份证脱敏场景。

An Integrated Data Desensitization System and Method for ID Card Number

【技术实现步骤摘要】
一种面向身份证号码的集成数据脱敏系统及方法
本专利技术涉及数据处理领域,尤其涉及一种面向身份证号码的集成数据脱敏系统及方法。
技术介绍
随着科技的发展、信息化技术的不断进步,大数据时代已经悄然来临,爆炸式增长的数据已然成为一种宝贵的资产。无论是各种企业还是政府,每天都或多或少的收集、存储各种各样的数据,在政府、企业,尤其是政府机构中,为了实现数据的利用最大化,各单位之间就必须要实现数据的共享交换,以打破数据壁垒,连通数据孤岛。在交换的数据之中,一定会存在各种各样的个人隐私数据,随着数据交换的不断进行,不可避免的,敏感数据泄露的风险也在与日俱增。数据脱敏又称数据变形、数据漂白。主要方法有算法转换、替代、混洗、数值变换、加密、模糊、截断等。一种好的脱敏方法能尽可能的保留数据价值,同时消除原始数据的痕迹,从而达到既能有效的保护数据,又能提高数据利用率的目的。在个人隐私数据的共享交换之中,个人身份证信息既是一个人最重要的隐私信息,又是连接同一个人在不同系统中的各种不同信息的关键所在。所以,做好身份证信息的脱敏工作十分重要。在一部分现有的脱敏方法中,首先,只对6位行政区域代码中的前两位(省级代码)进行置换脱敏,可能会产生无效的行政区域代码,如:342427→112427。其次,出生日期、顺序号随机生成,对于不同系统的同一身份证号码,极有可能脱敏成不同的结果,从而对数据融合分析造成影响。本专利的优势在于,以上两个问题都在本专利中得到了很好的解决。还有一部分现有的脱敏方法中,算法相关参数固定,没有跟原身份证号关联;其次,出生日期脱敏后都会偏大;最后也是最重要的一点,该方法只能在少量数据脱敏时保证唯一性,当待脱敏的身份证号的数据量达到几十万条时,就会出现不同身份证号码脱敏成同一个脱敏结果的情况,从而影响数据的串联、融合等。本专利的优势在于,针对以上三个问题都提出了有效的解决办法。
技术实现思路
本专利技术为克服上述的不足之处,目的在于提供一种面向身份证号码的集成数据脱敏系统及方法,本专利技术系统简单,本专利技术方法采用一种多策略的混合脱敏、扩展脱敏等方式来满足不同场景的脱敏需求,可以在亿万级别的数据量下,保证脱敏结果的一致性。本专利技术是通过以下技术方案达到上述目的:一种面向身份证号码的集成数据脱敏系统,包括:待脱敏身份证数据集获取模块、合规身份证号码检验筛选模块、身份证数据集统一模块、身份证号码脱敏模块;其中,待脱敏身份证数据集获取模块用于收集各个交换系统的待脱敏身份证号码,形成统一的待脱敏身份证号码数据集;合规身份证号码检验筛选模块用于检验从待脱敏数据集传输过来的待脱敏身份证号码是否符合身份证号组成规范,如果符合则将其传入身份证数据集统一模块,反之则剔除;身份证数据集统一模块用于将所有的15位身份证号码升位成18位身份证号码,便于后期脱敏处理;身份证号码脱敏模块包含四个子模块,每个子模块对应一种脱敏方法,用户可以根据实际需求来选择最适合的子模块中的脱敏方法,完成身份证号码的脱敏。作为优选,所述的四个子模块,分别为:子模块I,将待脱敏身份证号码进行一级脱敏处理,获得一级脱敏身份证号码;子模块II,将待脱敏身份证号码进行一级脱敏处理,获得一级脱敏身份证号码;将一级脱敏身份证号码的第15位置换为混淆码,将一级脱敏身份证号码的第16位置换为待脱敏身份证号码的第18位校验码,获得最终的脱敏后身份证号码;子模块III,将待脱敏身份证号码进行一级脱敏处理,获得一级脱敏身份证号码;将一级脱敏身份证号码后面添加所获得的2位混淆码,在2位混淆码后面添加1位待脱敏身份证号码的校验码,获得最终的脱敏后身份证号码;子模块IV,将待脱敏身份证号码进行一级脱敏处理,获得一级脱敏身份证号码;将一级脱敏身份证号码后面添加所获得的4位混淆码,在4位混淆码后面添加1位待脱敏身份证号码的校验码,获得最终的脱敏后身份证号码;其中所述的一级脱敏处理包括:将待脱敏身份证号码进行分割,取得行政区域代码、出生日期代码以及顺序码,根据行政区域代码设置参数;将行政区域代码与参数相乘、取余后查行政区域代码表,获得脱敏后的行政区域代码;将出生日期代码与参数相乘、取余后将原出生日期根据结果左右摇摆,得到脱敏后的出生日期代码;顺序码不作处理,最后一位校验码根据脱敏后的行政区域代码、脱敏后的出生日期代码、顺序码自动生成;所述混淆码获取包括:取一级脱敏身份证号码和/或待脱敏身份证号码的部分号码,号码运算取余后查混淆码对照表获得混淆码。一种面向身份证号码的集成数据脱敏方法,包括如下步骤:(1)收集待脱敏身份证号码;(2)采用脱敏方法I对待脱敏身份证号码进行脱敏处理;所述的脱敏方法I为将待脱敏身份证号码进行分割,取得行政区域代码、出生日期代码以及顺序码,根据行政区域代码设置参数;将行政区域代码与参数相乘、取余后查行政区域代码表,获得脱敏后的行政区域代码;将出生日期代码与参数相乘、取余后将原出生日期根据结果左右摇摆,得到脱敏后的出生日期代码;顺序码不作处理,最后一位校验码根据脱敏后的行政区域代码、脱敏后的出生日期代码、顺序码自动生成,获得一级脱敏身份证号码。一种面向身份证号码的集成数据脱敏方法,包括如下步骤:(1)收集待脱敏身份证号码;(2)采用脱敏方法II对待脱敏身份证号码进行脱敏处理,具体如下:(a)将待脱敏身份证号码进行分割,取得行政区域代码、出生日期代码以及顺序码,根据行政区域代码设置参数;将行政区域代码与参数相乘、取余后查行政区域代码表,获得脱敏后的行政区域代码;将出生日期代码与参数相乘、取余后将原出生日期根据结果左右摇摆,得到脱敏后的出生日期代码;顺序码不作处理,最后一位校验码根据脱敏后的行政区域代码、脱敏后的出生日期代码、顺序码自动生成,获得一级脱敏身份证号码;(b)取一级脱敏身份证号码和待脱敏身份证号码,号码运算取余后查混淆码对照表获得混淆码,进行二级脱敏,获得最终脱敏后的身份证号码,其中,所述的号码运算采用以下一种或多种方式:相加;相乘;加设定值;其中,所述的二级脱敏采用以下任意一种或多种方式:将混淆码替换一级脱敏身份证号码;将混淆码添加到一级脱敏身份证号码;将待脱敏身份证号码的部分号码替换一级脱敏身份证号码;将待脱敏身份证号码的部分号码添加到一级脱敏身份证号码。作为优选,所述步骤(b)具体如下:(b.1)取待脱敏的身份证号码的前17位之和S1~17,根据如下算法获得余数Remainder,再根据Remainder查混淆码对照表I获取混淆码;Remainder=S1~17mod36其中,混淆码对照表I具体为:余数为0、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35对应的混淆码分别为Z、A、Q、X、S、W、C、D、E、V、F、R、B、G、T、N、H、Y、M、J、U、0、1、2、3、4、5、6、7、8、9、I、O、P、K、L;(b.2)将一级脱敏身份证号码的第15位置换为所获得的混淆码,将一级脱敏身份证号码的第16位置换为待脱敏身份证号码的第18位校验码,获得最终脱敏后的身份证号码。作为优选,所述步骤(b)具体还可如下:(b.1)取待脱敏本文档来自技高网
...

【技术保护点】
1.一种面向身份证号码的集成数据脱敏方法,其特征在于包括如下步骤:(1)收集待脱敏身份证号码;(2)采用脱敏方法I对待脱敏身份证号码进行脱敏处理;所述的脱敏方法I为将待脱敏身份证号码进行分割,取得行政区域代码、出生日期代码以及顺序码,根据行政区域代码设置参数;将行政区域代码与参数相乘、取余后查行政区域代码表,获得脱敏后的行政区域代码;将出生日期代码与参数相乘、取余后将原出生日期根据结果左右摇摆,得到脱敏后的出生日期代码;顺序码不作处理,最后一位校验码根据脱敏后的行政区域代码、脱敏后的出生日期代码、顺序码自动生成,获得一级脱敏身份证号码。

【技术特征摘要】
1.一种面向身份证号码的集成数据脱敏方法,其特征在于包括如下步骤:(1)收集待脱敏身份证号码;(2)采用脱敏方法I对待脱敏身份证号码进行脱敏处理;所述的脱敏方法I为将待脱敏身份证号码进行分割,取得行政区域代码、出生日期代码以及顺序码,根据行政区域代码设置参数;将行政区域代码与参数相乘、取余后查行政区域代码表,获得脱敏后的行政区域代码;将出生日期代码与参数相乘、取余后将原出生日期根据结果左右摇摆,得到脱敏后的出生日期代码;顺序码不作处理,最后一位校验码根据脱敏后的行政区域代码、脱敏后的出生日期代码、顺序码自动生成,获得一级脱敏身份证号码。2.一种面向身份证号码的集成数据脱敏方法,其特征在于包括如下步骤:(1)收集待脱敏身份证号码;(2)采用脱敏方法II对待脱敏身份证号码进行脱敏处理,具体如下:(a)将待脱敏身份证号码进行分割,取得行政区域代码、出生日期代码以及顺序码,根据行政区域代码设置参数;将行政区域代码与参数相乘、取余后查行政区域代码表,获得脱敏后的行政区域代码;将出生日期代码与参数相乘、取余后将原出生日期根据结果左右摇摆,得到脱敏后的出生日期代码;顺序码不作处理,最后一位校验码根据脱敏后的行政区域代码、脱敏后的出生日期代码、顺序码自动生成,获得一级脱敏身份证号码;(b)取一级脱敏身份证号码和待脱敏身份证号码,号码运算取余后查混淆码对照表获得混淆码,进行二级脱敏,获得最终脱敏后的身份证号码,其中,所述的号码运算采用以下一种或多种方式:相加;相乘;加设定值;其中,所述的二级脱敏采用以下任意一种或多种方式:将混淆码替换一级脱敏身份证号码;将混淆码添加到一级脱敏身份证号码;将待脱敏身份证号码的部分号码替换一级脱敏身份证号码;将待脱敏身份证号码的部分号码添加到一级脱敏身份证号码。3.根据权利要求2所述的一种面向身份证号码的集成数据脱敏方法,其特征在于:所述步骤(b)具体如下:(b.1)取待脱敏的身份证号码的前17位之和S1~17,根据如下算法获得余数Remainder,再根据Remainder查混淆码对照表I获取混淆码;Remainder=S1~17mod36其中,混淆码对照表I具体为:余数为0、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35对应的混淆码分别为Z、A、Q、X、S、W、C、D、E、V、F、R、B、G、T、N、H、Y、M、J、U、0、1、2、3、4、5、6、7、8、9、I、O、P、K、L;(b.2)将一级脱敏身份证号码的第15位置换为所获得的混淆码,将一级脱敏身份证号码的第16位置换为待脱敏身份证号码的第18位校验码,获得最终脱敏后的身份证号码。4.根据权利要求2所述的一种面向身份证号码的集成数据脱敏方法,其特征在于:所述步骤(b)具体还可如下:(b.1)取待脱敏身份证号码的第1-6位之和S1~6、第7-14位之和S7~14;根据如下算法获得余数Remainder1、Remainder2,根据Remainder1、Remainder2查混淆码对照表I获取混淆码:Remainder1=S1~6mod36Remainder2=S7~14mod36其中,混淆码对照表I具体为:余数为0、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35对应的混淆码分别为Z、A、Q、X、S、W、C、D、E、V、F、R、B、G、T、N、H、Y、M、J、U、0、1、2、3、4、5、6、7、8、9、I、O、P、K、L;(b.2)将一级脱敏身份证号码的后面追加所获得的2位混淆码,再在混淆码面追加一位待脱敏身份证号码的校验码,获得最终脱敏后的身份证号码。5.根据权利要求2所述的一种面向身份证号码的集成数据脱敏方法,其特征在于:所述步骤(b)具体还可如下:(b.1)取待脱敏的身份证号码的第1-6位之和S1~6、第7-14位之和S7~14,计算时若遇到某一位为0时则加10;根据如下算法计算获得余数Remainder1、Remainder2,再根据Remainder1、Remainder2查混淆码对照表I获取混淆码:Remainder1=S1~6mod36Remainder2=S7~14mod36其中,混淆码对照表I具体为:余数为0、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35对应的混淆码分别为Z、A、Q、X、S、W、C、D、E、V、F、R、B、G、T、N、H、Y、M、J、U、0、1、2、3、4、5、6、7、8、9、I、O、P、K、L;(b.2)取待脱敏身份证号码的第1~6位之积C1~6、第7~14位之积C7~14,在计算时若遇到某一位为0时则乘以10;根据如下算法计算获得余数Remainder3、Remainder4,再根据Remainder3、Remainder4查混淆码对照表II获取混淆码:Remainder3=C1~6mod37Remainder4=C7~14mod37其中,混淆码对照表II具体为:余数为36、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21...

【专利技术属性】
技术研发人员:张名民李建元于海龙秦俊峰张江鑫王超群
申请(专利权)人:银江股份有限公司
类型:发明
国别省市:浙江,33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1