一种数据脱敏方法、终端设备及存储介质技术

技术编号：33344449 阅读：29 留言：0更新日期：2022-05-08 09:36

本发明专利技术涉及一种数据脱敏方法、终端设备及存储介质，该方法中包括：基于待脱敏的姓名或身份证号中的具有固定数量种类的特征构建对应的特征集；从特征集中查找对应特征所在的位置，并将查找到的位置与固定偏移量的运算结果作为该特征对应的脱敏后的特征在特征集中的位置，进而获得脱敏后的特征；结合脱敏前或脱敏后的特征在特征集中的位置，计算其他特征对应的脱敏后的特征；将所有脱敏后的特征按顺序拼接为脱敏后的姓名或身份证号。本发明专利技术使得脱敏后的即保留了原有格式，又使其与真实数据混淆在一起也无法立即分辨出来。淆在一起也无法立即分辨出来。淆在一起也无法立即分辨出来。

全部详细技术资料下载

【技术实现步骤摘要】
一种数据脱敏方法、终端设备及存储介质

[0001]本专利技术涉及脱敏
，尤其涉及一种数据脱敏方法、终端设备及存储介质。

技术介绍

[0002]数据脱敏，顾名思义，是将数据中的敏感信息(比如：姓名，身份证号码，手机号码，地址，邮箱等)通过脱敏规则进行数据变形，实现对敏感信息的屏蔽。业界常见的脱敏规则有：替换、加密、重排、掩码、截断，亦可以通过期望的算法自定义脱敏规则。随着大数据时代的到来，数据作为信息的载体往往含有很高的价值，描述人的数据更为敏感，使得人员信息的数据安全尤为重要。
[0003]现有的人员信息数据脱敏，大多数采用两种方案：
[0004](1)隐藏或替换关键敏感信息，比如姓名脱敏用
‘
*
’
替换名，手机号隐藏中间4位数字，这种方法最简单，所以也被普遍使用，但该方法脱敏后的数据还保留一部分真实性，有可能出现风险，且存在严重不可逆性和脱敏后数据欺骗性全无的问题。Mask是最常用的替换式数据脱敏方法，该方法数据长度不变，只保留部分数据信息，比如：
‘
123456789
’
脱敏为
‘
123***789
’
，
‘
张三
’
脱敏为
‘
张*
’
。该方法保留了数据的格式特征，但是数据不可逆性和脱敏后易重复性暴露无遗。
[0005](2)以人为单位或以批次为单位生成专属的密钥加密，比如在自定义脱敏规则的前提下，绑定身份证...

【技术保护点】

【技术特征摘要】
1.一种数据脱敏方法，其特征在于，包括以下步骤：基于待脱敏的姓名或身份证号中的具有固定数量种类的特征构建对应的特征集；从特征集中查找对应特征所在的位置，并将查找到的位置与固定偏移量的运算结果作为该特征对应的脱敏后的特征在特征集中的位置，进而获得脱敏后的特征；结合脱敏前或脱敏后的特征在特征集中的位置，计算其他特征对应的脱敏后的特征；将所有脱敏后的特征按顺序拼接为脱敏后的姓名或身份证号。2.根据权利要求1所述的数据脱敏方法，其特征在于：当对姓名进行脱敏时，设定用于构建特征集的特征为姓名中表征姓的第一个汉字，对应的特征集为姓字符集。3.根据权利要求2所述的数据脱敏方法，其特征在于：当对姓名进行脱敏时，结合脱敏前或脱敏后的特征在特征集中的位置，计算其他特征对应的脱敏后的特征的具体方法为：针对第一个汉字之后的其他汉字，将各汉字在GB2312字符集中的位置与各汉字对应的位置偏移相加，将相加后的值在十六进制的B0A0
‑
F7EF位置范围内循环取值的结果作为各汉字对应的脱敏后的汉字在GB2312字符集中的位置，根据位置从GB2312字符集中查找得到各汉字脱敏后的汉字；其中，第二个汉字对应的位置偏移为第一个汉字对应的脱敏后的汉字在姓字符集中的位置；第二个汉字之后的汉字对应的位置偏移为前一个汉字对应的脱敏后的汉字在GB2312字符集中的位置。4.根据权利要求1所述的数据脱敏方法，其特征...

【专利技术属性】
技术研发人员：刘东东，张磊，姚志强，邢磊，
申请(专利权)人：厦门市美亚柏科信息股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人