具有关联关系的多字段数据的脱敏方法、系统、装置及计算机存储介质制造方法及图纸

技术编号:33834496 阅读:26 留言:0更新日期:2022-06-16 11:47
本申请涉及信息安全技术领域,具体涉及一种具有关联关系的多字段数据的脱敏方法、系统、装置及计算机存储介质,具有关联关系的多字段数据的脱敏方法,包括:对具有关联关系的字段设置同一目标脱敏规则,同时具有关联关系的字段的目标脱敏规则根据字段间的关联关系设置脱敏规则的关联关系;基于所述目标脱敏规则及脱敏规则间的关联关系,分别生成各字段对应的脱敏后的目标脱敏数据;更新脱敏后的目标脱敏数据至目标文件或目标数据库。本申请基于目标敏感数据中字段间的关联关系,具有关联关系的目标敏感数据采用同一脱敏规则,从而实现脱敏多字段后保持原有的关联关系的功能。脱敏多字段后保持原有的关联关系的功能。脱敏多字段后保持原有的关联关系的功能。

【技术实现步骤摘要】
具有关联关系的多字段数据的脱敏方法、系统、装置及计算机存储介质


[0001]本申请涉及信息安全
,具体涉及一种具有关联关系的多字段数据的脱敏方法、系统、装置及计算机存储介质。

技术介绍

[0002]随着大数据的快速发展,无刻都在不断产生着包含大量数据的原始数据集,同时原始数据集中可能含有一些隐私数据,如用户身份证信息、银行信息等,原始数据集在未经处理的情况下应用于业务分析、开发测试,甚至一些外包业务等场景中可能会导致隐私泄露。为了降低隐私泄露,需要针对原始数据集进行脱敏处理,从而得到脱敏数据集,以利用脱敏数据集来代替原始数据集中的真实数据,从而隐藏原始数据集中的隐私数据。
[0003]传统的脱敏方式主要针对单个字段进行脱敏处理,当多个字段存在一定的关联关系时,针对单个字段进行脱敏会破坏关联字段的关联关系,导致脱敏后数据关系破坏而影响业务系统的数据使用。

技术实现思路

[0004]为了改善在关联关系的多个字段脱敏后数据关系遭破坏而影响业务系统的数据使用,本申请提供了一种具有关联关系的多字段数据的脱敏方法、系统、装置及计算机存储介质。
[0005]第一方面,本申请提供的具有关联关系的多字段数据的脱敏方法,其通过以下技术方案实现:具有关联关系的多字段数据的脱敏方法,包括:对具有关联关系的字段设置同一目标脱敏规则,同时具有关联关系的字段的目标脱敏规则根据字段间的关联关系设置脱敏规则的关联关系;基于所述目标脱敏规则及脱敏规则间的关联关系,分别生成各字段对应的脱敏后的目标脱敏数据;更新脱敏后的目标脱敏数据至目标文件或目标数据库。
[0006]在一些实施方式中,所述对具有关联关系的字段设置同一目标脱敏规则,同时具有关联关系的字段的目标脱敏规则根据字段间的关联关系设置脱敏规则的关联关系包括:预设敏感类型,及各敏感类型对应的脱敏规则;对待脱敏的文件进行解析,基于预设的敏感类型从待脱敏的文件中获取所述待脱敏的文件中的目标敏感数据;获取目标敏感数据中字段间的关联关系;基于所述敏感类型确定所述目标敏感数据中个字段对应的目标脱敏规则,其中,具有关联关系的若干字段设置为同一目标脱敏规则;根据字段间的关联关系设置具有关联关系的字段的目标脱敏规则的关联关系。
[0007]在一些实施方式中第,每种所述脱敏规则包括至少一个脱敏基数及与每个所述脱敏基数对应的脱敏转换规则。
[0008]在一些实施方式中,所述基于所述目标脱敏规则及脱敏规则间的关联关系,分别生成各字段对应的脱敏后的目标脱敏数据包括:响应于脱敏需求,确定所述目标脱敏规则所选中的脱敏基数;分别根据每种所述目标脱敏规则所选中的目标脱敏基数对应的目标脱敏转换规则及脱敏规则间的关联关系,对所述目标敏感数据进行脱敏操作。
[0009]在一些实施方式中,具有关联关系的若干字段中,包括条件字段和结果字段,所述基于所述目标脱敏规则及脱敏规则间的关联关系,分别生成各字段对应的脱敏后的目标脱敏数据包括:所述条件字段根据所述目标脱敏规则所选中的目标脱敏基数对应的目标脱敏转换规则进行脱敏操作,得到目标脱敏条件字段;通过所述目标脱敏条件字段生成目标脱敏结果字段。
[0010]第二方面,本申请提供的具有关联关系的多字段数据的脱敏系统,其通过以下技术方案实现:具有关联关系的多字段数据的脱敏系统,包括:用于存储预设敏感类型及各敏感类型对应的脱敏规则的脱敏规则模型库;用于对待脱敏的文件进行解析,并基于预设的敏感类型从待脱敏的文件中获取所述待脱敏的文件中的目标敏感数据,及获取目标敏感数据中字段间的关联关系的文件解析单元;用于根据字段间的关联关系设置脱敏规则间的关联关系的脱敏规则关联单元;用于基于所述目标脱敏规则及脱敏规则间的关联关系,生成各字段对应的脱敏后的目标脱敏数据的脱敏单元;用于更新脱敏后的目标脱敏数据至目标文件或目标数据库的更新单元。
[0011]第三方面,本申请提供的具有关联关系的多字段数据的脱敏设备,其通过以下技术方案实现:具有关联关系的多字段数据的脱敏设备,包括:一个或多个处理器;计算机存储介质,用于存储一个或多个计算机可读指令,当所述一个或多个计算机可读指令被所述一个或多个处理器执行时,使得一个或多个处理器实现上述的方法。
[0012]第四方面,本申请提供的计算机存储介质,其通过以下技术方案实现:计算机存储介质,存储有一个或多个计算机可读指令,所述计算机可读指令被处理器执行时,使得处理器实现上述的方法。
[0013]本申请提供的具有关联关系的多字段数据的脱敏方法、系统、装置及计算机存储介质与现有技术相比其优点在于:基于目标敏感数据中字段间的关联关系,具有关联关系的目标敏感数据采用同一脱敏规则,从而实现脱敏多字段后保持原有的关联关系的功能。
附图说明
[0014]图1为本申请提供的具有关联关系的多字段数据的脱敏方法的流程图;图2为图1中步骤S1的流程图;图3为图1中步骤S2的流程图流程图;图4为本申请提供的具有关联关系的多字段数据的脱敏系统的结构框图。
[0015]图中,1、脱敏规则模型库;2、文件解析单元;3、脱敏规则关联单元;4、脱敏单元;5、更新单元。
具体实施方式
[0016]下面将参照附图更详细地描述本公开的实施例。虽然附图中显示了本公开的某些实施例,然而应当理解的是,本公开可以通过各种形式来实现,而且不应该被解释为限于这里阐述的实施例,相反提供这些实施例是为了更加透彻和完整地理解本公开。应当理解的是,本公开的附图及实施例仅用于示例性作用,并非用于限制本公开的保护范围。
[0017]应当理解,本公开的方法实施方式中记载的各个步骤可以按照不同的顺序执行,和/或并行执行。此外,方法实施方式可以包括附加的步骤和/或省略执行示出的步骤。本公开的范围在此方面不受限制。
[0018]本文使用的术语“包括”及其变形是开放性包括,即“包括但不限于”。术语“基于”是“至少部分地基于”。
[0019]随着大数据的快速发展,无刻都在不断产生着包含大量数据的原始数据集,同时原始数据集中可能含有一些隐私数据,如在某一文件中,涉及产品的第一金额(A字段)、金额浮动比例(B字段)及浮动后的第二金额(C字段),其中,字段A、字段B、及字段C即为原始隐私数据,需要针对此类原始隐私数据集进行脱敏处理,从而得到脱敏数据集。而往往,这些原始隐私数据间可能会存在关联关系,如在上述示例中,A字段、B字段和C字段间的关联关系为A字段*B字段=C字段,因此,需要保证脱敏后的A字段、B字段和C字段依然能够保持原有的关联关系。
[0020]如图1至图3所示,本申请首先公开了具有关联关系的多字段数据的脱敏方法,其能够实现脱敏后的书依然能够保持原有的关联关系,其具体通过以下步骤实现:S11:预设敏感类型,及各敏感类型对应的脱敏规则。
[0021]预置敏感类型的目的在于约定将一种或几种类型的信息定义为敏感数据,其中,所述预置敏感类型的方式包括但不限于通过正则表达式定义配置敏感类型、内置敏感类型存储库(比如地址库、邮本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.具有关联关系的多字段数据的脱敏方法,其特征在于,包括:对具有关联关系的字段设置同一目标脱敏规则,同时具有关联关系的字段的目标脱敏规则根据字段间的关联关系设置脱敏规则的关联关系;基于所述目标脱敏规则及脱敏规则间的关联关系,分别生成各字段对应的脱敏后的目标脱敏数据;更新脱敏后的目标脱敏数据至目标文件或目标数据库。2.根据权利要求1所述的具有关联关系的多字段数据的脱敏方法,其特征在于,所述对具有关联关系的字段设置同一目标脱敏规则,同时具有关联关系的字段的目标脱敏规则根据字段间的关联关系设置脱敏规则的关联关系包括:预设敏感类型,及各敏感类型对应的脱敏规则;对待脱敏的文件进行解析,基于预设的敏感类型从待脱敏的文件中获取所述待脱敏的文件中的目标敏感数据;获取目标敏感数据中字段间的关联关系;基于所述敏感类型确定所述目标敏感数据中个字段对应的目标脱敏规则,其中,具有关联关系的若干字段设置为同一目标脱敏规则;根据字段间的关联关系设置具有关联关系的字段的目标脱敏规则的关联关系。3.根据权利要求2所述的具有关联关系的多字段数据的脱敏方法,其特征在于,每种所述脱敏规则包括至少一个脱敏基数及与每个所述脱敏基数对应的脱敏转换规则。4.根据权利要求3所述的具有关联关系的多字段数据的脱敏方法,其特征在于,所述基于所述目标脱敏规则及脱敏规则间的关联关系,分别生成各字段对应的脱敏后的目标脱敏数据包括:响应于脱敏需求,确定所述目标脱敏规则所选中的脱敏基数;分别根据每种所述目标脱敏规则所选中的目标脱敏基数对应的目标脱敏转换规则及脱敏规则间的关联关系,对所述目标...

【专利技术属性】
技术研发人员:任养超李博郭义兰
申请(专利权)人:上海上讯信息技术股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1