一种基于多组数据排列保证脱敏确定性的方法和装置制造方法及图纸

技术编号:32435842 阅读:16 留言:0更新日期:2022-02-24 19:09
本申请公开了一种基于多组数据排列保证脱敏确定性的方法和装置,该方法包括:获取待脱敏的数据,其中,所述待脱敏的数据为字符串;根据所述字符串中的每个字符在该字符串中的位置获取每个字符在多维数组中对应的元素,其中,所述多维数组中的对应的元素用于指示字符映射关系,所述字符映射关系用于将所述字符串中的字符映射为另一个不同的字符;根据所述每个字符对应的元素得到所述每个字符对应的映射关系;根据所述映射关系对每个字符进行替换,以对所述待脱敏的数据进行脱敏。通过本申请解决了现有技术中数据脱敏时无法保证脱敏后的数据确定性所导致的问题,从而保证了数据脱敏后的确定性,同时还在一定程度上增加了反推得到源数据的难度。推得到源数据的难度。推得到源数据的难度。

【技术实现步骤摘要】
一种基于多组数据排列保证脱敏确定性的方法和装置


[0001]本申请涉及到数据处理领域,具体而言,涉及一种基于多组数据排列保证脱敏确定性的方法和装置。

技术介绍

[0002]敏感数据是指泄漏后可能会给社会或个人带来严重危害的数据。包括个人隐私数据,如姓名、身份证号码、住址、电话、银行账号、邮箱、密码、医疗信息、教育背景等;也包括企业或社会机构不适合公布的数据,如企业的经营情况,企业的网络结构、IP地址列表等。
[0003]在数据进行脱敏处理中,可以根据数据内容来进行脱敏,例如在判断出预定字段下的多条数据进行脱敏时,对每条数据均进行脱敏处理。在脱敏时,有时需要保证脱敏数据的确定性,同时还要尽量使得用户无法推算出脱敏后的数据的源数据。在现有技术中一般使用一种字典来进行字符串中字符的映射,这种处理方法无法满足脱敏的需求。

技术实现思路

[0004]本申请实施例提供了一种基于多组数据排列保证脱敏确定性的方法和装置,以至少解决 现有技术中数据脱敏时无法保证脱敏后的数据确定性所导致的问题。
[0005]根据本申请的一个方面,提供了一种基于多组数据排列保证脱敏确定性的方法,包括:获取待脱敏的数据,其中,所述待脱敏的数据为字符串;根据所述字符串中的每个字符在该字符串中的位置获取每个字符在多维数组中对应的元素,其中,所述多维数组中的对应的元素用于指示字符映射关系,所述字符映射关系用于将所述字符串中的字符映射为另一个不同的字符;根据所述每个字符对应的元素得到所述每个字符对应的映射关系;根据所述映射关系对每个字符进行替换,以对所述待脱敏的数据进行脱敏。
[0006]进一步地,在获取所述待脱敏的数据之前,还包括:预先配置所述多维数组中的每个元素与字符串中字符所在位置的对应关系。
[0007]进一步地,按照字符串中的字符的位置倒序或者顺序的方式建立与所述多维数组中的每个元素的对应关系。
[0008]进一步地,根据所述字符串中的每个字符在该字符串中的位置获取每个字符在多维数组中对应的元素包括:在所述多维数组为多个的情况下,根据所述字符串选择所述字符串对应的多维数组;根据所述字符串中的每个字符在该字符串中的位置获取每个字符在选择出的多维数组中对应的元素。
[0009]进一步地,根据所述字符串选择所述字符串对应的多维数组包括:获取所述多维数组的数量;获取所述字符串中字符的数量;根据所述字符串中字符的数量和所述多维数组的数量从多个多维数组中选择所述字符串对应的多维数组。
[0010]根据本申请的另一个方面,还提供了一种基于多组数据排列保证脱敏确定性的装置包括:第一获取模块,用于获取待脱敏的数据,其中,所述待脱敏的数据为字符串;第二获取模块,用于根据所述字符串中的每个字符在该字符串中的位置获取每个字符在多维数组
中对应的元素,其中,所述多维数组中的对应的元素用于指示字符映射关系,所述字符映射关系用于将所述字符串中的字符映射为另一个不同的字符;映射模块,用于根据所述每个字符对应的元素得到所述每个字符对应的映射关系;脱敏模块,用于根据所述映射关系对每个字符进行替换,以对所述待脱敏的数据进行脱敏。
[0011]进一步地,还包括:配置模块,用于在获取所述待脱敏的数据之前,预先配置所述多维数组中的每个元素与字符串中字符所在位置的对应关系。
[0012]进一步地,按照字符串中的字符的位置倒序或者顺序的方式建立与所述多维数组中的每个元素的对应关系。
[0013]进一步地,所述第二获取模块用于:在所述多维数组为多个的情况下,根据所述字符串选择所述字符串对应的多维数组;根据所述字符串中的每个字符在该字符串中的位置获取每个字符在选择出的多维数组中对应的元素。
[0014]进一步地,所述第二获取模块用于:获取所述多维数组的数量;获取所述字符串中字符的数量;根据所述字符串中字符的数量和所述多维数组的数量从多个多维数组中选择所述字符串对应的多维数组。
[0015]在本申请实施例中,采用了获取待脱敏的数据,其中,所述待脱敏的数据为字符串;根据所述字符串中的每个字符在该字符串中的位置获取每个字符在多维数组中对应的元素,其中,所述多维数组中的对应的元素用于指示字符映射关系,所述字符映射关系用于将所述字符串中的字符映射为另一个不同的字符;根据所述每个字符对应的元素得到所述每个字符对应的映射关系;根据所述映射关系对每个字符进行替换,以对所述待脱敏的数据进行脱敏。通过本申请解决了现有技术中数据脱敏时无法保证脱敏后的数据确定性所导致的问题,从而保证了数据脱敏后的确定性,同时还在一定程度上增加了反推得到源数据的难度。
附图说明
[0016]构成本申请的一部分的附图用来提供对本申请的进一步理解,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:图1是根据本申请实施例的基于多组数据排列保证脱敏确定性的方法的流程图。
具体实施方式
[0017]需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
[0018]需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
[0019]在本实施例中提供了一种基于多组数据排列保证脱敏确定性的方法,图1是根据本申请实施例的基于多组数据排列保证脱敏确定性的方法的流程图,如图1所示,该流程包括如下步骤:步骤S102,获取待脱敏的数据,其中,所述待脱敏的数据为字符串;步骤S104,根据所述字符串中的每个字符在该字符串中的位置获取每个字符在多
维数组中对应的元素,其中,所述多维数组中的对应的元素用于指示字符映射关系,所述字符映射关系用于将所述字符串中的字符映射为另一个不同的字符;在该步骤中,在所述多维数组为多个的情况下,根据所述字符串选择所述字符串对应的多维数组;根据所述字符串中的每个字符在该字符串中的位置获取每个字符在选择出的多维数组中对应的元素。例如,获取所述多维数组的数量;获取所述字符串中字符的数量;根据所述字符串中字符的数量和所述多维数组的数量从多个多维数组中选择所述字符串对应的多维数组。
[0020]如果有3个多维数组,则可以按照字符串中的字符个数取3的余数来对应不同的多维数组。
[0021]作为一个可选的实施方式,在根据字符串中的字符的数量选择多维数组的时候,可以增加第一扰乱因子,其中,所述第一扰乱因子用于调整所述字符的数量;根据所述第一扰乱因子调整所述字符串的字符的数量(字符串本身不变,仅仅是用于对应多维数组的字符的数量被扰乱因子所扰乱),根据调整后的字符的数量选择对应的多维数组。可选地,扰乱因子的选择与所述字符串有关,例如,选择所述字符串中的第一个字符,根据所述第一个字符的内容确定所使用的第一扰乱因子,其中,所述第一扰乱因子为多个。
[0022]作为另一个可选的本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于多组数据排列保证脱敏确定性的方法,其特征在于,包括:获取待脱敏的数据,其中,所述待脱敏的数据为字符串;根据所述字符串中的每个字符在该字符串中的位置获取每个字符在多维数组中对应的元素,其中,所述多维数组中的对应的元素用于指示字符映射关系,所述字符映射关系用于将所述字符串中的字符映射为另一个不同的字符;根据所述每个字符对应的元素得到所述每个字符对应的映射关系;根据所述映射关系对每个字符进行替换,以对所述待脱敏的数据进行脱敏。2.根据权利要求1所述的方法,其特征在于,在获取所述待脱敏的数据之前,还包括:预先配置所述多维数组中的每个元素与字符串中字符所在位置的对应关系。3.根据权利要求2所述的方法,其特征在于,按照字符串中的字符的位置倒序或者顺序的方式建立与所述多维数组中的每个元素的对应关系。4.根据权利要求1至3中任一项所述的方法,其特征在于,根据所述字符串中的每个字符在该字符串中的位置获取每个字符在多维数组中对应的元素包括:在所述多维数组为多个的情况下,根据所述字符串选择所述字符串对应的多维数组;根据所述字符串中的每个字符在该字符串中的位置获取每个字符在选择出的多维数组中对应的元素。5.根据权利要求4所述的方法,其特征在于,根据所述字符串选择所述字符串对应的多维数组包括:获取所述多维数组的数量;获取所述字符串中字符的数量;根据所述字符串中字符的数量和所述多维数组的数量从多个多维数组中选择所述字符串对应的多维数组。6.一种基...

【专利技术属性】
技术研发人员:杨海峰杨保云
申请(专利权)人:北京安华金和科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1