System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本申请涉及大数据领域,尤其涉及一种基于索引映射的数据脱敏方法、装置、设备和存储介质。
技术介绍
1、随着信息技术的不断进步,大数据已经演变成为现代社会的核心资源。通过分布式存储和强大的计算能力,大数据系统能够实现对海量数据的快速处理和精确分析,为众多行业提供坚实的决策支持。
2、然而,随着数据量的不断攀升,大数据处理也面临着前所未有的挑战,尤其是数据的安全性和隐私保护问题。特别是在大数据的广泛应用中,人员信息数据的安全问题尤为突出。由于这些系统经常涉及个人的敏感信息,如身份信息、联系方式等,这些数据的泄露或被滥用将对个人隐私和社会安全构成严重威胁。
3、因此,当前亟须需要解决的是如何在大数据处理过程中对个人敏感信息进行有效的脱敏保护。
技术实现思路
1、本申请提供一种基于索引映射的数据脱敏方法、装置、设备和存储介质,用以解决在大数据处理过程中无法对个人敏感信息进行有效的脱敏保护的问题。
2、第一方面,本申请提供一种基于索引映射的数据脱敏方法,该方法包括:
3、获取待脱敏的用户数据,并根据所述用户数据,对历史数据字典集进行查找处理,得到多个候选数据索引,所述历史数据字典集中至少存在一个子历史数据字典;
4、采用脱敏算法对每个候选数据索引进行映射处理,得到多个目标数据索引;
5、根据每个目标数据索引,对所述历史数据字典集进行查询处理查找处理,得到多个目标索引内容;
6、对每个目标索引内容进行融合处理,得
7、可选的,所述用户数据包括:第一用户信息以及第二用户信息,所述根据所述用户数据,对历史数据字典集进行查找处理,得到多个候选数据索引,包括:
8、对所述第一用户信息进行分词处理,得到第一参数和第二参数,并对所述第二用户信息进行分解处理,得到目标数字集合,所述目标数字集合中至少存在一个数字内容;
9、根据所述第一参数、所述第二参数和所述目标数字集合,对所述历史数据字典集进行查找处理,得到所述多个候选数据索引。
10、可选的,所述历史数据字典集包括:第一子历史数据字典、第二子历史数据字典和第三子历史数据字典,所述根据所述第一参数、所述第二参数和所述目标数字集合,对所述历史数据字典集进行查找处理,得到所述多个候选数据索引,包括:
11、根据所述第一参数,对所述第一子历史数据字典进行查找处理,得到与所述第一参数对应的候选数据索引;
12、和或;
13、根据所述第二参数,对所述第二子历史数据字典进行查找处理,得到与所述第二参数对应的候选数据索引;
14、和或;
15、根据所述目标数字集合,对所述第三子历史数据字典进行查找处理,得到与所述第三参数对应的候选数据索引。
16、可选的,所述第一子历史数据字典包括:多个历史索引、以及每个历史索引对应历史参数,所述根据所述第一参数,对所述第一子历史数据字典进行查找处理,得到与所述第一参数对应的候选数据索引,包括:
17、根据所述第一参数,对所述多个历史参数进行查找处理,得到目标查询结果;
18、判断所述目标查询结果是否满足预设条件;
19、若是,则将所述目标查询结果对应的历史索引确定为所述候选数据索引。
20、可选的,所述脱敏算法包括:数据字典空间、以及所述数据字典空间的映射处理规则,所述采用脱敏算法对每个候选数据索引进行映射处理,得到多个目标数据索引,包括:
21、将所述每个候选数据索引依次映射至所述数据字典空间;
22、根据所述映射处理规则,对所述每个候选数据索引进行映射处理,得到多个空间数据索引;
23、对每个空间数据索引进行输出处理,得到所述多个目标数据索引。
24、可选的,所述获取待脱敏的用户数据之前,所述方法还包括:
25、获取用户信息表,所述用户信息表包括:多条历史用户数据、每条历史用户数据对应的历史索引;
26、对所述每条历史用户数据进行筛选处理,得到多个第一历史用户信息和第二历史用户信息;
27、对所述多个第一历史用户信息进行分词处理,得到多个第一历史参数和第二历史参数;
28、根据所述多个历史索引、所述多个第一历史参数、所述第二历史参数以及所述多个第二历史用户信息,构建并存储第一子历史数据字典、第二历史数据字典和第三子历史数据字典。
29、可选的,所述根据所述多个历史索引、所述多个第一历史参数、所述第二历史参数以及所述多个第二历史用户信息,构建并存储第一子历史数据字典、第二历史数据字典和第三子历史数据字典,包括:
30、根据所述多个历史索引以及每个历史索引对应的第一历史参数,构建并存储所述第一子历史数据字典;
31、和或;
32、根据所述多个历史索引以及每个历史索引对应的第二历史参数,构建并存储所述第二子历史数据字典;
33、和或;
34、根据所述多个历史索引以及每个历史索引对应的第二历史用户信息,构建并存储所述第三子历史数据字典。
35、第二方面,本申请提供一种基于索引映射的数据脱敏装置,该装置包括:
36、获取模块,用于获取待脱敏的用户数据,并根据所述用户数据,对历史数据字典集进行查找处理,得到多个候选数据索引,所述历史数据字典集中至少存在一个子历史数据字典;
37、处理模块,用于采用脱敏算法对每个候选数据索引进行映射处理,得到多个目标数据索引;
38、所述处理模块,还用于用于根据每个目标数据索引,对所述历史数据字典集进行查询处理查找处理,得到多个目标索引内容;
39、所述处理模块,还用于对每个目标索引内容进行融合处理,得到目标脱敏数据。
40、可选的,所述处理模块,还用于对所述第一用户信息进行分词处理,得到第一参数和第二参数,并对所述第二用户信息进行分解处理,得到目标数字集合,所述目标数字集合中至少存在一个数字内容;
41、所述处理模块,还用于根据所述第一参数、所述第二参数和所述目标数字集合,对所述历史数据字典集进行查找处理,得到所述多个候选数据索引。
42、可选的,所述处理模块,还用于根据所述第一参数,对所述第一子历史数据字典进行查找处理,得到与所述第一参数对应的候选数据索引;
43、和或;
44、所述处理模块,还用于根据所述第二参数,对所述第二子历史数据字典进行查找处理,得到与所述第二参数对应的候选数据索引;
45、和或;
46、所述处理模块,还用于根据所述目标数字集合,对所述第三子历史数据字典进行查找处理,得到与所述第三参数对应的候选数据索引。
47、可选的,所述处理模块,还用于根据所述第一参数,对所述多个历史参数进行查找处理,得到目标查询结果;
48、所述装本文档来自技高网...
【技术保护点】
1.一种基于索引映射的数据脱敏方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述用户数据包括:第一用户信息以及第二用户信息,所述根据所述用户数据,对历史数据字典集进行查找处理,得到多个候选数据索引,包括:
3.根据权利要求2所述的方法,其特征在于,所述历史数据字典集包括:第一子历史数据字典、第二子历史数据字典和第三子历史数据字典,所述根据所述第一参数、所述第二参数和所述目标数字集合,对所述历史数据字典集进行查找处理,得到所述多个候选数据索引,包括:
4.根据权利要求3所述的方法,其特征在于,所述第一子历史数据字典包括:多个历史索引、以及每个历史索引对应历史参数,所述根据所述第一参数,对所述第一子历史数据字典进行查找处理,得到与所述第一参数对应的候选数据索引,包括:
5.根据权利要求1所述的方法,其特征在于,所述脱敏算法包括:数据字典空间、以及所述数据字典空间的映射处理规则,所述采用脱敏算法对每个候选数据索引进行映射处理,得到多个目标数据索引,包括:
6.根据权利要求1所述的方法,其特征在于,
7.根据权利要求6所述的方法,其特征在于,所述根据所述多个历史索引、所述多个第一历史参数、所述第二历史参数以及所述多个第二历史用户信息,构建并存储第一子历史数据字典、第二历史数据字典和第三子历史数据字典,包括:
8.一种基于索引映射的数据脱敏装置,其特征在于,包括:
9.一种基于索引映射的数据脱敏设备,其特征在于,包括:
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机执行指令,所述计算机执行指令被处理器执行时用于实现如权利要求1-7任一项所述的基于索引映射的数据脱敏方法。
...【技术特征摘要】
1.一种基于索引映射的数据脱敏方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述用户数据包括:第一用户信息以及第二用户信息,所述根据所述用户数据,对历史数据字典集进行查找处理,得到多个候选数据索引,包括:
3.根据权利要求2所述的方法,其特征在于,所述历史数据字典集包括:第一子历史数据字典、第二子历史数据字典和第三子历史数据字典,所述根据所述第一参数、所述第二参数和所述目标数字集合,对所述历史数据字典集进行查找处理,得到所述多个候选数据索引,包括:
4.根据权利要求3所述的方法,其特征在于,所述第一子历史数据字典包括:多个历史索引、以及每个历史索引对应历史参数,所述根据所述第一参数,对所述第一子历史数据字典进行查找处理,得到与所述第一参数对应的候选数据索引,包括:
5.根据权利要求1所述的方法,其特征在于,所述脱...
【专利技术属性】
技术研发人员:徐锐,孙妍,黄继涛,李旻容,肖难,张欢,张广友,王净雨,
申请(专利权)人:中国联合网络通信集团有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。