数据脱敏方法、装置、计算机设备和存储介质制造方法及图纸

技术编号:38253500 阅读:11 留言:0更新日期:2023-07-27 10:18
本申请涉及一种数据脱敏方法、装置、计算机设备和存储介质,涉及数据处理技术领域。所述方法包括:根据待处理数据的数据类型和敏感度,从候选敏感数据簇中确定待处理数据所属的目标敏感数据簇;若待处理数据与目标敏感数据簇的簇中心的距离满足预设阈值,则确定待处理数据为敏感数据;进而采用目标敏感数据簇对应的脱敏规则,对待处理数据进行脱敏处理,得到待处理数据对应的目标脱敏数据。采用本方法能够贴合不同领域的待处理数据的数据特性,有效保证了数据脱敏处理的质量。保证了数据脱敏处理的质量。保证了数据脱敏处理的质量。

【技术实现步骤摘要】
数据脱敏方法、装置、计算机设备和存储介质


[0001]本申请涉及数据处理
,特别是涉及一种数据脱敏方法、装置、计算机设备和存储介质。

技术介绍

[0002]随着信息技术和大数据的快速发展,电力行业中的业务量迅速增加,业务种类也日益复杂,使得电力行业的能源工业系统中积累了大量的敏感数据。针对这些敏感数据,如果管理不当出现数据泄露,就会给电力行业带来非常大的经济损失和社会负面影响,因此需要对能源工业系统中的敏感数据进行统一脱敏处理。
[0003]目前一般通过脚本方式对敏感数据进行变形和漂白,从而达到脱敏处理的效果。然而,能源工业系统中的敏感数据往往涉及众多领域,采用这种统一的脚本方式对敏感数据进行脱敏处理容易产生遗漏,并且不合适的脚本方式还会造成脱敏处理后的数据质量降低,给后期管理脱敏数据带来较大困难。

技术实现思路

[0004]基于此,有必要针对上述技术问题,提供一种能够贴合不同领域的敏感数据的数据特性的数据脱敏方法、装置、计算机设备和存储介质。
[0005]第一方面,本申请提供了一种数据脱敏方法,该方法包括:
[0006]根据待处理数据的数据类型和敏感度,从候选敏感数据簇中确定待处理数据所属的目标敏感数据簇;
[0007]若待处理数据与目标敏感数据簇的簇中心的距离满足预设阈值,则确定待处理数据为敏感数据;
[0008]采用目标敏感数据簇对应的脱敏规则,对待处理数据进行脱敏处理,得到待处理数据对应的目标脱敏数据。
[0009]在其中一个实施例中,该方法还包括:
[0010]根据待处理数据的数据结构,将待处理数据划分为至少两个数据字段;
[0011]根据各数据字段的敏感度,确定待处理数据的敏感度。
[0012]在其中一个实施例中,根据各数据字段的敏感度,确定待处理数据的敏感度,包括:
[0013]根据各数据字段之间的关联程度,对各数据字段进行权重赋值,得到各数据字段的权重值;
[0014]采用各数据字段的权重值,对各数据字段的敏感度进行加权,并将加权得到的各数据字段的敏感度的加权平均值,作为待处理数据的敏感度。
[0015]在其中一个实施例中,根据待处理数据的数据类型和敏感度,从候选敏感数据簇中确定待处理数据所属的目标敏感数据簇,包括:
[0016]将候选敏感数据簇中,与待处理数据的数据类型相同的敏感数据簇,作为备用敏
感数据簇;
[0017]根据待处理数据的敏感度,确定待处理数据与各备用敏感数据簇的簇中心的距离;
[0018]根据待处理数据与各备用敏感数据簇的簇中心的距离,从各备用敏感数据簇中确定待处理数据所属的目标敏感数据簇。
[0019]在其中一个实施例中,采用目标敏感数据簇对应的脱敏规则,对待处理数据进行脱敏处理,得到待处理数据对应的目标脱敏数据,包括:
[0020]根据目标敏感数据簇的数据类型,确定对应的脱敏规则;其中,目标敏感数据簇的数据类型为待处理数据的数据类型的子集;
[0021]采用脱敏规则,对待处理数据进行第一次脱敏处理,得到待处理数据对应的初始脱敏数据;其中,初始脱敏数据与待处理数据的数据结构相同;
[0022]对初始脱敏数据进行第二次脱敏处理,得到待处理数据对应的目标脱敏数据。
[0023]在其中一个实施例中,该方法还包括:
[0024]从样本数据集中随机选取目标数量的样本数据,并将所选取的样本数据作为初始的簇中心,并确定各初始的簇中心的敏感度;
[0025]根据样本数据集中每一样本数据的敏感度,以及各初始的簇中心的敏感度,确定每一样本数据与各初始的簇中心的距离;
[0026]根据每一样本数据与各初始的簇中心的距离,将样本数据集划分为目标数量的初始敏感数据簇;
[0027]判断初始敏感数据簇中所包含的样本数据的敏感度的均值,是否等于初始敏感数据簇对应的初始的簇中心的敏感度;
[0028]若否,则根据初始敏感数据簇中所包含的样本数据,对初始敏感数据簇对应的初始的簇中心进行更新,得到新的簇中心,并将初始敏感数据簇中所包含的样本数据的敏感度的均值,作为新的簇中心的敏感度,返回执行根据样本数据集中每一样本数据的敏感度,以及各初始的簇中心的敏感度,确定每一样本数据与各初始的簇中心的距离的操作;
[0029]若是,则将初始敏感数据簇作为候选敏感数据簇。
[0030]第二方面,本申请还提供了一种数据脱敏装置,该装置包括:
[0031]第一确定模块,用于根据待处理数据的数据类型和敏感度,从候选敏感数据簇中确定待处理数据所属的目标敏感数据簇;
[0032]第二确定模块,用于若待处理数据与目标敏感数据簇的簇中心的距离满足预设阈值,则确定待处理数据为敏感数据;
[0033]脱敏处理模块,用于采用目标敏感数据簇对应的脱敏规则,对待处理数据进行脱敏处理,得到待处理数据对应的目标脱敏数据。
[0034]第三方面,本申请还提供了一种计算机设备,所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
[0035]根据待处理数据的数据类型和敏感度,从候选敏感数据簇中确定待处理数据所属的目标敏感数据簇;
[0036]若待处理数据与目标敏感数据簇的簇中心的距离满足预设阈值,则确定待处理数据为敏感数据;
[0037]采用目标敏感数据簇对应的脱敏规则,对待处理数据进行脱敏处理,得到待处理数据对应的目标脱敏数据。
[0038]第四方面,本申请还提供了一种计算机可读存储介质,所述计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
[0039]根据待处理数据的数据类型和敏感度,从候选敏感数据簇中确定待处理数据所属的目标敏感数据簇;
[0040]若待处理数据与目标敏感数据簇的簇中心的距离满足预设阈值,则确定待处理数据为敏感数据;
[0041]采用目标敏感数据簇对应的脱敏规则,对待处理数据进行脱敏处理,得到待处理数据对应的目标脱敏数据。
[0042]第五方面,本申请还提供了一种计算机程序产品,所述计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现以下步骤:
[0043]根据待处理数据的数据类型和敏感度,从候选敏感数据簇中确定待处理数据所属的目标敏感数据簇;
[0044]若待处理数据与目标敏感数据簇的簇中心的距离满足预设阈值,则确定待处理数据为敏感数据;
[0045]采用目标敏感数据簇对应的脱敏规则,对待处理数据进行脱敏处理,得到待处理数据对应的目标脱敏数据。
[0046]上述数据脱敏方法、装置、计算机设备和存储介质,根据待处理数据的数据类型和敏感度,从候选敏感数据簇中确定待处理数据所属的目标敏感数据簇;然后以待处理数据与目标敏感数据簇的簇中心的距离是否满足预设阈值为判断条件,判断待处理数据是否为敏感数据;进一步的,针本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种数据脱敏方法,其特征在于,所述方法包括:根据待处理数据的数据类型和敏感度,从候选敏感数据簇中确定所述待处理数据所属的目标敏感数据簇;若所述待处理数据与所述目标敏感数据簇的簇中心的距离满足预设阈值,则确定所述待处理数据为敏感数据;采用所述目标敏感数据簇对应的脱敏规则,对所述待处理数据进行脱敏处理,得到所述待处理数据对应的目标脱敏数据。2.根据权利要求1所述的方法,其特征在于,所述方法还包括:根据待处理数据的数据结构,将所述待处理数据划分为至少两个数据字段;根据各数据字段的敏感度,确定所述待处理数据的敏感度。3.根据权利要求2所述的方法,其特征在于,所述根据各数据字段的敏感度,确定所述待处理数据的敏感度,包括:根据各数据字段之间的关联程度,对各数据字段进行权重赋值,得到各数据字段的权重值;采用各数据字段的权重值,对各数据字段的敏感度进行加权,并将加权得到的各数据字段的敏感度的加权平均值,作为所述待处理数据的敏感度。4.根据权利要求1所述的方法,其特征在于,所述根据待处理数据的数据类型和敏感度,从候选敏感数据簇中确定所述待处理数据所属的目标敏感数据簇,包括:将候选敏感数据簇中,与待处理数据的数据类型相同的敏感数据簇,作为备用敏感数据簇;根据所述待处理数据的敏感度,确定所述待处理数据与各备用敏感数据簇的簇中心的距离;根据所述待处理数据与各备用敏感数据簇的簇中心的距离,从各备用敏感数据簇中确定所述待处理数据所属的目标敏感数据簇。5.根据权利要求1所述的方法,其特征在于,所述采用所述目标敏感数据簇对应的脱敏规则,对所述待处理数据进行脱敏处理,得到所述待处理数据对应的目标脱敏数据,包括:根据所述目标敏感数据簇的数据类型,确定对应的脱敏规则;其中,所述目标敏感数据簇的数据类型为所述待处理数据的数据类型的子集;采用所述脱敏规则,对所述待处理数据进行第一次脱敏处理,得到所述待处理数据对应的初始脱敏数据;其中,所述初始脱敏数据与所述待处理数据的数据结构相同;对所述初始脱敏数据进行第二次脱敏处理,得到所...

【专利技术属性】
技术研发人员:王程斯李清黄安子史纪李智诚闫梦秋
申请(专利权)人:深圳供电局有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1