一种数据脱敏时的效果评估方法技术

技术编号:33147052 阅读:31 留言:0更新日期:2022-04-22 13:59
本发明专利技术公开一种数据脱敏时的效果评估方法,包括步骤一、根据脱敏算法的性能进行脱敏效果分析,步骤二、不同脱敏算法潜在的攻击风险的计算,步骤三、动态选择适应不同场景的脱敏算法,步骤四、根据脱敏算法的属性综合评估脱敏效果,步骤五、脱敏算法的制定及效果最终评估;本发明专利技术通过对隐私推理攻击及联合多敏感属性推理攻击进行检测分析作为脱敏算法的安全评估指标,保证了敏感数据的有效脱敏,采用决策树机器学习算法对不同应用场景进行脱敏算法选择及评估,同时依据脱敏后的性能指标对脱敏算法隐私泄露风险进行综合评估,可以辅助用户实现脱敏策略制定,检测脱敏效果。检测脱敏效果。检测脱敏效果。

【技术实现步骤摘要】
一种数据脱敏时的效果评估方法


[0001]本专利技术涉及数据脱敏算法
,尤其涉及一种数据脱敏时的效果评估方法。

技术介绍

[0002]在数字经济时代,数据安全与国家安全、经济运行安全、公共社会安全、以及个人合法权益直接的关联日趋紧密,大量非结构化数据处理技术给数字经济带来便利的同时,其面临的安全威胁也日益严重,数据泄露和隐私问题不断涌现,已经成为制约数字经济发展的关键因素之一,可靠的隐私数据保护技术、隐私保护安全检测技术的研究对建立可靠数据安全体系具有至关重要的作用,已成为数字经济健康、稳定发展的重要环节,数据脱敏算法是隐私数据保护的主要技术手段之一,得到了国内外的广泛研究与应用;
[0003]目前已有不少数据脱敏方法相关的工作,但对数据脱敏算法的评估及检测方面的工作非常少,无法对脱敏算法进行有效评估检测,无法针对不同场景选择合适的脱敏算法,依旧会造成隐私数据的泄露,因此,本专利技术提出一种数据脱敏时的效果评估方法以解决现有技术中存在的问题。

技术实现思路

[0004]针对上述问题,本专利技术的目的在于提出一种数据脱敏时的效果评估方法,该数据脱敏时的效果评估方法通过对隐私推理攻击及联合多敏感属性推理攻击进行检测分析作为脱敏算法的安全评估指标,保证了敏感数据的有效脱敏,采用决策树机器学习算法对不同应用场景进行脱敏算法选择及评估,同时依据脱敏后的性能指标对脱敏算法隐私泄露风险进行综合评估,可以辅助用户实现脱敏策略制定,检测脱敏效果。
[0005]为实现本专利技术的目的,本专利技术通过以下技术方案实现:一种数据脱敏时的效果评估方法,包括以下步骤:
[0006]步骤一、从脱敏算法的隐私保护程度、信息损失度和算法强度三个性能对脱敏算法的脱敏效果进行分析;
[0007]步骤二、在数据脱敏中对多种假设条件下的隐私推理攻击及联合多敏感属性推理攻击进行检测并提取特征,计算得到不同的脱敏算法潜在的攻击风险;
[0008]步骤三、通过动态分析脱敏规则,并根据步骤二中攻击方式的攻击风险动态选择适应不同场景的脱敏算法;
[0009]步骤四、通过分析脱敏一致性、脱敏可扩展性和敏感数据自动分类三种属性对步骤三中选择的脱敏算法的脱敏效果进行综合评估;
[0010]步骤五、在脱敏算法的权限判决、数据分类、敏感级值设定、脱敏算法选择和脱敏效果评估的环节采用决策树机器学习方法,制定脱敏算法策略,检测并获得脱敏效果最终评估结果。
[0011]进一步改进在于:所述步骤一中隐私保护程度通过安全屋模式及有限数据集模式、聚类性算法和敏感信息保护三个层次来衡量性能;信息损失度分析通过基于勾陈匿名
组的大小、基于一般值的特征度量和评价关联误差三个方面进行性能分析;所述算法强度通过脱敏速度、准确度和计算负载三个方面进行性能评估。
[0012]进一步改进在于:所述步骤一中信息损失度分析采用归一化平均类大小来估计预先规定任务信息损失度。
[0013]进一步改进在于:所述步骤二中隐私推理攻击检测是通过动态选择k

匿名、l

多样性、t接近、(α,k)

匿名、(X,Y)

匿名、m

invariance和基于图的m

invariance七种匿名模型,建立模型抵御攻击能力矩阵,并选择合适的模型提高脱敏算法抵御攻击的能力。
[0014]进一步改进在于:所述步骤三中动态选择方法包括以下步骤
[0015]S1、先根据脱敏规则,通过分析敏感字段与规则库对脱敏请求进行重构;
[0016]S2、再根据纯数字、纯字母及数字字母混合三种不同类型数据的脱敏请求建立多模块脱敏算法;
[0017]S3、最后通过动态分析脱敏请求,根据潜在的攻击风险类型并结合多模块脱敏算法选择合适的脱敏算法。
[0018]进一步改进在于:所述步骤四中还利用了多种格式转换技术进行综合评估,多种格式转换技术具体是通过替换、混淆算法,选择预定义的脱敏算法,生成特定的支持常见文件格式的数据转换器对数据格式进行转换。
[0019]进一步改进在于:所述步骤五中具体从脱敏需求的百分占比、脱敏方案的扩展性、脱敏算法的实现成本和脱敏算法运行及维护的操作四个方面进行评估。
[0020]进一步改进在于:所述脱敏算法的实现成本包括算法复杂性、通讯负载、测试成本及可维护性进行综合评判。
[0021]本专利技术的有益效果为:本专利技术通过对隐私推理攻击及联合多敏感属性推理攻击进行检测分析作为脱敏算法的安全评估指标,保证了敏感数据的有效脱敏,采用决策树机器学习算法对不同应用场景进行脱敏算法选择及评估,同时依据脱敏后的性能指标对脱敏算法隐私泄露风险进行综合评估,可以辅助用户实现脱敏策略制定,检测脱敏效果。
附图说明
[0022]图1为本专利技术总体框架图。
[0023]图2为本专利技术脱敏算法流程图。
[0024]图3为本专利技术脱敏算法性能评估流程图。
[0025]图4为本专利技术脱敏算法动态配置及参数优化流程图。
[0026]图5为本专利技术脱敏数据的隐私性能评估流程图。
[0027]图6为本专利技术脱敏算法总体性能评价流程图。
具体实施方式
[0028]为了加深对本专利技术的理解,下面将结合实施例对本专利技术做进一步详述,本实施例仅用于解释本专利技术,并不构成对本专利技术保护范围的限定。
[0029]实施例一
[0030]根据图1、2、3、4、5、6所示,本实施例提供了一种数据脱敏时的效果评估方法,包括以下步骤:
[0031]步骤一、从脱敏算法的隐私保护程度、信息损失度和算法强度三个性能对脱敏算法的脱敏效果进行分析;
[0032]其中隐私保护程度通过安全屋模式及有限数据集模式、聚类性算法和敏感信息保护三个层次来衡量性能;
[0033]信息损失度分析通过基于勾陈匿名组的大小、基于一般值的特征度量和评价关联误差三个方面进行性能分析,采用归一化平均类大小来估计预先规定任务信息损失度;
[0034]所述算法强度通过脱敏速度、准确度和计算负载三个方面进行性能评估;
[0035]步骤二、在数据脱敏中对多种假设条件下的隐私推理攻击及联合多敏感属性推理攻击进行检测并提取特征,计算得到不同的脱敏算法潜在的攻击风险;
[0036]其中隐私推理攻击检测是通过动态选择k

匿名、l

多样性、t接近、(α,k)

匿名、(X,Y)

匿名、m

invariance和基于图的m

invariance七种匿名模型,建立模型抵御攻击能力矩阵,并选择合适的模型提高脱敏算法抵御攻击的能力
[0037]步骤三、通过动态分析脱敏规则,并根据步骤二中攻击方式的攻击风险动态选择适应不同场景的脱敏算法;
[0038]动态选择方法包括以下步骤...

【技术保护点】

【技术特征摘要】
1.一种数据脱敏时的效果评估方法,其特征在于包括以下步骤:步骤一、从脱敏算法的隐私保护程度、信息损失度和算法强度三个性能对脱敏算法的脱敏效果进行分析;步骤二、在数据脱敏中对多种假设条件下的隐私推理攻击及联合多敏感属性推理攻击进行检测并提取特征,计算得到不同的脱敏算法潜在的攻击风险;步骤三、通过动态分析脱敏规则,并根据步骤二中攻击方式的攻击风险动态选择适应不同场景的脱敏算法;步骤四、通过分析脱敏一致性、脱敏可扩展性和敏感数据自动分类三种属性对步骤三中选择的脱敏算法的脱敏效果进行综合评估;步骤五、在脱敏算法的权限判决、数据分类、敏感级值设定、脱敏算法选择和脱敏效果评估的环节采用决策树机器学习方法,制定脱敏算法策略,检测并获得脱敏效果最终评估结果。2.根据权利要求1所述的一种数据脱敏时的效果评估方法,其特征在于:所述步骤一中隐私保护程度通过安全屋模式及有限数据集模式、聚类性算法和敏感信息保护三个层次来衡量性能;信息损失度分析通过基于勾陈匿名组的大小、基于一般值的特征度量和评价关联误差三个方面进行性能分析;所述算法强度通过脱敏速度、准确度和计算负载三个方面进行性能评估。3.根据权利要求1所述的一种数据脱敏时的效果评估方法,其特征在于:所述步骤一中信息损失度分析采用归一化平均类大小来估计预先规定任务信息损失度。4.根据权利要求1所述的一种数据脱敏时的效果评估方法,其特征在于:所述步骤二中隐私推理攻击检测是通过动态选择k

匿名、l...

【专利技术属性】
技术研发人员:佟鑫谢丰都婧
申请(专利权)人:电子科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1