规则模型的安全性的确定方法、装置和数据处理方法制造方法及图纸

技术编号:26731936 阅读:20 留言:0更新日期:2020-12-15 14:35
本说明书提供了规则模型的安全性的确定方法、装置和数据处理方法。该方法通过先根据样本集,确定出目标属性的第一分布;同时利用规则模型处理上述样本集,确定出多种命中情况下的目标属性的第二分布;再根据目标属性的第一分布和多种命中情况下的目标属性的第二分布,计算出能反映多种命中情况下的目标属性的第二分布和原始的第一分布之间的差异程度的安全指示参数;再根据上述安全指示参数,确定规则模型是否存在安全性风险。从而可以通过确定并利用安全指示参数来量化多种命中情况下的目标属性的第二分布和第一分布之间的差异程度,并根据该安全指示参数作为依据较为精准地确定出规则模型是否存在安全性风险。

【技术实现步骤摘要】
规则模型的安全性的确定方法、装置和数据处理方法
本说明书属于互联网
,尤其涉及规则模型的安全性的确定方法、装置和数据处理方法。
技术介绍
在一些数据处理场景中,模型生成方与数据提供方往往是分离的。通常数据提供方可以响应模型生成方的请求,利用己方所拥有的数据资源,运行模型生成方提供的规则模型,得到相应的处理结果;再将上述处理结果反馈给模型生成方。这样模型生成方可以在不接触到数据提供方所拥有的数据资源的前提下,得到相应的处理结果;并可以根据上述处理结果进行具体的数据处理。但是,如果上述规则模型本身不安全,那么数据提供方在运行规则模型的过程中,可能会泄露出数据提供方所拥有的数据资源。
技术实现思路
本说明书提供了一种规则模型的安全性的确定方法、装置和数据处理方法,以能够较为精准地确定出规则模型是否存在安全性风险。本说明书提供的规则模型的安全性的确定方法、装置和数据处理方法是这样实现的:一种规则模型的安全性的确定方法,包括:获取规则模型和样本集;其中,所述规则模型包括规则集,所述样本集包括多个样本文档来自技高网...

【技术保护点】
1.一种规则模型的安全性的确定方法,包括:/n获取规则模型和样本集;其中,所述规则模型包括规则集,所述样本集包括多个样本数据;/n根据所述样本集,确定出目标属性的第一分布;利用所述规则模型处理所述样本集,以确定出多种命中情况下的目标属性的第二分布;/n根据所述目标属性的第一分布,和所述多种命中情况下的目标属性的第二分布,确定多种命中情况下的安全指示参数;/n根据多种命中情况下的安全指示参数,确定所述规则模型是否存在安全性风险。/n

【技术特征摘要】
1.一种规则模型的安全性的确定方法,包括:
获取规则模型和样本集;其中,所述规则模型包括规则集,所述样本集包括多个样本数据;
根据所述样本集,确定出目标属性的第一分布;利用所述规则模型处理所述样本集,以确定出多种命中情况下的目标属性的第二分布;
根据所述目标属性的第一分布,和所述多种命中情况下的目标属性的第二分布,确定多种命中情况下的安全指示参数;
根据多种命中情况下的安全指示参数,确定所述规则模型是否存在安全性风险。


2.根据权利要求1所述的方法,所述安全指示参数包括以下至少之一:信息熵差、基尼指数差、纯度差、KL散度。


3.根据权利要求2所述的方法,在所述安全指示参数包括信息熵差的情况下,所述根据所述目标属性的第一分布,和所述多种命中情况下的目标属性的第二分布,确定多种命中情况下的安全指示参数,包括:
根据所述目标属性的第一分布,计算目标属性的信息熵作为第一信息熵;
根据多种命中情况下的目标属性的第二分布,分别计算多种命中情况下的目标属性的信息熵,得到多种命中情况下的第二信息熵;
将所述第一信息熵,分别与所述多种命中情况下的第二信息熵作差,得到多个差值,作为多种命中情况下的安全指示参数。


4.根据权利要求1所述的方法,所述根据多种命中情况下的安全指示参数,确定所述规则模型是否存在安全性风险,包括:
将所述多种命中情况下的安全指示参数分别与预设的安全阈值进行比较处理;
在确定所述多种命中情况下的安全指示参数中至少有一个命中情况下的安全指示参数大于预设的安全阈值的情况下,确定所述规则模型存在安全性风险。


5.根据权利要求4所述的方法,在确定所述多种命中情况下的安全指示参数中至少有一个命中情况下的安全指示参数大于预设的安全阈值的情况下,所述方法还包括:
将安全指示参数大于预设的安全阈值的命中情况,确定为风险命中情况;
统计样本集中属于所述风险命中情况的样本数据在所述样本集中的占比,作为风险样本占比;
比较所述风险样本占比和预设的占比阈值;
在确定所述风险样本占比大于所述预设的占比阈值的情况下,确定所述规则模型存在安全性风险。


6.根据权利要求1所述的方法,所述根据所述样本集,确定出目标属性的第一分布,包括:
统计所述样本集中目标属性的各个数据值的样本数据数量;
根据所述样本集中目标属性的各个数据值的样本数据数量,确定出样本集中目标属性的各个数据值的分布,作为所述目标属性的第一分布。


7.根据权利要求1所述的方法,所述利用所述规则模型处理所述样本集,以确定出多种命中情况下的目标属性的第二分布,包括:
利用所述规则模型处理所述样本集中的多个样本数据,得到多个样本数据的处理结果;其中,所述处理结...

【专利技术属性】
技术研发人员:张文彬殷山李翰林李漓春
申请(专利权)人:支付宝杭州信息技术有限公司
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1