【技术实现步骤摘要】
规则模型的安全性的确定方法、装置和服务器
本说明书属于互联网
,尤其涉及规则模型的安全性的确定方法、装置和服务器。
技术介绍
在一些数据处理场景中,模型生成方与数据提供方往往是分离的。通常数据提供方可以响应模型生成方的请求,利用己方所拥有的数据资源,运行模型生成方提供的规则模型,得到相应的处理结果;再将上述处理结果反馈给模型生成方。这样模型生成方可以在不接触到数据提供方所拥有的数据资源的前提下,得到相应的处理结果;并可以根据上述处理结果进行具体的数据处理。但是,如果上述规则模型本身不安全,那么数据提供方在运行规则模型的过程中,可能会泄露出数据提供方所拥有的数据资源。因此,亟需一种能够较为有效、准确地确定规则模型的安全性的方法。
技术实现思路
本说明书实施例提供了一种规则模型的安全性的确定方法、装置和服务器,以便能够有效、准确地确定出规则模型的安全性,降低数据提供方由于运行不安全的规则模型导致数据发生泄露的风险。本说明书提供的规则模型的安全性的确定方法、装置和服务器是这 ...
【技术保护点】
1.一种规则模型的安全性的确定方法,包括:/n获取规则模型和样本集;其中,所述规则模型包括规则集,所述规则集包含有目标属性,所述样本集包括多个样本数据;/n根据所述规则模型和所述样本集,确定出多种命中情况下的目标属性的数据值分布;/n根据所述多种命中情况下的目标属性的数据值分布,和预设的安全阈值,确定所述规则模型是否存在安全性风险。/n
【技术特征摘要】
1.一种规则模型的安全性的确定方法,包括:
获取规则模型和样本集;其中,所述规则模型包括规则集,所述规则集包含有目标属性,所述样本集包括多个样本数据;
根据所述规则模型和所述样本集,确定出多种命中情况下的目标属性的数据值分布;
根据所述多种命中情况下的目标属性的数据值分布,和预设的安全阈值,确定所述规则模型是否存在安全性风险。
2.根据权利要求1所述的方法,所述根据所述规则模型和所述样本集,确定出多种命中情况下的目标属性的数据值分布,包括:
利用所述规则模型处理所述样本集中的多个样本数据,得到多个样本数据的处理结果;其中,所述处理结果包括样本数据所命中的规则集的标识信息;
根据所述多个样本数据的处理结果,确定出样本数据所命中的规则集;
根据样本数据所命中的规则集,将所述多个样本数据划分为多种命中情况下的子样本集;
根据所述多种命中情况下的子样本集,确定出多种命中情况下的目标属性的数据值分布。
3.根据权利要求1所述的方法,所述根据所述多种命中情况下的目标属性的数据值分布,和预设的安全阈值,确定所述规则模型是否存在安全性风险,包括:
将所述多种命中情况下的目标属性的数据值分布,和预设的安全阈值分别进行比较处理,得到比较结果;其中,所述预设的安全阈值根据所述样本集确定;
根据所述比较结果,在确定所述多种命中情况下的目标属性的数据值分布中至少存在一种命中情况下的目标属性的数据值分布大于所述预设的安全阈值的情况下,确定所述规则模型存在安全性风险。
4.根据权利要求3所述的方法,在确定所述多种命中情况下的目标属性的数据值分布中至少存在一种命中情况下的目标属性的数据值分布大于所述预设的安全阈值的情况下,所述方法还包括:
将大于所述预设的安全阈值的目标属性的数据值分布所对应的命中情况确定为风险命中情况;
统计属于风险命中情况的样本数据在所述样本集中的比值,作为风险样本占比;
根据所述风险样本占比,确定所述规则模型是否存在安全性风险。
5.根据权利要求4所述的方法,所述根据所述风险样本占比,确定所述规则模型是否存在安全性风险,包括:
比较所述风险样本占比和预设的占比阈值;
在确定所述风险样本占比大于所述预设的占比阈值的情况下,确定所述规则模型存在安全性风险。
6.根据权利要求4所述的方法,所述方法还包括:
检索所述风险命中情况中命中的规则集,从所述风险命中情况中命中的规则集中确定出包含有目标属性的规则集作为风险规则集。
7.根据权利要求1所述的方法,在根据所述多种命中情况下的目标属性的数据值分布,和预设的安全阈值,确定所述规则模型是否存在安...
【专利技术属性】
技术研发人员:张文彬,李漓春,殷山,李翰林,
申请(专利权)人:支付宝杭州信息技术有限公司,
类型:发明
国别省市:浙江;33
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。