规则模型的安全性的确定方法、装置制造方法及图纸

技术编号:27099042 阅读:19 留言:0更新日期:2021-01-25 18:40
本说明书提供了规则模型的安全性的确定方法、装置。基于上述方法,获取包括规则集的规则模型;其中,所述规则集包括由多个变量中的部分或全部形成的多个表达式;分别计算每个变量的实际值能被猜中的第一概率;基于所述第一概率筛选符合预设条件的目标变量;结合变量之间的联合分布,得出所述目标变量的实际值能被猜中的第二概率;根据所述第二概率与相应的预设阈值,确定所述规则模型的安全性。降低数据提供方由于运行不安全的规则模型导致数据发生泄露的风险。生泄露的风险。生泄露的风险。

【技术实现步骤摘要】
规则模型的安全性的确定方法、装置


[0001]本说明书属于互联网
,尤其涉及规则模型的安全性的确定方法、装置。

技术介绍

[0002]在一些数据处理场景中,模型生成方与数据提供方往往是分离的。
[0003]通常数据提供方可以响应模型生成方的请求,利用己方所拥有的数据资源,运行模型生成方提供的规则模型,得到相应的处理结果;再将上述处理结果反馈给模型生成方。这样模型生成方可以在不接触到数据提供方所拥有的数据资源的前提下,得到相应的处理结果;并可以根据上述处理结果进行具体的数据处理。
[0004]但是,如果上述规则模型本身不安全,那么数据提供方在运行规则模型的过程中,可能会泄露出数据提供方所拥有的数据资源。
[0005]因此,亟需一种能够较为高效、准确地确定规则模型的安全性的方法。

技术实现思路

[0006]本说明书提供了一种规则模型的安全性的确定方法、装置和服务器,以能够高效、准确地确定出规则模型的安全性,降低数据提供方由于运行不安全的规则模型导致数据发生泄露的风险。
[0007]本说明书实施方式提供一种规则模型的安全性的确定方法,包括:获取包括规则集的规则模型;其中,所述规则集包括由多个变量中的部分或全部形成的多个表达式;分别计算每个变量的实际值能被猜中的第一概率;基于所述第一概率筛选符合预设条件的目标变量;结合变量之间的联合分布,得出所述目标变量的实际值能被猜中的第二概率;根据所述第二概率与相应的预设阈值,确定所述规则模型的安全性。
[0008]本说明书实施方式提供一种规则模型的安全性确定装置,包括:获取模块,用于获取规则集;其中,所述规则集包括由多个变量中的部分或全部形成的多个表达式;第一计算模块,用于分别计算每个变量的实际值能被猜中的第一概率;筛选模块,用于基于所述第一概率筛选符合预设条件的目标变量;第二计算模块,用于结合变量之间的联合分布,得出所述目标变量的实际值能被猜中的第二概率;确定模块,用于根据所述第二概率与相应的预设阈值,确定所述规则模型的安全性。
[0009]本说明书实施方式提供的实施方式,可以通过先根据规则模型中的规则集,计算根据规则集中表达式的设置情况,分析每个变量的实际值可能被猜中的第一概率。可以理解,第一概率取值较大的变量,也是可能会被猜实际值的变量。故此,根据第一概率筛选得出相对被猜测的概率较高的目标变量,进而,基于变量的之间的联合分布,得出目标变量的实际值能被猜中的第二概率。该第二概率可以结合实际值的分布情况,使得可以更加准确的表征目标变量的实际值被泄露的风险程度,进而结合预设阈值进行比较判断,确定是否存在较大安全风险。从而可以高效、准确地确定出规则模型的风险程度,降低数据提供方由于运行不安全的规则模型导致数据发生泄露的风险。
附图说明
[0010]为了更清楚地说明本说明书实施方式,下面将对实施方式中所需要使用的附图作简单地介绍,下面描述中的附图仅仅是本说明书中记载的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
[0011]图1是本说明书实施方式提供的一个规则模型的安全性的确定方法的应用场景示意图;图2是本说明书实施方式提供的一个规则模型的安全性的确定方法的应用场景示意图;图3是本说明书实施方式提供的一个规则模型的安全性的确定方法的流程示意图;图4是本说明书实施方式提供的一个的规则模型的安全性确定装置的示意图;图5是本说明书实施方式提供的一个的电子设备的结构示意图。
具体实施方式
[0012]为了使本
的人员更好地理解本说明书中的技术方案,下面将结合本说明书实施方式中的附图,对本说明书实施方式中的技术方案进行清楚、完整地描述,显然,所描述的实施方式仅仅是本说明书一部分实施方式,而不是全部的实施方式。基于本说明书中的实施方式,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施方式,都应当属于本说明书保护的范围。
[0013]本说明书一些实施方式提供一种规则模型的安全性的确定方法,该方法具体可以应用于包含有第一服务器、第二服务器和第三服务器的系统中。
[0014]具体可以参阅图1所示。上述第一服务器具体可以包括布设于模型生成方一侧的服务器。上述第二服务器具体可以包括布设于数据提供方一侧的服务器。上述第三服务器具体可以包括负责检测规则模型的安全性的第三方一侧的服务器。其中,上述第三方可以理解为模型生成方和数据提供方信任的负责检测规则模型的安全性的服务提供方。
[0015]具体实施时,第一服务器为了能够利用数据提供方所拥有的数据资源进行相应的数据处理(例如,确定用户的信用风险),可以配置并构建一种只包含有一个规则集的规则模型。其中,上述规则集中具体可以包括多个规则。每个规则可以包括至少一个表达式,多个表达式之间可以通过逻辑运算符(例如,“逻辑与”、“逻辑或”)连接。
[0016]第一服务器在将上述规则模型发送到第二服务器的同时,还会将规则模型发送至第三服务器进行检测,并向第三服务器发送关于规则模型的安全性的检测请求。其中,上述第三服务器拥有权限可以拆解并读取规则模型中所包含的具体规则。
[0017]第三服务器可以接收并响应检测请求,获取用于检测规则模型的变量的数据值分布,并根据上述属性的数据值分布,来检测规则模型是否存在安全性风险。其中,上述属性的数据值分布具体可以是由第二服务器提供的,也可以是由第三服务器自己生成的。
[0018]在具体检测规则模型的安全性时,第三服务器可以先将规则集进行一定的转换,形成多个规则子集。每个规则子集中可以包括一个变量。如此,实现将规则集的非常复杂的逻辑表达式,转换为若干不相同的表达式组合形成的“析取范式”。可以分别计算每个变量的实际值被猜中的第一概率。如此,基于第一概率进行筛选,得出较为容易被猜测的目标变量,通常该些变量的第一概率的取值较大。上述过程,可以模拟模型使用方在使用模型时的
过程,以及得出模拟模型使用方可能猜中的变量的实际值。进一步的,可以模拟数据源的一侧,在已知变量之间的联合分布的情况下,计算目标变量的实际值能被猜中的第二概率。第二概率可以是基于数据源的实际值计算的概率,使得第二概率可以较为准确的表示变量的实际值可能被猜中的概率。进而,可以基于第二概率确定模型的安全性。该实施方式中,通过先模拟模型使用方计算可能的猜测概率,实现利用计算得到的第一概率对变量进行筛选,针对安全性风险较大的目标变量,进一步模拟数据源计算变量的实际值能被猜中的第二概率。由于,第二概率可以基于变量的实际值和变量的联合分布计算,使得其可以表示变量的实际值被猜中的实际概率。
[0019]在确定上述规则模型安全性风险较低的情况下,第三服务器可以生成并向第二服务器发送安全提示信息。第二服务器在接收到上述安全提示信息后,才可以正常地利用己方所拥有的数据资源运行该规则模型,得到对应的处理结果;再将上述处理结果反馈给第一服务器。第一服务器可以根据上述处理结果,完成相应的数据处本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种规则模型的安全性的确定方法,所述规则模型包括规则集;所述方法包括:获取包括规则集的规则模型;其中,所述规则集包括由多个变量中的部分或全部形成的多个表达式;分别计算每个变量的实际值能被猜中的第一概率;基于所述第一概率筛选符合预设条件的目标变量;结合变量之间的联合分布,得出所述目标变量的实际值能被猜中的第二概率;根据所述第二概率与相应的预设阈值,确定所述规则模型的安全性。2.根据权利要求1所述的方法,分别计算每个变量的实际值能被猜中的第一概率,包括:计算在所述变量所归属的规则集被命中的情况下,所述变量的实际值能被猜中的第一概率。3.根据权利要求2所述的方法,在计算在所述变量所归属的规则集被命中的情况下,所述变量的实际值能被猜中的第一概率的步骤中,包括:将规则集划分多个分别与变量对应的规则子集;其中,不同规则子集包括的变量不同;计算规则集的至少一个规则子集被命中的情况下,变量对应的实际值能被猜中的第一概率。4.根据权利要求3所述的方法,在计算规则集的至少一个规则子集被命中的情况下,变量对应的实际值能被猜中的第一概率的步骤中,包括:计算规则集被命中的条件下,规则子集被命中的条件概率;根据规则子集中包括的变量表达式,得到规则子集命中的情况下,所述规则子集中变量对应的实际值能被猜中的第一猜中概率;使用所述规则子集被命中的条件概率和所述第一猜中概率得到所述第一概率。5.根据权利要求4所述的方法,在根据规则子集中包括的变量表达式,得到所述规则子集命中的情况下,所述规则子集中变量对应的实际值能被猜中的第一猜中概率的步骤中,包括:计算所述规则子集中包括的至少一个表达式被命中的情况下,所述规则子集对应的变量的实际值能被猜中的猜中概率;将所述猜中概率中的最大值或平均值,作为所述第一猜中概率。6.根据权利要求5所述的方法,计算所述规则子集中包括的至少一个表达式被命中的情况下,所述规则子集对应的变量的实际值能被猜中的猜中概率,包括:将所述规则子集包括的表达式进行排列组合,得到多种组合方式;分别计算每个组合方式被命中的情况下,对应的猜中概率。7.根据权利要求1所述的方法,分别计算每个变量的实际值能被猜中的第一概率,包括:计算在所述变量归属的规则集未被命中的情况下,所述变量的实际值能被猜中的第一概率。8.根据权利要求7所述的方法,在计算在所述变量归属的规则集未被命中的情况下,所述变量的实际值能被猜中的第一概率的步骤中,包括:将规则集划分多个分别与变量对应的规则子集;其中,不同规则子集包括的变量不同;计算规则集未被命中的条件下,所述规则子集未命中的条件概率;
根据所述规则子集中包括的变量表达式,得到所述规则子集未命中的情况下,所述规则子集中变量对应的实际值能被猜中的第二猜中...

【专利技术属性】
技术研发人员:张文彬李翰林李漓春殷山
申请(专利权)人:蚂蚁智信杭州信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1