当前位置: 首页 > 专利查询>冯长青专利>正文

一种风险规则提取方法及风险规则提取系统技术方案

技术编号:35851967 阅读:17 留言:0更新日期:2022-12-07 10:36
本发明专利技术提供的一种风险规则提取方法及风险规则提取系统,涉及风险识别技术领域。在本发明专利技术中,获取多条风险样本数据;基于风险样本数据表征的风险系数和初始变量之间的变量关联度,对多条风险样本数据进行解析处理,以在多条风险样本数据包括的第一数量个初始变量中确定出对应的第二数量个目标变量,其中,目标变量对应的风险样本数据表征的风险系数大于或等于预先配置的第一风险系数阈值,且目标变量之间的变量关联度大于或等于预先配置的第一关联度阈值;基于第二数量个目标变量,确定出多条风险样本数据对应的目标风险规则。基于上述方法,可以改善现有技术中提取到的风险规则的可靠度不佳的问题。规则的可靠度不佳的问题。规则的可靠度不佳的问题。

【技术实现步骤摘要】
一种风险规则提取方法及风险规则提取系统


[0001]本专利技术涉及风险识别
,具体而言,涉及一种风险规则提取方法及风险规则提取系统。

技术介绍

[0002]风险检测(如贷款风险、网络数据泄露风险等)是风险管控和风险预防的基础,因此,需要准确的确定风险规则,以进行风险识别,在传统技术中,一般是工作人员基于相应的经验确定出风险规则。如此,存在耗时耗力的问题。基于此,在现有技术中,一般是基于大数据进行解析,得到其中的风险规则,但是,存在提取到的风险规则的可靠度不佳的问题。

技术实现思路

[0003]有鉴于此,本专利技术的目的在于提供一种风险规则提取方法及风险规则提取系统,以改善现有技术中提取到的风险规则的可靠度不佳的问题。
[0004]为实现上述目的,本专利技术实施例采用如下技术方案:
[0005]一种风险规则提取方法,应用于风险管控服务器,所述风险规则提取方法包括:
[0006]从通信连接的至少一个目标数据库中的每一个目标数据库,获取多条风险样本数据,其中,所述多条风险样本数据中的每一条风险样本数据包括第一数量个初始变量,每一个所述初始变量具有对应的变量具体值;
[0007]基于所述风险样本数据表征的风险系数和所述初始变量之间的变量关联度,对所述多条风险样本数据进行解析处理,以在所述多条风险样本数据包括的所述第一数量个初始变量中确定出对应的第二数量个目标变量,其中,所述第二数量个目标变量对应的风险样本数据表征的风险系数大于或等于预先配置的第一风险系数阈值,且所述第二数量个目标变量之间的变量关联度大于或等于预先配置的第一关联度阈值;
[0008]基于所述第二数量个目标变量,确定出所述多条风险样本数据对应的目标风险规则,其中,所述目标风险规则用于对目标风险数据进行识别以确定该目标风险数据是否属于所述第二数量个目标变量对应的风险事件。
[0009]在一些优选的实施例中,在上述风险规则提取方法中,所述从通信连接的至少一个目标数据库中中的每一个目标数据库,获取多条风险样本数据的步骤,包括:
[0010]从通信连接的至少一个目标数据库中的每一个目标数据库,获取多条原始风险样本数据,其中,所述多条原始风险样本数据中的每一条原始风险样本数据包括至少一个初始变量;
[0011]基于所述多条原始风险样本数据中的每一条原始风险样本数据包括的初始变量,对所述多条原始风险样本数据进行筛选,得到包括第一数量个初始变量的多条风险样本数据。
[0012]在一些优选的实施例中,在上述风险规则提取方法中,所述基于所述风险样本数据表征的风险系数和所述初始变量之间的变量关联度,对所述多条风险样本数据进行解析
处理,以在所述多条风险样本数据包括的所述第一数量个初始变量中确定出对应的第二数量个目标变量的步骤,包括:
[0013]针对所述第一数量个初始变量中的每一个初始变量,确定该初始变量的变量重要性表征值,并确定该变量重要性表征值与预先配置的第一变量重要性表征阈值之间的相对大小关系,以及,在该变量重要性表征值大于或等于所述第一变量重要性表征阈值时,将该初始变量确定为候选变量;
[0014]在所述多条风险样本数据中,基于预先配置的自动编码算法确定出风险系数大于或等于所述第一风险系数阈值的每一条目标风险样本数据,其中,每一条目标风险样本数据包括所述候选变量对应的变量具体值;
[0015]基于预先配置的关联规则算法对每一条所述目标风险样本数据进行解析处理,以确定出对应的变量关联度大于或等于所述第一关联度阈值的每一个候选变量,得到第二数量个目标变量。
[0016]在一些优选的实施例中,在上述风险规则提取方法中,所述针对所述第一数量个初始变量中的每一个初始变量,确定该初始变量的变量重要性表征值,并确定该变量重要性表征值与预先配置的第一变量重要性表征阈值之间的相对大小关系,以及,在该变量重要性表征值大于或等于所述第一变量重要性表征阈值时,将该初始变量确定为候选变量的步骤,包括:
[0017]针对所述第一数量个初始变量中的每一个初始变量,基于该初始变量在所述多条风险样本数据包括的每一条风险样本数据中对应的变量具体值,构建得到该初始变量对应的变量具体值集合,其中,每一个所述变量具体值集合包括的变量具体值的数量与所述多条风险样本数据的数量;
[0018]针对所述第一数量个初始变量中的每一个初始变量,对该初始变量对应的所述变量具体值集合包括的变量具体值进行均值计算,得到该初始变量对应的变量值均值,并基于该变量值均值对该变量具体值集合包括的变量具体值进行离散度计算,得到该初始变量对应的变量值分布离散度;
[0019]针对所述第一数量个初始变量中的每一个初始变量,基于该初始变量对应的变量值分布离散度,确定出该初始变量的变量重要性表征值,其中,所述变量重要性表征值与所述变量值分布离散度之间具有负相关关系;
[0020]针对所述第一数量个初始变量中的每一个初始变量,确定该初始变量对应的变量重要性表征值与预先配置的第一变量重要性表征阈值之间的相对大小关系,并在该变量重要性表征值大于或等于所述第一变量重要性表征阈值时,将该初始变量确定为候选变量,或者,在该变量重要性表征值小于所述第一变量重要性表征阈值时,将该初始变量确定为非候选变量。
[0021]在一些优选的实施例中,在上述风险规则提取方法中,所述针对所述第一数量个初始变量中的每一个初始变量,确定该初始变量的变量重要性表征值,并确定该变量重要性表征值与预先配置的第一变量重要性表征阈值之间的相对大小关系,以及,在该变量重要性表征值大于或等于所述第一变量重要性表征阈值时,将该初始变量确定为候选变量的步骤,包括:
[0022]针对所述第一数量个初始变量中的每一个初始变量,基于该初始变量在所述多条
风险样本数据包括的每一条风险样本数据中的对应的变量具体值,构建得到该初始变量对应的变量具体值集合,其中,每一个所述变量具体值集合包括的变量具体值的数量与所述多条风险样本数据的数量;
[0023]针对所述第一数量个初始变量中的每一个初始变量,对该初始变量对应的所述变量具体值集合包括的变量具体值进行均值计算,得到该初始变量对应的变量值均值,并基于该变量值均值对该变量具体值集合包括的变量具体值进行离散度计算,得到该初始变量对应的变量值分布离散度;
[0024]针对所述第一数量个初始变量中的每一个初始变量,对该初始变量对应的所述变量具体值集合包括的变量具体值进行聚类处理,得到该初始变量对应的至少一个聚类集合,并统计所述至少一个聚类集合的数量,得到对应的集合统计数量,以及,计算所述至少一个聚类集合中每一个聚类集合包括的集合元素的数量的数量离散度,其中,所述至少一个聚类集合中的每一个聚类集合包括至少一个变量具体值;
[0025]针对所述第一数量个初始变量中的每一个初始变量,基于该初始变量对应的变量值分布离散度、集合统计数量和数量离散度,确定出该初始变量的变量重要性表征值,其中,所述变量重要性表征值与所述本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种风险规则提取方法,其特征在于,应用于风险管控服务器,所述风险规则提取方法包括:从通信连接的至少一个目标数据库中的每一个目标数据库,获取多条风险样本数据,其中,所述多条风险样本数据中的每一条风险样本数据包括第一数量个初始变量,每一个所述初始变量具有对应的变量具体值;基于所述风险样本数据表征的风险系数和所述初始变量之间的变量关联度,对所述多条风险样本数据进行解析处理,以在所述多条风险样本数据包括的所述第一数量个初始变量中确定出对应的第二数量个目标变量,其中,所述第二数量个目标变量对应的风险样本数据表征的风险系数大于或等于预先配置的第一风险系数阈值,且所述第二数量个目标变量之间的变量关联度大于或等于预先配置的第一关联度阈值;基于所述第二数量个目标变量,确定出所述多条风险样本数据对应的目标风险规则,其中,所述目标风险规则用于对目标风险数据进行识别以确定该目标风险数据是否属于所述第二数量个目标变量对应的风险事件。2.如权利要求1所述的风险规则提取方法,其特征在于,所述从通信连接的至少一个目标数据库中中的每一个目标数据库,获取多条风险样本数据的步骤,包括:从通信连接的至少一个目标数据库中的每一个目标数据库,获取多条原始风险样本数据,其中,所述多条原始风险样本数据中的每一条原始风险样本数据包括至少一个初始变量;基于所述多条原始风险样本数据中的每一条原始风险样本数据包括的初始变量,对所述多条原始风险样本数据进行筛选,得到包括第一数量个初始变量的多条风险样本数据。3.如权利要求1所述的风险规则提取方法,其特征在于,所述基于所述风险样本数据表征的风险系数和所述初始变量之间的变量关联度,对所述多条风险样本数据进行解析处理,以在所述多条风险样本数据包括的所述第一数量个初始变量中确定出对应的第二数量个目标变量的步骤,包括:针对所述第一数量个初始变量中的每一个初始变量,确定该初始变量的变量重要性表征值,并确定该变量重要性表征值与预先配置的第一变量重要性表征阈值之间的相对大小关系,以及,在该变量重要性表征值大于或等于所述第一变量重要性表征阈值时,将该初始变量确定为候选变量;在所述多条风险样本数据中,基于预先配置的自动编码算法确定出风险系数大于或等于所述第一风险系数阈值的每一条目标风险样本数据,其中,每一条目标风险样本数据包括所述候选变量对应的变量具体值;基于预先配置的关联规则算法对每一条所述目标风险样本数据进行解析处理,以确定出对应的变量关联度大于或等于所述第一关联度阈值的每一个候选变量,得到第二数量个目标变量。4.如权利要求3所述的风险规则提取方法,其特征在于,所述针对所述第一数量个初始变量中的每一个初始变量,确定该初始变量的变量重要性表征值,并确定该变量重要性表征值与预先配置的第一变量重要性表征阈值之间的相对大小关系,以及,在该变量重要性表征值大于或等于所述第一变量重要性表征阈值时,将该初始变量确定为候选变量的步骤,包括:
针对所述第一数量个初始变量中的每一个初始变量,基于该初始变量在所述多条风险样本数据包括的每一条风险样本数据中对应的变量具体值,构建得到该初始变量对应的变量具体值集合,其中,每一个所述变量具体值集合包括的变量具体值的数量与所述多条风险样本数据的数量;针对所述第一数量个初始变量中的每一个初始变量,对该初始变量对应的所述变量具体值集合包括的变量具体值进行均值计算,得到该初始变量对应的变量值均值,并基于该变量值均值对该变量具体值集合包括的变量具体值进行离散度计算,得到该初始变量对应的变量值分布离散度;针对所述第一数量个初始变量中的每一个初始变量,基于该初始变量对应的变量值分布离散度,确定出该初始变量的变量重要性表征值,其中,所述变量重要性表征值与所述变量值分布离散度之间具有负相关关系;针对所述第一数量个初始变量中的每一个初始变量,确定该初始变量对应的变量重要性表征值与预先配置的第一变量重要性表征阈值之间的相对大小关系,并在该变量重要性表征值大于或等于所述第一变量重要性表征阈值时,将该初始变量确定为候选变量,或者,在该变量重要性表征值小于所述第一变量重要性表征阈值时,将该初始变量确定为非候选变量。5.如权利要求3所述的风险规则提取方法,其特征在于,所述针对所述第一数量个初始变量中的每一个初始变量,确定该初始变量的变量重要性表征值,并确定该变量重要性表征值与预先配置的第一变量重要性表征阈值之间的相对大小关系,以及,在该变量重要性表征值大于或等于所述第一变量重要性表征阈值时,将该初始变量确定为候选变量的步骤,包括:针对所述第一数量个初始变量中的每一个初始变量,基于该初始变量在所述多条风险样本数据包括的每一条风险样本数据中的对应的变量具体值,构建得到该初始变量对应的变量具体值集合,其中,每一个所述变量具体值集合包括的变量具体值的数量与所述多条风险样本数据的数量;针对所述第一数量个初始变量中的每一个初始变量,对该初始变量对应的所述变量具体值集合包括的变量具体值进行均值计算,得到该初始变量对应的变量值均值,并基于该变量值均值对该变量具体值集合包括的变量具体值进行离散度计算,得到该初始变量对应的变量值分布离散度;针对所述第一数量个初始变量中的每一个初始变量,对该初始变量对应的所述变量具体值集合包括的变量具体值进行聚类处理,得到该初始变量对应的至少一个聚类集合,并统计所述至少一个聚类集合的数量,得到对应的集合统计数量,以及,计算所述至少一个聚类集合中每一个聚类集合包括的集合元素的数量的数量离散度,其中,所述至少一个聚类集合中的每一个聚类集...

【专利技术属性】
技术研发人员:冯长青白程肖勇刘佳钰胡建梅
申请(专利权)人:冯长青
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1