一种数据驱动的风控策略规则生成方法及系统技术方案

技术编号:30052001 阅读:55 留言:0更新日期:2021-09-15 10:54
本发明专利技术提供了一种数据驱动的风控策略规则生成方法及系统,对基于第一训练模型训练得到的树模型进行路径预测,记录所述路径的节点索引;根据所述树模型的特征,抽取目标节点;生成对应的抽取规则以及获取用户通过交互界面选择的下一步建模的特征;根据抽取规则以及交互结果对所述样本数据进行双层次过滤,并传输结果到第一训练模块继续进行训练;基于所述规则与特征的人机交互的输出生成串行规则组合性能报告,并用于上线部署。并用于上线部署。并用于上线部署。

【技术实现步骤摘要】
一种数据驱动的风控策略规则生成方法及系统


[0001]本专利技术属于人工智能领域,具体来说,是一种利用数据驱动的风控策略规 则生成方法及系统。

技术介绍

[0002]随着互联网金融及其应用的快速发展,海量的交易行为从线下转到线上, 银行、第三方支付平台等金融机构迫切需要对大量的交易数据进行快速、准确 的欺诈风险评估和管控。风控策略通常会包含很多种类型的规则,每个规则都 是结合产品、业务基于经验和数据分析产生出来的。所以,用于区分线上交易 中产生的针对不同场景的问题交易。风控策略规则更多地会结合用户体验和业 务来平衡损失跟业务发展的关系,不同企业应该根据自身的业务情况选择适合 的策略体系。

技术实现思路

[0003]本专利技术提供一种数据驱动的风控策略规则生成方法及系统,用以解决上述 提出的技术问题。
[0004]为实现上述目的,本专利技术提供如下技术方案:一种数据驱动的风控策略规 则生成方法,其特征在于,包括:
[0005]步骤1:对训练得到的树模型进行路径预测,并记录样本路径;
[0006]步骤2:根据所述树模型的特征,抽取样本路径上节点的规则信息,生成 数据驱动的风控策略规则,同时,获取用户交互的建模特征;
[0007]步骤3:根据所述风控策略规则以及交互结果对样本数据进行双层次过滤, 并对过滤后的数据继续进行训练;
[0008]步骤4:基于训练结果获取最新模型,生成串行规则报告并输出。
[0009]优选的,步骤1,对训练得到的树模型进行路径预测,并记录样本路径, 包括:
[0010]对样本数据进行划分,得到训练样本和测试样本;
[0011]根据所述树模型,对所述训练样本以及测试样本进行预测,估计每个样本 的路径,并记录每个样本的路径。
[0012]优选的,步骤2,根据所述树模型的特征,抽取样本路径上节点的规则信 息,生成数据驱动的风控策略规则,同时,获取用户交互的建模特征,包括:
[0013]获取所述树模型的节点,作为所述树模型的特征,筛选经过概率低于预设 概率的节点,并剔除,同时,筛选不同路径中存在的相同节点或者不同树模型 中存在的相同节点,作为冗余节点,并将剩余节点作为目标节点;
[0014]通过递归算法遍历所述树模型的每一层,判断所述目标节点是否满足提升 条件,若所述目标节点满足所述提升条件,对所述目标节点进行信息提取并保 存到信息库,更新信息库;
[0015]同时,获取满足所述提升条件的目标节点与冗余节点的一致度,并保留相 同节点
中一致度最大的冗余节点,将剩余冗余节点进行剔除,并获取一致度最 大的冗余节点的信息,保存到信息库;
[0016]否则,判断所述目标节点的兄弟节点是否满足所述提升条件,若所述兄弟 节点满足所述提升条件,将所述兄弟节点进行提取信息并保存到信息库,更新 信息库;
[0017]基于更新的信息库,生成数据驱动的风险策略规则,同时,获取用户交互 的建模特征。
[0018]优选的,步骤3,根据所述风控策略规则以及交互结果对样本数据进行双 层次过滤,并对过滤后的数据继续进行训练,包括:
[0019]基于串行的迭代规则抽取模式,对所有特征按照业务逻辑进行分组;
[0020]且利用迭代建模功能将风控策略规则激活,对样本数据进行双层次过滤, 将双层次过滤后的数据继续进行训练。
[0021]优选的,步骤5,基于训练结果获取最新模型,生成串行规则报告并输出, 包括:
[0022]当需要开发串行的评分模型时,对双层次过滤后的结果进行评分,输出相 应的串行规则报告。
[0023]优选的,步骤1,对训练得到的树模型进行路径预测之前,还包括:
[0024]判断所述样本数据是否存在残缺部分,其包括:
[0025]实时采集训练样本和测试样本的样本信息,利用主成分分析提取训练 样本的主成分和过程监测统计量数据,并基于所述训练样本提取的主成分计算 测试样本的过程监测统计量数据;
[0026]将所述训练样本的过程监测统计量数据与所述测试样本的过程监测统 计量数据进行对比判定;
[0027]当所述训练样本的过程监测统计量数据大于所述测试样本的过程监测 统计量数据时,判定所述样本数据缺失;
[0028]当所述训练样本的过程监测统计量数据不大于所述测试样本的过程监 测统计量数据时,判定所述样本数据不缺失;
[0029]否则,判定所述样本数据缺失,将所述训练样本转化为树结构,所述 树结构中具有叶节点、中间节点和根节点,其中每个叶节点对应包含一个训练 样本子数据,根节点对应包含所有训练样本数据,叶节点和根节点之间的其他 节点作为中间节点,每个中间节点对应包含自身下的所有子节点的训练样本子 数据;
[0030]设置所述树结构中每个节点的权重,建立基于树结构稀疏的故障诊断 模型;
[0031]利用树结构求解算法求解所述树结构稀疏的故障诊断模型,求得最优的估 计向量作为故障定位依据,利用所述故障定位依据进行样本数据缺失点的定 位;
[0032]根据定位的缺失点,构建基于所述样本数据的有向图;
[0033]根据所述有向图查找与缺失点的缺失数据最相似的k个顶点,并标定为相 似近邻点;
[0034]计算所述缺失点与所述相似近邻点的距离,并根据所述距离获取所述相似 近邻点对应的近邻点权重;
[0035]利用k个相似近邻点以及对应的近邻点权重进行线性重建,进行样本数据 补全。
[0036]优选的,通过递归算法遍历树模型的每一层后,还包括:
[0037]实时检测遍历所述树模型过程的时间复杂度,其包括:
[0038]对遍历所述树模型过程的时间复杂度进行预测,得到预测时间复杂度;
[0039]对所述预测时间复杂度进行预测,若预测结果与真实结果一致,判定所述 树模型合格;
[0040]否则,对所述真实结果进行判断,若所述真实结果对应的真实时间复杂度 大于预测时间复杂度,根据所述树模型的数据,构建图数据模型,所述图数据 模型的图数据结构包括若干节点、节点关系和节点内容,所述节点关系用于描 述节点与节点之间的关联关系,所述节点和所述关系分别具有各自的属性;
[0041]基于所述图数据模型生成初始拓扑图,并基于所述初始拓扑图在所述若干 节点间添加关联关系,得出完全拓扑图;
[0042]根据路径检测算法在所述完全拓扑图上选出一条回路,并标记为第一回 路,根据所述第一回路在所述完全拓扑图中依次经过的节点和路径,在所述初 始拓扑图中依次找到对应的节点和最长路径,并将所述初始拓扑图中依次找到 的对应的节点和最长路径连接起来,得到初始链路;
[0043]对所述初始链路上每个节点进行判定改进,具体如下:
[0044]若所述初始链路上的节点只有一个邻近节点,则从所述初始链路中删除所 述邻近节点以及相应路径,若所述初始链路上的节点有两个邻近节点且所述两 个邻近节点互为邻近本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种数据驱动的风控策略规则生成方法,其特征在于,包括:步骤1:对训练得到的树模型进行路径预测,并记录样本路径;步骤2:根据所述树模型的特征,抽取样本路径上节点的规则信息,生成数据驱动的风控策略规则,同时,获取用户交互的建模特征;步骤3:根据所述风控策略规则以及交互结果对样本数据进行双层次过滤,并对过滤后的数据继续进行训练;步骤4:基于训练结果获取最新模型,生成串行规则报告并输出。2.根据权利要求1所述的一种数据驱动的风控策略规则生成方法,其特征在于,步骤1,对训练得到的树模型进行路径预测,并记录样本路径,包括:对样本数据进行划分,得到训练样本和测试样本;根据所述树模型,对所述训练样本以及测试样本进行预测,估计每个样本的路径,并记录每个样本的路径。3.根据权利要求1所述的一种数据驱动的风控策略规则生成方法,其特征在于,步骤2,根据所述树模型的特征,抽取样本路径上节点的规则信息,生成数据驱动的风控策略规则,同时,获取用户交互的建模特征,包括:获取所述树模型的节点,作为所述树模型的特征,筛选经过概率低于预设概率的节点,并剔除,同时,筛选不同路径中存在的相同节点或者不同树模型中存在的相同节点,作为冗余节点,并将剩余节点作为目标节点;通过递归算法遍历所述树模型的每一层,判断所述目标节点是否满足提升条件,若所述目标节点满足所述提升条件,对所述目标节点进行信息提取并保存到信息库,更新信息库;同时,获取满足所述提升条件的目标节点与冗余节点的一致度,并保留相同节点中一致度最大的冗余节点,将剩余冗余节点进行剔除,并获取一致度最大的冗余节点的信息,保存到信息库;否则,判断所述目标节点的兄弟节点是否满足所述提升条件,若所述兄弟节点满足所述提升条件,将所述兄弟节点进行提取信息并保存到信息库,更新信息库;基于更新的信息库,生成数据驱动的风险策略规则,同时,获取用户交互的建模特征。4.根据权利要求1所述的一种数据驱动的风控策略规则生成方法,其特征在于,步骤3,根据所述风控策略规则以及交互结果对样本数据进行双层次过滤,并对过滤后的数据继续进行训练,包括:基于串行的迭代规则抽取模式,对所有特征按照业务逻辑进行分组;且利用迭代建模功能将风控策略规则激活,对样本数据进行双层次过滤,将双层次过滤后的数据继续进行训练。5.根据权利要求1所述的一种数据驱动的风控策略规则生成方法,其特征在于,步骤5,基于训练结果获取最新模型,生成串行规则报告并输出,包括:当需要开发串行的评分模型时,对双层次过滤后的结果进行评分,输出相应的串行规则报告。6.根据权利要求1所述的一种数据驱动的风控策略规则生成方法,其特征在于,步骤1,对训练得到的树模型进行路径预测之前,还包括:
判断所述样本数据是否存在残缺部分,其包括:实时采集训练样本和测试样本的样本信息,利用主成分分析提取训练样本的主成分和过程监测统计量数据,并基于所述训练样本提取的主成分计算测试样本的过程监测统计量数据;将所述训练样本的过程监测统计量数据与所述测试样本的过程监测统计量数据进行对比判定;当所述训练样本的过程监测统计量数据大于所述测试样本的过程监测统计量数据时,判定所述样本数据缺失;当所述训练样本的过程监测统计量数据不大于所述测试样本...

【专利技术属性】
技术研发人员:柴磊
申请(专利权)人:深圳市魔数智擎人工智能有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1