一种基于SQL的风控特征构造方法及系统技术方案

技术编号:41191011 阅读:22 留言:0更新日期:2024-05-07 22:21
本发明专利技术涉及风控特征构造领域,公开了一种基于SQL的风控特征构造方法及系统,一种基于SQL的风控特征构造方法,包括:S1,获取所需风控特征的表格,解析表格中的数据模型、数据立方的条件组与算子组;S2,对所述数据立方的条件组进行全排列,得到期望的完备筛选条件矩阵;S3,采用所述算子组与完备筛选条件矩阵进行笛卡尔计算,对每一个筛选数据进行特点计算,得到特征行为;S4,将数据模型与特征行为拼接得到风控特征SQL表达式。本申请对风控特征进行抽象并拆分,简单化特征的批量衍生生成,从而使得特征覆盖面更广,以更深的挖掘信息中隐藏的风险。

【技术实现步骤摘要】

本专利技术涉及风控特征构造领域,具体涉及一种基于sql的风控特征构造方法及系统。


技术介绍

1、风险控制作为金融的核心,一直备受关注。在金融机构中,通过业务中的金融逻辑来反应借款人的风险是常用方法。而现在随着金融互联网化产生大量数据和技术的发展,使得挖掘这些数据与借款人风险之间的关系成为可能。

2、业务人员基于实际业务场景理解数据内容,利用数据与信用的关联度,发现数据与风险的关系,创造大量刻画用户风险的特征。这些特征即风险控制的基石--风控特征。

3、通常,开发上线一套实时风控特征计算系统,主要包含三个步骤,即离线特征脚本开发、在线特征代码重构、以及线上线下计算逻辑一致性校验。实时风控特征计算需要满足低延迟、高吞吐、高可用,特征构造被分为离线在线两步,该模式开发门槛高,取数、补数逻辑复杂,开发周期长,即使比较简单的特征开发也需要专业的开发工程师参与其中。

4、风控特征主要的构造方式是业务人员在专家经验指导下,使用python、tableau等数据分析工具对以往数据进行特征构造与离线计算验证,该方法存在有效特征覆盖率低与需本文档来自技高网...

【技术保护点】

1.一种基于SQL的风控特征构造方法,其特征在于,包括:

2.根据权利要求1所述的一种基于SQL的风控特征构造方法,其特征在于:还包括S5,通过Apache Calcite组件将SQL转译为可执行代码执行,统一离线和在线特征逻辑表达形式。

3.根据权利要求1所述的一种基于SQL的风控特征构造方法,其特征在于,所述S2包括:

4.根据权利要求1所述的一种基于SQL的风控特征构造方法,其特征在于:所述风控特征SQL表达式的名称由定义的别名拼接而成,所述别名包含数据模型别名、条件简写、算子组信息。

5.根据权利要求1所述的一种基于SQL的风控特征...

【技术特征摘要】

1.一种基于sql的风控特征构造方法,其特征在于,包括:

2.根据权利要求1所述的一种基于sql的风控特征构造方法,其特征在于:还包括s5,通过apache calcite组件将sql转译为可执行代码执行,统一离线和在线特征逻辑表达形式。

3.根据权利要求1所述的一种基于sql的风控特征构造方法,其特征在于,所述s2包括:

4.根据权利要求1所述的一种基于sql的风控特征构造方法,其特征在于:所述风控特征sql表达式的名称由定义的别名拼接而成,所述别名包含数据模型别名、条件简写、算子组信息。

5.根据权利要求1所述的一种基于sql的风控特征构造方法,其特征在于:所述s1还包括:对风控特征元数据进行剪取、转换操作,得到原始特征数据,对原始特征数据进行筛选与聚合转换计算得到数据立方的条件组。

6.一种基于sql的风控特征构造系统,其特征在于,包括:

<...

【专利技术属性】
技术研发人员:廖家绪何配
申请(专利权)人:重庆富民银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1