一种动态生成预警规则的方法和装置制造方法及图纸

技术编号:24758968 阅读:24 留言:0更新日期:2020-07-04 09:48
本发明专利技术公开了动态生成预警规则的方法和装置,涉及计算机技术领域。该方法的一具体实施方式包括通过用户识别码和债项识别码获取目标数据,进而将所述目标数据整合至目标数据集中;将目标数据集输入至预设的预警模型中进行处理,进而转换处理结果得到结果评分;基于预警的用户评分阈值,提取结果评分对应的目标数据,进而计算目标数据中各变量的贡献度,以得到用于对用户信息进行预警处理的预警规则。从而,本发明专利技术的实施方式能够解决现有针对贷后客户预警困难、效率低的问题。

A method and device for dynamic generation of early warning rules

【技术实现步骤摘要】
一种动态生成预警规则的方法和装置
本专利技术涉及计算机
,尤其涉及一种动态生成预警规则的方法和装置。
技术介绍
目前,贷款发放后,预警客户何时转为不良,因何转为不良,一直以来是银行重点关注并致力解决的问题。传统的风险预警管理模型更多基于专家规则模型,且主要是结构性数据例如行业数据、经营数据、结算数据等,且模型需要满足监管要求,保持一定的稳定性。为了让预警核查人员能够精确判断预警的原因,其模型还必须要有可解释性。因而,在一定程度上受数据更新滞后以及数据维度较少(如缺少宏观)和模型解释性的影响,限制了模型特别是人工智能模型在银行预警管理中的应用。在实现本专利技术过程中,专利技术人发现现有技术中至少存在如下问题:对贷后的风险预警需要尽可能全面的整合客户贷后相关行为数据,从中找出与该客户的贷后风险管理最相关的特征,进而建立合适的模型,并根据模型组合生成预警规则。目前预警规则方法主要有两类:根据专家经验将贷后信用风险评估知识固化成规则来监控客户贷后风险情况,以及利用单一逻辑回归模型或者随机森林模型对客户进行行为评分,进而根据行为评分来进行预警。可以看出,专家经验具有一定的主观和局限性,所以经验规则无法全面衡量客户的贷后行为情况,可能会使得潜在风险客户漏报警的情况。第二类方法在一定程度上解决了第一类方法的缺点,但是模型较为单一,且解释性较差,一般无法准确告知核查人员具体风险的原因。
技术实现思路
有鉴于此,本专利技术实施例提供一种动态生成预警规则的方法和装置,能够解决现有针对贷后客户预警困难、效率低的问题。为实现上述目的,根据本专利技术实施例的一个方面,提供了一种动态生成预警规则的方法,包括通过用户识别码和债项识别码获取目标数据,进而将所述目标数据整合至目标数据集中;将目标数据集输入至预设的预警模型中进行处理,进而转换处理结果得到结果评分;基于预警的用户评分阈值,提取结果评分对应的目标数据,进而计算目标数据中各变量的贡献度,以得到用于对用户信息进行预警处理的预警规则。可选地,通过用户识别码和债项识别码获取目标数据,进而将所述目标数据整合至目标数据集中,包括:通过用户识别码和债项识别码将目标数据整合成宽表数据,以进行清洗得到目标数据集。可选地,还包括:对宽表数据进行校准、合并、联结以及缺失值的清洗处理。可选地,包括:利用预设的特征工程方法,将目标数据集中的数据进行变量衍生,以将衍生后的目标数据集输入至预设的预警模型中进行处理。可选地,利用预设的特征工程方法,将目标数据集中的数据进行变量衍生,包括:采用基于标识类变量、离散型变量、连续性变量以及时间序列变量的衍生方法,对目标数据集中的数据进行变量衍生。可选地,还包括:监测基于当前的预警规则,对用户信息进行预警处理的虚警率;当所述的虚警率大于或等于预设的虚警率阈值时,则迭代更新预警模型以生成新的预警规则。可选地,计算目标数据中各变量的贡献度,以得到用于对用户信息进行预警处理的预警规则,包括:通过SHAP值得到目标数据中各变量的贡献度,以提取造成结果评分过低的变量,进而组合变量生成预警规则。可选地,组合变量生成预警规则,还包括:基于提取的目标数据,归集同类型用户的历史履约表现信息;利用历史履约表现信息和提取的变量,生成预警规则。可选地,包括:所述的预警模型为xgboost模型。另外,本专利技术还提供了一种动态生成预警规则的装置,包括获取模块,用于通过用户识别码和债项识别码获取目标数据,进而将所述目标数据整合至目标数据集中;处理模块,用于将目标数据集输入至预设的预警模型中进行处理,进而转换处理结果得到结果评分;生成模块,用于基于预警的用户评分阈值,提取结果评分对应的目标数据,进而计算目标数据中各变量的贡献度,以得到用于对用户信息进行预警处理的预警规则。可选地,所述获取模块通过用户识别码和债项识别码获取目标数据,进而将所述目标数据整合至目标数据集中,包括:通过用户识别码和债项识别码将目标数据整合成宽表数据,以进行清洗得到目标数据集。可选地,所述获取模块,还用于:对宽表数据进行校准、合并、联结以及缺失值的清洗处理。可选地,所述处理模块,还用于:利用预设的特征工程方法,将目标数据集中的数据进行变量衍生,以将衍生后的目标数据集输入至预设的预警模型中进行处理。可选地,所述处理模块利用预设的特征工程方法,将目标数据集中的数据进行变量衍生,包括:采用基于标识类变量、离散型变量、连续性变量以及时间序列变量的衍生方法,对目标数据集中的数据进行变量衍生。可选地,所述生成模块,还用于:监测基于当前的预警规则,对用户信息进行预警处理的虚警率;当所述的虚警率大于或等于预设的虚警率阈值时,则迭代更新预警模型以生成新的预警规则。可选地,所述生成模块计算目标数据中各变量的贡献度,以得到用于对用户信息进行预警处理的预警规则,包括:通过SHAP值得到目标数据中各变量的贡献度,以提取造成结果评分过低的变量,进而组合变量生成预警规则。可选地,所述生成模块组合变量生成预警规则,还包括:基于提取的目标数据,归集同类型用户的历史履约表现信息;利用历史履约表现信息和提取的变量,生成预警规则。可选地,包括:所述的预警模型为xgboost模型。上述专利技术中的一个实施例具有如下优点或有益效果:因为采用通过用户识别码和债项识别码获取目标数据,进而将所述目标数据整合至目标数据集中;将目标数据集输入至预设的预警模型中进行处理,进而转换处理结果得到结果评分;基于预警的用户评分阈值,提取结果评分对应的目标数据,进而计算目标数据中各变量的贡献度,以得到用于对用户信息进行预警处理的预警规则的技术手段,所以克服了现有针对贷后客户预警困难、效率低的技术问题。上述的非惯用的可选方式所具有的进一步效果将在下文中结合具体实施方式加以说明。附图说明附图用于更好地理解本专利技术,不构成对本专利技术的不当限定。其中:图1是根据本专利技术第一实施例的动态生成预警规则的方法的主要流程的示意图;图2是根据本专利技术第二实施例的动态生成预警规则的方法的主要流程的示意图;图3是根据本专利技术第三实施例的构建识别模型的主要流程的示意图;图4是根据本专利技术实施例的动态生成预警规则的装置的主要模块的示意图;图5是本专利技术实施例可以应用于其中的示例性系统架构图;图6是适于用来实现本专利技术实施例的终端设备或服务器的计算机系统的结构示意图。具体实施方式以下结合附图对本专利技术的示范性实施例做出说明,其中包括本专利技术实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本专利技术的范围和精神。同样,为了清楚和简明,以下的描述本文档来自技高网...

【技术保护点】
1.一种动态生成预警规则的方法,其特征在于,包括:/n通过用户识别码和债项识别码获取目标数据,进而将所述目标数据整合至目标数据集中;/n将目标数据集输入至预设的预警模型中进行处理,进而转换处理结果得到结果评分;/n基于预警的用户评分阈值,提取结果评分对应的目标数据,进而计算目标数据中各变量的贡献度,以得到用于对用户信息进行预警处理的预警规则。/n

【技术特征摘要】
1.一种动态生成预警规则的方法,其特征在于,包括:
通过用户识别码和债项识别码获取目标数据,进而将所述目标数据整合至目标数据集中;
将目标数据集输入至预设的预警模型中进行处理,进而转换处理结果得到结果评分;
基于预警的用户评分阈值,提取结果评分对应的目标数据,进而计算目标数据中各变量的贡献度,以得到用于对用户信息进行预警处理的预警规则。


2.根据权利要求1所述的方法,其特征在于,通过用户识别码和债项识别码获取目标数据,进而将所述目标数据整合至目标数据集中,包括:
通过用户识别码和债项识别码将目标数据整合成宽表数据,以进行清洗得到目标数据集。


3.根据权利要求1所述的方法,其特征在于,包括:
利用预设的特征工程方法,将目标数据集中的数据进行变量衍生,以将衍生后的目标数据集输入至预设的预警模型中进行处理。


4.根据权利要求3所述的方法,其特征在于,利用预设的特征工程方法,将目标数据集中的数据进行变量衍生,包括:
采用基于标识类变量、离散型变量、连续性变量以及时间序列变量的衍生方法,对目标数据集中的数据进行变量衍生。


5.根据权利要求1所述的方法,其特征在于,还包括:
监测基于当前的预警规则,对用户信息进行预警处理的虚警率;
当所述的虚警率大于或等于预设的虚警率阈值时,则迭代更新预警模型以生成新的预警规则。

【专利技术属性】
技术研发人员:林晓光赖太平
申请(专利权)人:中国建设银行股份有限公司建信金融科技有限责任公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1