System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于强化学习技术的贷中调额调价决策方法及装置制造方法及图纸_技高网

一种基于强化学习技术的贷中调额调价决策方法及装置制造方法及图纸

技术编号:40194524 阅读:5 留言:0更新日期:2024-01-26 23:57
本发明专利技术公开一种基于强化学习技术的贷中调额调价决策方法及装置,涉及金融科技技术领域,解决现有贷中调额调价方法对于不同的客户类型调整方式和幅度大有不同,需要单独考虑,过程较为繁琐的问题;本发明专利技术包括:S1:收集历史贷中调额调价数据并进行预处理相应数据集;S2:建立贷中调额调价智能决策模型并构建相应奖励函数;S3:结合奖励函数和S1所得数据集对贷中调额调价智能决策模型进行训练优化,直到模型可输出最优的调整方案可以实现那客户整个贷款生命周期的利润最大化;S4:策略调整前向优化好的模型输入客户当前的状态,获取最优的调整方案;本发明专利技术通过不断与客户进行交互,实现客户整个贷款生命周期的利润最大化。

【技术实现步骤摘要】

本专利技术涉及金融科技,具体涉及一种基于强化学习技术的贷中调额调价决策方法及装置


技术介绍

1、存量客户的运营对银行来说尤为重要,而授信额度和利率的调整是贷中存量客户运营的重要手段。常规贷中调额调价往往是根据当前客户状态判断其如何进行调整,寻求一定时间窗口内的目标最大化。若客户贷款信用良好,则可以考虑提高额度或者降低利率,若客户贷款信用较差,则可以考虑降低额度或者提高利率。对于不同的客户类型,比如从未提款的沉默客户和正在使用的活跃客户,调整方式和幅度也大有不同,需要单独考虑,过程较为繁琐。


技术实现思路

1、为了解决上述现有技术中存在的问题,本专利技术拟提供了一种基于强化学习技术的贷中调额调价决策方法及装置,拟解决现有贷中调额调价方法对于不同的客户类型调整方式和幅度大有不同,需要单独考虑,过程较为繁琐的问题。

2、一种基于强化学习技术的贷中调额调价决策方法,包括以下步骤:

3、s1:收集历史贷中调额调价数据并进行预处理相应数据集;

4、s2:建立贷中调额调价智能决策模型并构建相应奖励函数;

5、s3:结合奖励函数和s1所得数据集对贷中调额调价智能决策模型进行训练优化,直到模型可输出最优的调整方案可以实现那客户整个贷款生命周期的利润最大化;

6、s4:策略调整前向优化好的模型输入客户当前的状态,获取最优的调整方案。

7、优选的,所述s1中历史贷中调额调价数据包括调整时的客户状态、调整的动作以及调整后的客户反馈,所述调整时的客户状态包括客户基本信息、客户借还款行为、客户征信报告,所述调整的动作包括额度的调整幅度、利率的调整幅度,所述调整后的客户反馈包括提款情况、还款情况、逾期情况。

8、优选的,所述s2中贷中调额调价智能决策模型基于离线强化学习bcq算法建立,所述贷中调额调价智能决策模型的状态空间为调整时的客户状态、动作空间为额度及利率的调整幅度、奖励函数为此次调整的预估收益。

9、优选的,所述s2中奖励函数定义为:

10、reward=(1-pd)*amt*int*dur-pd*lgd*amt

11、其中,pd为客户的预测逾期率;amt为客户新增借据的金额;int为新增借据的利率,dur为客户在贷时长,lgd为违约损失率,可见奖励函数实际反映的是贷款的预估毛利润,即利息收入减去逾期本金成本。

12、优选的,所述pd通过构建的pd模型预测得到,所述在贷时长若是已结清借据可采用实际在贷时长,若是未结清借据则通过构建的在贷时长模型预测得到,所述lgd通过构建的lgd模型预测得到。

13、优选的,所述在贷时长模型构建过程包括:设定观察时间点,通过客户的基本信息、历史借还款行为信息等衍生相关特征作为预测目标的基础特征;等到客户结清贷款后,计算客户实际在贷时长作为预测目标。根据上述基础特征和预测目标,利用lightgbm算法建立回归模型。对于尚未结清贷款的客户,将其当前的基础特征输入模型,便可得到客户的预测在贷时长。

14、优选的,所述s3包括:设定初始额度利率后,根据客户的行为表现可计算得到奖励函数的取值,贷中调额调价智能决策模型根据奖励函数的取值和客户当时的状态来确定下一步的动作,与客户不断进行交互,直至模型优化为客户整个贷款生命周期的利润最大化,即

15、argmax(r0+βr1+β2r2+…)

16、其中ri即r0、r1..为每次额度利率调整后的奖励函数reward取值,β为折扣系数,其取值0~1之间,该系数的取值通过实际情况而定。

17、一种基于强化学习技术的贷中调额调价决策装置,包括数据收集模块、模型及奖励函数构建模块、模型训练模块以及模型应用模块,其中所述数据收集模块用于收集历史贷中调额调价数据并进行预处理相应数据集;

18、所述模型及奖励函数构建模块用于建立贷中调额调价智能决策模型并构建相应奖励函数;所述模型训练模块用于结合奖励函数和数据集对贷中调额调价智能决策模型进行训练优化,直到模型可输出最优的调整方案可以实现那客户整个贷款生命周期的利润最大化;

19、所述模型应用模块用于保存优化好的贷中调额调价智能决策模型,并在客户额度策略调整前向优化好的模型输入客户当前的状态,获取最优的调整方案。

20、本专利技术的有益效果包括:

21、1、传统的贷中调额调价往往是根据当前客户状态判断其如何进行调整,寻求当前状态下一定时间窗口内的利润最大化;而本专利技术通过不断与客户进行交互,实现客户整个贷款生命周期的利润最大化。

22、2、传统的贷中调额调价整个过程复杂,需要先判断客户是否满足调整条件,再判断具体的调整动作、调整幅度等,且对于不同的客户类型,比如从未提款的沉默客户和正在使用的活跃客户,调整方式和幅度也大有不同,需要单独考虑;而本专利技术实现对所有客户类型通用,输入客户当前状态便可直接输出最优的调整方案,真正做到了端到端智能决策。

23、3、本专利技术设计的奖励函数是完全基于贷款的毛利润来设计,即利息收入减去逾期本金成本。其中利息收入为:(1-逾期率)*贷款金额*贷款年华利率*贷款时长;逾期本金损失为:逾期率*违约损失率*贷款金额;由于贷款发放后不会马上逾期,发生逾期往往在一定表现时间以后,通常至少在半年以上才比较明显,而贷中额度利率调整的频率更高,调整可能无法等到这些逾期发生或者一笔贷款结束,因此调整时无法获取实际的逾期率、违约损失率以及在贷时长。本专利技术为了解决这个问题,单独设计了3个子模型去对这三个指标进行预测,使得毛利润可以提前计算得出,有了更加精确的奖励函数,模型便可以最大化客户整个生命周期的毛利润为目标来进行贷中额度利率调整。

本文档来自技高网...

【技术保护点】

1.一种基于强化学习技术的贷中调额调价决策方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种基于强化学习技术的贷中调额调价决策方法,其特征在于,所述S1中历史贷中调额调价数据包括调整时的客户状态、调整的动作以及调整后的客户反馈,所述调整时的客户状态包括客户基本信息、客户借还款行为、客户征信报告,所述调整的动作包括额度的调整幅度、利率的调整幅度,所述调整后的客户反馈包括提款情况、还款情况、逾期情况。

3.根据权利要求1所述的一种基于强化学习技术的贷中调额调价决策方法,其特征在于,所述S2中贷中调额调价智能决策模型基于离线强化学习BCQ算法建立,所述贷中调额调价智能决策模型的状态空间为调整时的客户状态、动作空间为额度及利率的调整幅度、奖励函数为此次调整的预估收益。

4.根据权利要求1所述的一种基于强化学习技术的贷中调额调价决策方法,其特征在于,所述S2中奖励函数定义为:

5.根据权利要求4所述的一种基于强化学习技术的贷中调额调价决策方法,其特征在于,所述PD通过构建的PD模型预测得到,所述在贷时长若是已结清借据可采用实际在贷时长,若是未结清借据则通过构建的在贷时长模型预测得到,所述LGD通过构建的LGD模型预测得到。

6.根据权利要求5所述的一种基于强化学习技术的贷中调额调价决策方法,其特征在于,所述在贷时长模型构建过程包括:设定观察时间点,通过客户的基本信息、历史借还款行为信息等衍生相关特征作为预测目标的基础特征;等到客户结清贷款后,计算客户实际在贷时长作为预测目标。根据上述基础特征和预测目标,利用lightGBM算法建立回归模型。对于尚未结清贷款的客户,将其当前的基础特征输入模型,便可得到客户的预测在贷时长。

7.根据权利要求1所述的一种基于强化学习技术的贷中调额调价决策方法,其特征在于,所述S3包括:设定初始额度利率后,根据客户的行为表现可计算得到奖励函数的取值,贷中调额调价智能决策模型根据奖励函数的取值和客户当时的状态来确定下一步的动作,与客户不断进行交互,直至模型优化为客户整个贷款生命周期的利润最大化,即

8.一种基于强化学习技术的贷中调额调价决策装置,其特征在于,包括数据收集模块、模型及奖励函数构建模块、模型训练模块以及模型应用模块,其中

...

【技术特征摘要】

1.一种基于强化学习技术的贷中调额调价决策方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种基于强化学习技术的贷中调额调价决策方法,其特征在于,所述s1中历史贷中调额调价数据包括调整时的客户状态、调整的动作以及调整后的客户反馈,所述调整时的客户状态包括客户基本信息、客户借还款行为、客户征信报告,所述调整的动作包括额度的调整幅度、利率的调整幅度,所述调整后的客户反馈包括提款情况、还款情况、逾期情况。

3.根据权利要求1所述的一种基于强化学习技术的贷中调额调价决策方法,其特征在于,所述s2中贷中调额调价智能决策模型基于离线强化学习bcq算法建立,所述贷中调额调价智能决策模型的状态空间为调整时的客户状态、动作空间为额度及利率的调整幅度、奖励函数为此次调整的预估收益。

4.根据权利要求1所述的一种基于强化学习技术的贷中调额调价决策方法,其特征在于,所述s2中奖励函数定义为:

5.根据权利要求4所述的一种基于强化学习技术的贷中调额调价决策方法,其特征在于,所述pd通过构建的pd模型预测得到,所述在贷时长若是已结清借据可采用实...

【专利技术属性】
技术研发人员:徐顺
申请(专利权)人:四川新网银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1