System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于时间-事件数据的信用卡逾期后债务风险评估方法、系统及应用技术方案_技高网

一种基于时间-事件数据的信用卡逾期后债务风险评估方法、系统及应用技术方案

技术编号:41092058 阅读:6 留言:0更新日期:2024-04-25 13:51
本发明专利技术公开了一种基于时间‑事件数据的信用卡逾期后债务风险评估方法及系统,包括客户分类模型与逾期天数预测模型两大模块,实现了对信用卡逾期客户的用户画像刻画、是否出催分类以及好客户出催天数预测等功能,构建了针对时间‑事件数据的风险函数学习模型,通过根据客户历史行为数据及是否逾期按照客户风险情况对客户进行分类,以及对分类后的好客户出催日期的预测,综合评估客户的债务风险,解决了信用卡逾期数据存在的类别不平衡、催收实时分析以及时间与事件指标的综合考量等问题,在实际数据上较现有的模型有着更高的准确率和可用性。

【技术实现步骤摘要】

本专利技术属于数据挖掘,具体地涉及一种基于时间-事件数据的信用卡逾期后债务风险评估方法、系统及应用


技术介绍

1、信用卡的使用在人们日常消费生活中占据了非常重要的地位。信用卡作为银行业务的重要组成部分,其发卡规模、持卡人数及违约率等对银行经营及发展有着至关重要的作用[1]。根据中国人民银行发布的《2022年支付体系运行总体情况》显示,信用卡逾期半年未偿信贷总额为865.80亿元,占信用卡应偿信贷余额的1.00%,即有高达约8亿元的应还信用卡金额逾期半年仍未偿还。信用卡逾期风险管理是银行贷后风险管理的核心业务。

2、在信贷风险评估领域,目前银行对信贷风险管理的研究大多集中在判断客户是否有逾期或违约风险,通过构建评分卡模型来计算客户的信用分数。因此不少研究都通过优化评分卡模型来提高贷前的风险管理。这一思路大多侧重于利用机器学习或深度学习手段对客户本身特征进行学习与挖掘,探究其历史表现与当前评分的相关关系,对实时的行为变化与银行方对客户的影响重视不足,具有一定的滞后性。同时这类方法更加常见于贷款等周期较长的评估情况,对于信用卡短期催收领域,现有的研究较为欠缺。

3、由于关注固定时间周期内的事件发生风险与发生时长,因而符合时间-事件数据的常见特征,同时也具有与常见金融数据相似的特征,具体如下:

4、1)具有时间、事件两个观测指标;

5、2)观测期内存在事件未发生的右删失情况;

6、3)数据具有不平衡性;

7、4)数据具有时序属性但周期性不强,有一定的个体偏好与灵活性。

8、常见的时间-事件数据的研究大多基于1972年cox提出的cox比例风险模型,这是一种半参数拟合生存函数的方法。但受限于此模型基于一定的线性假设及比例风险假设,对数据要求过高。后续的研究则在此基础上关注非线性数据与非比例风险情况下的风险函数在机器学习或深度学习领域的求解上。此类方法大多关注随着时间变化的个体相对风险率大小,并不能具体给出风险的概率取值,在实际的业务使用中可用性较差。

9、综上所述,适用于短期不平衡时间-事件数据的可用实践方法较为缺乏。


技术实现思路

1、为了解决现有技术存在的不足,本专利技术的目的是提供一种基于时间-事件数据的信用卡逾期后债务风险评估方法、系统及应用。

2、本专利技术提供了一种基于时间-事件数据的信用卡逾期后债务风险评估方法,所述风险评估方法通过根据客户历史行为数据及是否逾期按照客户风险情况对客户进行分类,以及对客户出催日期的预测,综合评估所述客户的债务风险;所述风险评估方法包括客户分类和逾期天数预测。

3、所述客户分类包括以下步骤:

4、步骤一:对日常记录表中的客户数据进行特征提取,并加以统计分析,得到可应用的用户历史行为数据的数据集、是否逾期指标和是否出催标签;

5、步骤二:利用得到的数据集和是否出催的标签送入客户分类模型中进行学习,随机采样步骤一中得到的不同用户数据集中的特征、是否出催标签送入基于随机森林模型的客户分类模型重复学习,利用过采样及阈值调整手段矫正不平衡问题,得到优化后的客户分类模型。

6、步骤三:利用训练好的客户分类模型,输入待分类客户信息,返回输出所述待分类客户对应的类别,所述类别包括好客户和坏客户,好客户进入后续待分析队列,进行逾期天数预测,坏客户根据其被分类获得的类别概率及实际资源情况,分别进入放弃队列或强催收手段队列;在一些具体实施方案中,当划分为坏客户的概率值>0.9时进入放弃队列,当划分为坏客户的概率值小<0.9时进入强催收队列。

7、所述好客户是指未来会出催的客户,即未来能够结清逾期账单的客户,标为0;所述坏客户是指未来不会出催的客户,即未来无法结清逾期账单的客户,标为1;

8、所述的客户分类模型基于对经典随机森林模型的微调。

9、所述步骤一中,从数据库中存储的包括卡核心记录表、催收记录表等在内的日常记录表中提取三大类特征:客户静态特征、客户历史逾期特征、客户实时逾期特征;

10、并根据账龄变化,提取逾期客户在历史催收期内的最终还款情况,记为好坏客户分类的标签数据——历史催收期内是否出催。

11、所述客户静态特征包括:客户号、账户号、性别、年龄、婚姻状况、有效持卡时长、客户本币信用额度等信息;

12、所述客户历史逾期特征包括:客户分期时序信息、客户消费时序信息、客户历史信用信息、客户还款时序信息、客户催收时序信息等;

13、所述客户实时逾期特征包括:当前余额、当前是否周末、当前前一期最小还款额、当天累计还款金额、当日催收动作等。

14、所述步骤二包括:

15、步骤2.1:对步骤一中获得的数据进行数据预处理,所述预处理包括删除重复数据和异常值、根据平均值补足缺失值等,对包括性别、行业类别、开卡地点等在内的类别特征进行编码,将文字类别转换为数值特征,方便未来模型训练;

16、如将性别特征编码为1-女和0-男,行业类别根据是否是金融行业划为0-金融行业、1-非金融行业、2-未填写,开卡地点编码为0-上海、1-非上海地区等。

17、步骤2.2:在特征提取和编码转换之后,对数据进行min-max标准化处理,以确保不同特征之间的尺度一致,获得数据集d并加速模型的收敛;

18、对于每一维数值型特征,统计该特征数据中的最大值max与最小值min,并根据原始取值,根据如下公式求得其标准化后的数值,实现不同特征间的尺度统一;

19、

20、其中x代表原始特征值,x'代表处理后的特征值。

21、步骤2.3:将步骤2.2中处理后的数据集d中划分训练集train、测试集test,对训练集根据预设的采样比例或采样数量进行随机部分采样,利用过采样技术进行随机重复采样,对训练集中未出催客户的样本进行数据增强,并计算采样后的数据集d1中各特征的基尼指数,选择基尼指数最低的特征进行分裂,直至到达根据实际情况预设的最深树深度停止,以此重复构造n棵决策树,获得客户分类模型;

22、在一个具体实施方式中,步骤2.3中,数据集d中出催与未出催的客户比例为8:2,划分的训练集和测试集的比例为8:2,划分后的训练集和测试集中的出催与未出催的比例与数据集中的比例相同,同样为8:2;利用过采样技术对训练集中的未出催客户样本进行数据增强后,出催和未出催客户的比例由原先的8:2变成了5:5。

23、步骤2.4:在所述客户分类模型中输入测试集,n棵树会给出对应的n个分类结果,对n个结果取平均,即可知道当前样本的分类概率。根据所述客户分类模型的输出结果与实际类别进行混淆矩阵计算,求得包括准确率、召回率等在内的分类结果评估指标。

24、步骤2.5:重复步骤2.4,修改每次模型的包括树深度、批数据大小、最小叶子节点上的数据数量以及树个数等在内的参数取值,并计算每次调整后的所述客户分类模型在测试本文档来自技高网...

【技术保护点】

1.一种基于时间-事件数据的信用卡逾期后债务风险评估方法,其特征在于,所述风险评估方法通过根据客户历史行为数据及是否逾期按照客户风险情况对客户进行分类,以及对分类后的好客户出催日期的预测,综合评估客户的债务风险;所述风险评估方法包括客户分类和逾期天数预测;

2.根据权利要求1所述的风险评估方法,其特征在于,步骤一中,所述提取的特征包括:客户静态特征、客户历史逾期特征、客户实时逾期特征;并根据账龄变化,提取逾期客户在历史催收期内的最终还款情况,根据历史催收期内是否出催作为好坏客户分类标准;

3.根据权利要求1所述的风险评估方法,其特征在于,步骤二进一步包括如下步骤:

4.根据权利要求1所述的风险评估方法,其特征在于,所述步骤S1包括:

5.根据权利要求4所述的风险评估方法,其特征在于,所述步骤S2包括:

6.根据权利要求1所述的风险评估方法,其特征在于,所述步骤S3包括:

7.根据权利要求6所述的风险评估方法,其特征在于,所述步骤S3.3包括:

8.根据权利要求1所述的风险评估方法,其特征在于,所述步骤S4包括:

9.一种实现如权利要求1-8之任一项所述风险评估方法的风险评估系统,其特征在于,所述风险评估系统包括客户分类模块和逾期天数预测模块;

10.如权利要求1-8之任一项所述的风险评估方法,或如权利要求9所述的风险评估系统在系统催收、信用卡客户风险评估、催收天数预测、信用卡客户分类中的应用。

...

【技术特征摘要】

1.一种基于时间-事件数据的信用卡逾期后债务风险评估方法,其特征在于,所述风险评估方法通过根据客户历史行为数据及是否逾期按照客户风险情况对客户进行分类,以及对分类后的好客户出催日期的预测,综合评估客户的债务风险;所述风险评估方法包括客户分类和逾期天数预测;

2.根据权利要求1所述的风险评估方法,其特征在于,步骤一中,所述提取的特征包括:客户静态特征、客户历史逾期特征、客户实时逾期特征;并根据账龄变化,提取逾期客户在历史催收期内的最终还款情况,根据历史催收期内是否出催作为好坏客户分类标准;

3.根据权利要求1所述的风险评估方法,其特征在于,步骤二进一步包括如下步骤:

4.根据权利要求1所述的风险评估方法,其特征在于,所...

【专利技术属性】
技术研发人员:毕警予倪葎黄定江刘文辉龙佳杰高梦瑶曹婉茹
申请(专利权)人:华东师范大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1