System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于动态图序列的贷后风险预测方法技术_技高网

一种基于动态图序列的贷后风险预测方法技术

技术编号:40834039 阅读:4 留言:0更新日期:2024-04-01 14:58
本发明专利技术公开了一种基于动态图序列的贷后风险预测方法,包括如下步骤:S1、根据客户历史风险表现分析客户的关联关系维度,并采用选定的多维度关系基于客户的进件时间先后,使用滑动时间窗口的方式构建动态客户关系图序列;S2、采用图卷积神经网络GCN对客户关系图序列中每个时间步的图进行特征提取,获取目标节点的图向量表示集合;S3、使用LSTM网络结合注意力机制进行客户历史图特征融合,并使用MLP和跳层连接实现语义信息的融合,然后利用全连接网络结合softmax函数进行风险概率预测。本方案能够实现对客户历史先验知识、客户图序列特征以及客户时序特征等信息的有效利用,提升模型对客户贷后风险的准确性,以达到对汽车金融贷后风险的有效管理。

【技术实现步骤摘要】

本专利技术涉及金融风险预测领域,特别涉及一种基于动态图序列的贷后风险预测方法


技术介绍

1、随着全球经济的发展,人民生活水平的提升,人们对汽车的需求不断增加。同时,金融市场的发展和人们对购车的变化,越来越多的消费者倾向于选择汽车金融服务,以至于汽车金融在全球范围内呈现出快速发展的趋势。然而,随着汽车金融业务量的增加,贷后风险管理任务也越发严峻,并且存在着大规模聚集性的贷后风险发生,这类贷后聚集性风险往往难以通过传统的客户贷后还款行为来预测。贷后的聚集性风险不仅与客户自身信息相关,同时还与客户的关联性风险相关。因此,如何有效识别客户的关联性风险,是解决这一问题的关键。

2、在汽车金融信贷风险预警中,传统的做法是依赖专家的先验知识来创建规则或使用相关的机器学习模型进行风险预测。然而,这种方法存在一些局限性。由于专家经验存在其局限性,可用的客户相关数据源往往相对有限,通常只能关注客户的自身信息,难以全面的使用客户所有相关信息(关联信息等),同时风险预测结果与客户历史先验的准确性和时效性紧密关联。在金融贷款场景迅速更新,风险行为日益变化的实际情况下,这类方法可能导致预测准确性下降。同样,机器学习方法的效果也容易受到数据分布变化的影响,同时人工特征工程通常无法考虑所有客户信息,模型的时效性难以保证。而对于需要依据客户关联信息的聚集性风险,通过常规的机器学习算法难以识别。因此,需要一种可以利用客户实时信息,并且可以挖掘客户关联信息的方法来解决这类问题。


技术实现思路

1、本专利技术的目的在于克服现有技术的不足,提供一种基于动态图序列的贷后风险预测方法,基于时间窗口有效利用客户实时信息,同时利用动态客户关系图实现对客户关联关系的挖掘,从而可以有效解决数据更新导致的模型性能下降和聚集性风险识别不准的问题,以实现对汽车金融贷后风险的有效管理。。

2、为了实现上述目的,本专利技术采用的技术方案为:一种基于动态图序列的贷后风险预测方法,包括如下步骤:

3、s1、客户动态关系图序列构建:根据客户历史风险表现分析客户的关联关系维度,并采用选定的多维度关系基于客户的进件时间先后,使用滑动时间窗口的方式构建动态客户关系图序列;

4、s2、基于gcn的动态图特征提取:采用图卷积神经网络gcn对客户关系图序列中每个时间步的图进行特征提取,获取目标节点的图向量表示集合;

5、s3、基于动态图序列的金融风险预测:使用lstm网络结合注意力机制进行客户历史图特征融合,并使用mlp和跳层连接实现语义信息的融合,然后利用全连接网络结合softmax函数进行风险概率预测。

6、步骤s1中,客户关联关系维度选取包括通过统计不同关系维度特征对节点的聚集能力,来确定部分关系特征作为构建关系图的关系维度,关系特征的聚集性,在不同特征上的风险占比会显示出区别,通过分析历史客户在不同关系特征维度上的风险占比来分析特征的聚集性,最终,选取风险占比较高的关系维度,并结合业务提示,输出客户关系维度集合作为构建客户关联关系图的相应维度。

7、步骤s1中,通过统计风险客户在未发生风险前的不同时间段内关联的风险客户比例,来确定构建关系图所要选用的时间窗口长度,选取风险客户占比较高的时间窗口长度,并根据结合业务专家给出的时间窗口长度,使用加权平均的方式,输出构建客户关联关系图的时间窗口。

8、步骤s1中,客户动态关系图序列构建包括:选取历史存量客户数据,以选定的时间窗口长度l对选取的历史存量客户依据进件时间进行划分,得到历史客户序列集合c={v1,v2,...,vt,...},其中vt表示第t个时间窗口中的所有客户集;对客户集vt,以客户定义为实体,选定的多种维度分别定义多种类型的边,然后将客户实体与客户实体以多种关系类型进行关联,构建客户的多维度异构关系图。

9、根据不同关系维度对风险的聚集性不同,对不同的关系赋予不同的权值,然后对权值进行融合,从而将多维度异构关系图转换为同构图,将多维度异构关系图转换为同构图包括:

10、1)基于客户历史先验知识计算多种关系维度权重,即计算客户集vt中单一维度关联的风险客户数量与客户集vt中该维度关联的客户总数量的比值,具体计算公式如下:

11、

12、其中,表示关系维度i在客户集vt中关联的风险客户数量,关系维度i在客户集vt中关联的客户总数量;

13、2)对多种维度关系权值进行归一化操作,得到每个关系维度的归一化权值,作为该关系的边权值,

14、

15、其中,是关系维度i在客户集vt中的权重;

16、3)对客户集vt中的任意两个节点和的多种单维度关系进行融合,得到节点和之间的融合关系权重具体融合过程如下:

17、

18、其中,是关系维度i在客户集vt中的归一化权重;

19、将每个客户集vt中的所有节点之间的关系依据上述方式进行融合,构建得到动态客户关系图序列集合g={g1,g2,...,gt,...}。

20、步骤s2中基于gcn的动态图特征提取包括动态图节点编码和动态图卷积特征提取;

21、其中动态图节点编码包括:

22、对于客户关系图序列集合g={g1,g2,...,gt,...}中的元素gt={vt,et},其中表示第t个时间步图的节点集合,表示第t个时间步图的边集合;

23、对于节点集合中的每个客户元素,采用客户的身份证号码和姓名进行词嵌入操作,得到客户的词嵌入集合其中是第t个时间步中第i个客户元素的词嵌入向量;

24、将客户的进件时间先后知识添加到客户节点信息中,即对每个客户节点添加时间先后嵌入,得到客户的时间嵌入集合其中表示第t个时间步中第i个客户元素的时间序列嵌入向量,最终客户节点的嵌入向量为其对应的词嵌入和时间序列嵌入之和,

25、

26、因此第t个时间步的客户节点最终嵌入结果向量集合

27、动态图卷积特征提取包括对于编码后第t个时间步的客户节点嵌入向量表示集合采用基于图神经网络gcn的特征提取模型对其进行特征提取,以获取客户图集合中每个客户节点的图结构特征信息;gcn的特征提取过程迭代公式遵循如下的逐层传播规则:

28、

29、

30、

31、其中,a是无向图的邻接矩阵,in表示单位矩阵,w(l)是第l层的可学习参数矩阵,σ(·)我激活函数,h(l)是第l层的输入数据,当l=0时,h(0)为初始输入向量;

32、对于第t个时间步的客户节点表示向量集合将其代入公式(8)-(10)计算得第t个时间步的客户节点图特征表示向量集合

33、

34、

35、

36、其中,at是第t个时间步客户关系图的邻接矩阵,表示单位矩阵,是第t个时间步的可学习权值矩阵,最终提取得到客户节点的图特征向量

37、

...

【技术保护点】

1.一种基于动态图序列的贷后风险预测方法,其特征在于:包括如下步骤:

2.如权利要求1所述的一种基于动态图序列的贷后风险预测方法,其特征在于:步骤S1中,客户关联关系维度选取包括通过统计不同关系维度特征对节点的聚集能力,来确定部分关系特征作为构建关系图的关系维度,关系特征的聚集性,在不同特征上的风险占比会显示出区别,通过分析历史客户在不同关系特征维度上的风险占比来分析特征的聚集性,最终,选取风险占比较高的关系维度,并结合业务提示,输出客户关系维度集合作为构建客户关联关系图的相应维度。

3.如权利要求1所述的一种基于动态图序列的贷后风险预测方法,其特征在于:步骤S1中,通过统计风险客户在未发生风险前的不同时间段内关联的风险客户比例,来确定构建关系图所要选用的时间窗口长度,选取风险客户占比较高的时间窗口长度,并根据结合业务专家给出的时间窗口长度,使用加权平均的方式,输出构建客户关联关系图的时间窗口。

4.如权利要求1所述的一种基于动态图序列的贷后风险预测方法,其特征在于:步骤S1中,客户动态关系图序列构建包括:选取历史存量客户数据,以选定的时间窗口长度L对选取的历史存量客户依据进件时间进行划分,得到历史客户序列集合C={V1,V2,...,Vt,...},其中Vt表示第t个时间窗口中的所有客户集;对客户集Vt,以客户定义为实体,选定的多种维度分别定义多种类型的边,然后将客户实体与客户实体以多种关系类型进行关联,构建客户的多维度异构关系图。

5.如权利要求4所述的一种基于动态图序列的贷后风险预测方法,其特征在于:根据不同关系维度对风险的聚集性不同,对不同的关系赋予不同的权值,然后对权值进行融合,从而将多维度异构关系图转换为同构图,将多维度异构关系图转换为同构图包括:

6.如权利要求5所述的一种基于动态图序列的贷后风险预测方法,其特征在于:

7.如权利要求6所述的一种基于动态图序列的贷后风险预测方法,其特征在于:动态图卷积特征提取包括对于编码后第t个时间步的客户节点嵌入向量表示集合采用基于图神经网络GCN的特征提取模型对其进行特征提取,以获取客户图集合中每个客户节点的图结构特征信息;GCN的特征提取过程迭代公式遵循如下的逐层传播规则:

8.如权利要求1-7任一所述的一种基于动态图序列的贷后风险预测方法,其特征在于:

9.如权利要求8所述的一种基于动态图序列的贷后风险预测方法,其特征在于:

...

【技术特征摘要】

1.一种基于动态图序列的贷后风险预测方法,其特征在于:包括如下步骤:

2.如权利要求1所述的一种基于动态图序列的贷后风险预测方法,其特征在于:步骤s1中,客户关联关系维度选取包括通过统计不同关系维度特征对节点的聚集能力,来确定部分关系特征作为构建关系图的关系维度,关系特征的聚集性,在不同特征上的风险占比会显示出区别,通过分析历史客户在不同关系特征维度上的风险占比来分析特征的聚集性,最终,选取风险占比较高的关系维度,并结合业务提示,输出客户关系维度集合作为构建客户关联关系图的相应维度。

3.如权利要求1所述的一种基于动态图序列的贷后风险预测方法,其特征在于:步骤s1中,通过统计风险客户在未发生风险前的不同时间段内关联的风险客户比例,来确定构建关系图所要选用的时间窗口长度,选取风险客户占比较高的时间窗口长度,并根据结合业务专家给出的时间窗口长度,使用加权平均的方式,输出构建客户关联关系图的时间窗口。

4.如权利要求1所述的一种基于动态图序列的贷后风险预测方法,其特征在于:步骤s1中,客户动态关系图序列构建包括:选取历史存量客户数据,以选定的时间窗口长度l对选取的历史存量客户依据进件时间进行划分,得到历史客户序...

【专利技术属性】
技术研发人员:王延松霍龙双章程吴成龙冉燕王蒙
申请(专利权)人:奇瑞徽银汽车金融股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1