一种逾期风险概率的确定方法、装置、电子设备和介质制造方法及图纸

技术编号:36117738 阅读:16 留言:0更新日期:2022-12-28 14:22
本发明专利技术公开了一种逾期风险概率的确定方法、装置、电子设备和介质,涉及金融风险技术领域。该方法的具体实施方式包括:获取多个账号的历史交易信息;对历史交易信息进行预处理,提取各个账号的时间序列特征;遍历各个账号的历史交易信息,查找相互之间存在交易关系的账号,构建各个账号之间的交易关系的图数据;将图数据和时间序列特征输入图卷积神经网络,得到多个账号之间的关联关系特征;对时间序列特征和关联关系特征进行组合,将特征组合结果输入风险预测模型,确定各个账号的逾期风险概率。该实施方式能够利用图卷积神经网络对用户的账号之间的拆借关系进行分析,准确识别可能存在高危风险的用户,提高逾期风险预测的准确度。度。度。

【技术实现步骤摘要】
一种逾期风险概率的确定方法、装置、电子设备和介质


[0001]本专利技术涉及金融风险
,尤其涉及一种逾期风险概率的确定方法、装置、电子设备和介质。

技术介绍

[0002]逾期风险是指贷款人无法按照约定时间向金融机构还款的可能性,因此,为了保证业务的安全进行,金融机构在向外贷款审批时,需要对客户质量进行甄别,以控制可能存在的贷款逾期风险。
[0003]现有的逾期风险控制过程中,通常是利用账号的历史行为(比如,转账线下支付、还款等)数据,通过卷积神经网络对账号行为序列进行特征提取及分析,以预测用户贷款的逾期风险。
[0004]在实现本专利技术过程中,专利技术人发现现有技术中至少存在如下问题:
[0005]然而,由于一个用户名下可能存在一个或多个账号(比如,一张或多张借贷记卡),用户可能利用多个账号互相拆借、套现,现有的逾期风险预测中,卷积神经网络仅能处理账号的个体行为特征,无法对用户多个账号之间可能的拆借关系进行分析,使得现有的用户逾期风险预测的准确率低下,无法准确对客户质量进行甄别,会使金融机构面临较大的坏账风险。

技术实现思路

[0006]有鉴于此,本专利技术实施例提供一种逾期风险概率的确定方法、装置、电子设备和计算机介质,能够利用图卷积神经网络对用户的账号之间的拆借关系进行分析,准确识别可能存在高危风险的用户,可以大大提高逾期风险预测的准确度,降低金融机构的风险损失。
[0007]为实现上述目的,根据本专利技术实施例的一个方面,提供了一种逾期风险概率的确定方法,包括:
[0008]获取多个账号的历史交易信息;
[0009]对所述历史交易信息进行预处理,提取各个所述账号的时间序列特征;
[0010]遍历各个所述账号的历史交易信息,查找相互之间存在交易关系的所述账号,构建各个所述账号之间的交易关系的图数据;
[0011]将各个所述账号之间的交易关系的图数据和所述时间序列特征输入图卷积神经网络,根据所述图卷积神经网络的输出,得到多个所述账号之间的关联关系特征;
[0012]对所述时间序列特征和所述关联关系特征进行组合,将特征组合结果输入风险预测模型,利用所述风险预测模型的输出确定各个所述账号的逾期风险概率。
[0013]可选地,所述对所述历史交易信息进行预处理,包括:
[0014]对所述历史交易信息进行数据清洗,处理所述历史交易信息中的重复信息、缺失信息和异常信息;
[0015]针对经过所述数据清洗后的所述历史交易信息,对数值变量进行归一化处理,并
对分类变量进行独热编码;
[0016]针对经过所述数据清洗后的所述历史交易信息,将数值变量的归一化值和分类变量的独热编码进行组合,得到包括各个所述账号的历史交易信息的预处理结果。
[0017]可选地,所述对数值变量进行归一化处理,包括:
[0018]将所述数值变量与全部所述数值变量中的最小值之差作为分子,将全部所述数值变量中的最大值与最小值之差作为分母,计算各个所述数值变量的归一化值。
[0019]可选地,所述对分类变量进行独热编码,包括:
[0020]将所述分类变量的变量值映射到整数值;
[0021]利用二进制向量表示所述整数值,得到各个所述分类变量的独热编码。
[0022]可选地,所述提取各个所述账号的时间序列特征,包括:
[0023]按照账号维度,将所述预处理结果进行扁平化;
[0024]将每一个所述账号的扁平化数据输入预训练的行为特征模型;
[0025]根据所述行为特征模型的输出,确定各个所述账号的时间序列特征。
[0026]可选地,所述行为特征模型采用LSTM网络、Bi

RNN网络或者GRU网络。
[0027]可选地,确定所述行为特征模型,包括:
[0028]获取多个样本账号的样本交易特征和样本时间序列;
[0029]将各个所述样本账号的所述样本交易特征作为行为特征模型的输入、所述样本时间序列作为所述行为特征模型的输出,对所述行为特征模型进行迭代训练;
[0030]根据训练结果,生成所述行为特征模型。
[0031]可选地,在所述将每一个所述账号的扁平化数据输入预训练的行为特征模型之前,还包括:
[0032]对所述扁平化数据进行层标准化处理。
[0033]可选地,所述将各个所述账号之间的交易关系的图数据和所述时间序列特征输入预训练的所述图卷积神经网络,替换为:
[0034]将所述时间序列特征输入所述图卷积神经网络,以确定多个所述账号之间的所述关联关系矩阵。
[0035]可选地,所述将各个所述账号之间的交易关系的图数据和所述时间序列特征输入预训练的所述图卷积神经网络,替换为:
[0036]将各个所述账号之间的交易关系的所述图数据输入图卷积神经网络,以确定多个所述账号之间的所述关联关系矩阵。
[0037]可选地,所述对所述时间序列特征和所述关联关系特征进行组合,包括:
[0038]将所述时间序列特征和所述关联关系特征进行拼接,确定所述特征组合结果。
[0039]可选地,所述账号为借记卡账号,和/或,贷记卡账号。
[0040]根据本专利技术实施例的再一个方面,提供了一种逾期风险概率的确定装置,包括:
[0041]获取模块,用于获取多个账号的历史交易信息;
[0042]预处理模块,用于对所述历史交易信息进行预处理,提取各个所述账号的时间序列特征;
[0043]预处理模块,还用于遍历各个所述账号的历史交易信息,查找相互之间存在交易关系的所述账号,构建各个所述账号之间的交易关系的图数据;
[0044]特征提取模块,用于将各个所述账号之间的交易关系的图数据和所述时间序列特征输入图卷积神经网络,根据所述图卷积神经网络的输出,得到多个所述账号之间的关联关系特征;
[0045]预测模块,用于对所述时间序列特征和所述关联关系特征进行组合,将特征组合结果输入风险预测模型,利用所述风险预测模型的输出确定各个所述账号的逾期风险概率。
[0046]根据本专利技术实施例的另一个方面,提供了一种逾期风险概率的确定的电子设备,包括:
[0047]一个或多个处理器;
[0048]存储装置,用于存储一个或多个程序,
[0049]当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现本专利技术提供的逾期风险概率的确定方法。
[0050]根据本专利技术实施例的还一个方面,提供了一种计算机可读介质,其上存储有计算机程序,所述程序被处理器执行时实现本专利技术提供的逾期风险概率的确定方法。
[0051]上述专利技术中的一个实施例具有如下优点或有益效果:因为采用对用户的历史交易信息预处理,按照账号维度进行扁平化,输入行为特征模型得到时间序列特征,并将时间序列特征和各个账号之间的交易关系的图数据输入图卷积神经网络,提取账号之间的关联关系特征,拼接时本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种逾期风险概率的确定方法,其特征在于,包括:获取多个账号的历史交易信息;对所述历史交易信息进行预处理,提取各个所述账号的时间序列特征;遍历各个所述账号的历史交易信息,查找相互之间存在交易关系的所述账号,构建各个所述账号之间的交易关系的图数据;将各个所述账号之间的交易关系的图数据和所述时间序列特征输入图卷积神经网络,根据所述图卷积神经网络的输出,得到多个所述账号之间的关联关系特征;对所述时间序列特征和所述关联关系特征进行组合,将特征组合结果输入风险预测模型,利用所述风险预测模型的输出确定各个所述账号的逾期风险概率。2.根据权利要求1所述的方法,其特征在于,所述对所述历史交易信息进行预处理,包括:对所述历史交易信息进行数据清洗,处理所述历史交易信息中的重复信息、缺失信息和异常信息;针对经过所述数据清洗后的所述历史交易信息,对数值变量进行归一化处理,并对分类变量进行独热编码;针对经过所述数据清洗后的所述历史交易信息,将数值变量的归一化值和分类变量的独热编码进行组合,得到包括各个所述账号的历史交易信息的预处理结果。3.根据权利要求2所述的方法,其特征在于,所述对数值变量进行归一化处理,包括:将所述数值变量与全部所述数值变量中的最小值之差作为分子,将全部所述数值变量中的最大值与最小值之差作为分母,计算各个所述数值变量的归一化值。4.根据权利要求2所述的方法,其特征在于,所述对分类变量进行独热编码,包括:将所述分类变量的变量值映射到整数值;利用二进制向量表示所述整数值,得到各个所述分类变量的独热编码。5.根据权利要求1所述的方法,其特征在于,所述提取各个所述账号的时间序列特征,包括:按照账号维度,将所述预处理结果进行扁平化;将每一个所述账号的扁平化数据输入预训练的行为特征模型;根据所述行为特征模型的输出,确定各个所述账号的时间序列特征。6.根据权利要求5所述的方法,其特征在于,所述行为特征模型采用LSTM网络、Bi

RNN网络或者GRU网络。7.根据权利要求6所述的方法,其特征在于,确定所述行为特征模型,包括:获取多个样本账号的样本交易特征和样本时间序列;将各个所述样本账号的所述样本交易特征作为行为特征模型的输入、所述样本时间序列作为所述行为特征模型的输出,对所述行为特征模型进行迭代训练;根据训练结果,生成所述行为特征模型。8.根据权利要求5所述的方法,其特征在...

【专利技术属性】
技术研发人员:聂砂王伊妍罗奕康戴菀庭丁苏苏
申请(专利权)人:建信金融科技有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1