风险预测模型的训练方法及装置、计算机可读存储介质制造方法及图纸

技术编号:37292581 阅读:11 留言:0更新日期:2023-04-21 03:23
本公开涉及风险预测模型的训练方法及装置、计算机可读存储介质,涉及人工智能领域。风险预测模型的训练方法包括:获取多个训练样本,其中,每个训练样本包括风险标签和用户特征,多个训练样本中至少一个训练样本的风险标签包括在第一时间窗口生成的第一风险标签和在第二时间窗口生成的第二风险标签,第一时间窗口的长度大于第二时间窗口的长度;针对每个训练样本,根据用户特征,利用风险预测模型生成风险预测结果;根据多个训练样本的风险预测结果和对应的风险标签,训练风险预测模型。根据本公开的风险预测模型的训练方法,能够同时提高风险预测模型在长期风险预测和短期风险预测上的准确率。预测上的准确率。预测上的准确率。

【技术实现步骤摘要】
风险预测模型的训练方法及装置、计算机可读存储介质


[0001]本公开涉及互联网
,特别涉及风险预测模型的训练方法、风险预测方法及装置、电子设备、计算机可读存储介质。

技术介绍

[0002]随着互联网和通信技术的高速发展,传统的风险控制方式已逐渐不能支撑风险预测需求,而互联网技术对多维度、大量数据的智能处理,批量标准化的执行流程,更能贴合信息发展时代风险控制的发展要求。在互联网
中,通过建立各种风险预测模型,学习用户的行为模式,挖掘海量数据中存在的价值,进而达到合理规避风险的目的。
[0003]互联网中的风险是指:用户未能履行约定契约中的义务,而造成损失的风险。相关技术中,通过建立风险预测模型,从用户特征中学习规律,预测用户是否存在违约风险,从而对用户进行风险控制和风险提示,规避用户违约的风险。

技术实现思路

[0004]根据本公开的第一方面,提供了一种风险预测模型的训练方法,包括:
[0005]获取多个训练样本,其中,每个训练样本包括风险标签和用户特征,多个训练样本中至少一个训练样本的风险标签包括在第一时间窗口生成的第一风险标签和在第二时间窗口生成的第二风险标签,第一时间窗口的长度大于第二时间窗口的长度;
[0006]针对每个训练样本,根据用户特征,利用风险预测模型生成风险预测结果,其中,所述至少一个训练样本的风险预测结果包括第一风险标签对应的第一风险预测任务的预测结果和第二风险标签对应的第二风险预测任务的预测结果;
[0007]根据多个训练样本的风险预测结果和对应的风险标签,训练风险预测模型。
[0008]在一些实施例中,根据多个训练样本的风险预测结果和对应的风险标签,训练风险预测模型,包括:
[0009]对于所述至少一个训练样本中的每个训练样本,根据第一风险标签、第二风险标签、第一风险预测任务的预测结果和第二风险预测任务的预测结果,计算所述至少一个训练样本中的每个训练样本的损失函数;
[0010]根据多个训练样本的损失函数,训练风险预测模型。
[0011]在一些实施例中,对于所述至少一个训练样本中的每个训练样本,根据第一风险标签、第二风险标签、第一风险预测任务的预测结果和第二风险预测任务的预测结果,计算所述至少一个训练样本中的每个训练样本的损失函数,包括:
[0012]对于所述至少一个训练样本中的每个训练样本,根据第一风险标签和第一风险预测任务的预测结果,计算所述至少一个训练样本中的每个训练样本的第一损失函数;
[0013]对于所述至少一个训练样本中的每个训练样本,根据第二风险标签和第二风险预测任务的预测结果,计算所述至少一个训练样本中的每个训练样本的第二损失函数;
[0014]根据所述至少一个训练样本中的每个训练样本的第一损失函数和第二损失函数,
计算所述至少一个训练样本中的每个训练样本的损失函数。
[0015]在一些实施例中,根据所述至少一个训练样本中的每个训练样本的第一损失函数和第二损失函数,计算所述至少一个训练样本中的每个训练样本的损失函数,包括:
[0016]根据所述至少一个训练样本中的每个训练样本的第一损失函数和第二损失函数之和,计算所述至少一个训练样本中的每个训练样本的损失函数。
[0017]在一些实施例中,所述至少一个训练样本的用户特征在指定时间提取,第一时间窗口为从指定时间到第一时间的时间窗口,第二时间窗口为从指定时间到第二时间的时间窗口。
[0018]在一些实施例中,风险预测模型的训练方法还包括以下至少一项:
[0019]用默认值填充用户特征中的缺失值;
[0020]用均值填充法填充用户特征中的缺失值;
[0021]用就近补齐法填充用户特征中的缺失值;
[0022]用最近邻法填充用户特征中的缺失值;
[0023]用多重插补法填充用户特征中的缺失值。
[0024]在一些实施例中,风险预测模型的训练方法还包括筛除以下至少一种用户特征:
[0025]缺失率大于第一阈值的用户特征;
[0026]对训练样本的区分度低于第二阈值的用户特征;
[0027]方差大于第三阈值的用户特征。
[0028]在一些实施例中,风险预测模型的训练方法还包括:
[0029]对用户特征进行离散化处理。
[0030]在一些实施例中,风险预测模型的训练方法还包括:
[0031]利用验证样本,验证风险预测模型,其中,验证样本与训练样本生成的时间不同。
[0032]在一些实施例中,风险预测模型为多任务深度神经网络模型或树模型。
[0033]根据本公开的第二方面,提供了一种风险预测方法,包括:
[0034]根据目标用户的用户特征,利用风险预测模型生成对目标用户的风险预测结果,其中,风险预测模型根据本公开任一实施例所述的风险预测模型的训练方法训练得到。
[0035]根据本公开的第三方面,提供了一种风险预测模型的训练装置,包括:
[0036]获取模块,获取多个训练样本,其中,每个训练样本包括风险标签和用户特征,多个训练样本中至少一个训练样本的风险标签包括在第一时间窗口生成的第一风险标签和在第二时间窗口生成的第二风险标签,第一时间窗口的长度大于第二时间窗口的长度;
[0037]生成模块,针对每个训练样本,根据用户特征,利用风险预测模型生成风险预测结果,其中,所述至少一个训练样本的风险预测结果包括第一风险标签对应的第一风险预测任务的预测结果和第二风险标签对应的第二风险预测任务的预测结果;
[0038]训练模块,根据多个训练样本的风险预测结果和对应的风险标签,训练风险预测模型。
[0039]根据本公开的第四方面,提供了一种风险预测装置,包括:生成模块,被配置为根据目标用户的用户特征,利用风险预测模型生成对目标用户的风险预测结果,其中,风险预测模型根据本公开任一实施例所述的风险预测模型的训练装置训练得到。
[0040]根据本公开的第五方面,提供了一种电子设备,包括:
[0041]存储器;以及
[0042]耦接至所述存储器的处理器,所述处理器被配置为基于存储在所述存储器的指令,执行根据本公开任一实施例所述的风险预测模型的训练方法,或根据本公开任一实施例所述的风险预测方法。
[0043]根据本公开的第六方面,提供了一种计算机可读存储介质,其上存储有计算机程序指令,该指令被处理器执行时,实现根据本公开任一实施例所述的风险预测模型的训练方法,或根据本公开任一实施例所述的风险预测方法。
附图说明
[0044]构成说明书的一部分的附图描述了本公开的实施例,并且连同说明书一起用于解释本公开的原理。
[0045]参照附图,根据下面的详细描述,可以更加清楚地理解本公开,其中:
[0046]图1示出根据本公开一些实施例的风险预测模型的训练方法的流程图;
[0047]图2示出根据本公开一些实施例的风险预测标签和用本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种风险预测模型的训练方法,包括:获取多个训练样本,其中,每个训练样本包括风险标签和用户特征,多个训练样本中至少一个训练样本的风险标签包括在第一时间窗口生成的第一风险标签和在第二时间窗口生成的第二风险标签,第一时间窗口的长度大于第二时间窗口的长度;针对每个训练样本,根据用户特征,利用风险预测模型生成风险预测结果,其中,所述至少一个训练样本的风险预测结果包括第一风险标签对应的第一风险预测任务的预测结果和第二风险标签对应的第二风险预测任务的预测结果;根据多个训练样本的风险预测结果和对应的风险标签,训练风险预测模型。2.根据权利要求1所述的风险预测模型的训练方法,其中,根据多个训练样本的风险预测结果和对应的风险标签,训练风险预测模型,包括:对于所述至少一个训练样本中的每个训练样本,根据第一风险标签、第二风险标签、第一风险预测任务的预测结果和第二风险预测任务的预测结果,计算所述至少一个训练样本中的每个训练样本的损失函数;根据多个训练样本的损失函数,训练风险预测模型。3.根据权利要求2所述的风险预测模型的训练方法,其中,对于所述至少一个训练样本中的每个训练样本,根据第一风险标签、第二风险标签、第一风险预测任务的预测结果和第二风险预测任务的预测结果,计算所述至少一个训练样本中的每个训练样本的损失函数,包括:对于所述至少一个训练样本中的每个训练样本,根据第一风险标签和第一风险预测任务的预测结果,计算所述至少一个训练样本中的每个训练样本的第一损失函数;对于所述至少一个训练样本中的每个训练样本,根据第二风险标签和第二风险预测任务的预测结果,计算所述至少一个训练样本中的每个训练样本的第二损失函数;根据所述至少一个训练样本中的每个训练样本的第一损失函数和第二损失函数,计算所述至少一个训练样本中的每个训练样本的损失函数。4.根据权利要求3所述的风险预测模型的训练方法,其中,根据所述至少一个训练样本中的每个训练样本的第一损失函数和第二损失函数,计算所述至少一个训练样本中的每个训练样本的损失函数,包括:根据所述至少一个训练样本中的每个训练样本的第一损失函数和第二损失函数之和,计算所述至少一个训练样本中的每个训练样本的损失函数。5.根据权利要求1至4任一项所述的风险预测模型的训练方法,其中,所述至少一个训练样本的用户特征在指定时间提取,第一时间窗口为从指定时间到第一时间的时间窗口,第二时间窗口为从指定时间到第二时间的时间窗口。6.根据权利要求1至4任一项所述的风险预测模型的训练方法,还...

【专利技术属性】
技术研发人员:范昊杨恺李娴郑邦祺黄志翔
申请(专利权)人:京东科技控股股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1