金融风险识别模型的训练方法、装置、计算机设备及介质制造方法及图纸

技术编号:25804550 阅读:28 留言:0更新日期:2020-09-29 18:38
本申请公开了一种金融风险识别模型的训练方法、装置、计算机设备及介质,该训练方法获取目标域金融项目带有第一信用风险标签的第一用户数据输入元学习器进行训练,得到对应目标域金融项目的分类器进行风险识别。本申请通过使用元学习的方式训练对应目标域金融项目的分类器,能够有效迁移源域任务中的先验知识,使得模型训练所需的带标签样本数据量小,提高了识别模型的泛化性能,且模型的训练过程更加快速高效。另外,本申请在元学习器的训练过程中,对各个任务集的类别之间的源域相关性进行了学习,能够使得迁移学习时有效地从和本次目标域任务更接近的任务中迁移先验知识,可提高模型识别的准确性。本申请可广泛应用于机器学习技术领域。

【技术实现步骤摘要】
金融风险识别模型的训练方法、装置、计算机设备及介质
本专利技术涉及机器学习
,尤其是一种金融风险识别模型的训练方法、装置、计算机设备及介质。
技术介绍
近年来,人工智能技术飞速发展,基于机器学习的分类应用在多个领域取得了较大进展。传统的机器学习主要是单任务学习,即在给定任务的数据集上训练预测模型,这种方式存在着所需训练数据多、模型泛化能力差的缺陷。对于一些特定领域的分类任务,样本数据往往存在有标记不足的问题,例如金融风控领域中,一些新的项目并没有大量包含信用记录的用户数据,这可能导致模型的训练无法有效进行或者训练出的模型准确性不高,无法达到预期的使用效果。
技术实现思路
本专利技术的目的在于至少一定程度上解决现有技术中存在的技术问题之一。为此,本申请实施例的一个目的在于提供一种金融风险识别模型的训练方法,该方法通过迁移学习能够基于少量带信用风险标签的用户数据训练出针对目标域金融项目的识别模型,可提高模型的泛化性能。为了达到上述技术目的,本申请实施例所采取的技术方案包括:第一方面,本申请实施例提供了金融风险识别模型的训练方法,所述识别模型包括元学习器和分类器,所述训练方法包括以下步骤:获取目标域金融项目的第一用户数据和至少两个源域金融项目的第二用户数据;所述第一用户数据带有第一信用风险标签,所述第二用户数据带有第二信用风险标签;根据所述第二用户数据构造任务集;所述任务集中所述第二用户数据的类别包括具有信用风险类别和无信用风险类别;确定各个所述任务集的类别之间的距离标签;对所述第二用户数据进行预测,得到对应各个所述任务集的第一识别结果和所述类别之间的距离预测结果;根据所述第二信用风险标签和所述第一识别结果确定第一损失值,根据所述距离标签和所述距离预测结果确定第二损失值;根据所述第一损失值和所述第二损失值对所述元学习器的第一参数进行迭代训练,得到训练好的所述元学习器;将所述第一用户数据和所述第一信用风险标签输入训练好的所述元学习器进行训练,得到对应所述目标域金融项目的训练好的所述分类器。第二方面,本申请实施例提供了一种金融风险识别方法,包括以下步骤:获取目标域金融项目的用户数据;将所述用户数据输入到通过如第一方面所述的训练方法所得到的识别模型进行预测,得到所述识别模型输出的识别结果。第三方面,本申请实施例提供了一种金融风险识别模型的训练装置,所述识别模型包括元学习器和分类器,所述训练装置包括:第一获取模块,用于获取目标域金融项目的第一用户数据和至少两个源域金融项目的第二用户数据;所述第一用户数据带有第一信用风险标签,所述第二用户数据带有第二信用风险标签;任务集构造模块,用于根据所述第二用户数据构造任务集;所述任务集中所述第二用户数据的类别包括具有信用风险类别和无信用风险类别;距离标签确定模块,用于确定各个所述任务集的类别之间的距离标签;预测模块,用于对所述第二用户数据进行预测,得到对应各个所述任务集的第一识别结果和所述类别之间的距离预测结果;损失值确定模块,用于根据所述第二信用风险标签和所述第一识别结果确定第一损失值,根据所述距离标签和所述距离预测结果确定第二损失值;第一训练模块,用于根据所述第一损失值和所述第二损失值对所述元学习器的第一参数进行迭代训练,得到训练好的所述元学习器;第二训练模块,用于将所述第一用户数据和所述第一信用风险标签输入训练好的所述元学习器进行训练,得到对应所述目标域金融项目的训练好的所述分类器。第四方面,本申请实施例提供了一种金融风险识别装置,包括:第二获取模块,用于获取目标域金融项目的用户数据;识别模块,用于采用如第一方面所述的训练方法所得到的识别模型对所述用户数据进行预测,得到识别结果。第五方面,本申请实施例提供了一种计算机设备,包括:至少一个处理器;至少一个存储器,用于存储至少一个程序;当所述至少一个程序被所述至少一个处理器执行时,使得所述至少一个处理器实现第一方面所述的金融风险识别模型的训练方法或者第二方面所述的金融风险识别方法。第六方面,本申请实施例还提供了一种计算机可读存储介质,其中存储有处理器可执行的程序,所述处理器可执行的程序在由处理器执行时用于实现第一方面所述的金融风险识别模型的训练方法或者第二方面所述的金融风险识别方法。本专利技术的优点和有益效果将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本专利技术的实践了解到:本申请金融风险识别模型的训练方法中,识别模型包括元学习器和分类器,该方法获取目标域金融项目带有第一信用风险标签的第一用户数据输入元学习器进行训练,得到对应目标域金融项目的分类器进行风险识别;本申请通过使用元学习的方式训练对应目标域金融项目的分类器,能够有效迁移源域任务中的先验知识为本次识别任务所用,使得模型训练所需的带标签样本数据量小,提高了识别模型的泛化性能,且模型的训练过程更加快速高效。另外,本申请在元学习器的训练过程中,对各个任务集的类别之间的源域相关性进行了学习,能够使得迁移学习时有效地从和本次任务更接近的任务中迁移先验知识,可提高模型识别的准确性。附图说明为了更清楚地说明本申请实施例或者现有技术中的技术方案,下面对本申请实施例或者现有技术中的相关技术方案附图作以下介绍,应当理解的是,下面介绍中的附图仅仅为了方便清晰表述本专利技术的技术方案中的部分实施例,对于本领域的技术人员来说,在无需付出创造性劳动的前提下,还可以根据这些附图获取到其他附图。图1为机器学习模型基于不同的训练数据集进行分类任务的示意图;图2为本申请实施例中提供的一种分类模型的训练方法的流程示意图;图3为本申请实施例中提供的一种分类模型的训练方法的预训练阶段和元学习训练阶段示意图;图4为本申请实施例中提供的一种分类模型的训练方法的预训练阶段的第一种流程示意图;图5为本申请实施例中提供的一种分类模型的训练方法的预训练阶段的第二种流程示意图;图6为本申请实施例中提供的一种分类模型的元学习器的结构示意图;图7为本申请实施例中提供的一种分类模型的用于元学习器训练的任务集获取示意图;图8为本申请实施例中提供的一种分类模型的训练方法的元学习训练阶段的流程图;图9为本申请实施例中提供的一种分类方法的流程示意图;图10为本申请实施例中提供的一种金融风险识别模型的训练方法的流程示意图;图11为本申请实施例中提供的一种金融风险识别方法的流程示意图;图12为本申请实施例中提供的一种金融风控信息的显示方法的流程示意图;图13为本申请实施例中提供的一种应用金融风控信息的显示方法的终端设备显示界面示意图;图14为本申请实施例中提供的一种金融风险识别模型的训练装置的结构示意图;图15为本申请实施例中提供的一种金融风险识别装置的结构示意图;图16本文档来自技高网...

【技术保护点】
1.一种金融风险识别模型的训练方法,其特征在于,所述识别模型包括元学习器和分类器,所述训练方法包括以下步骤:/n获取目标域金融项目的第一用户数据和至少两个源域金融项目的第二用户数据;所述第一用户数据带有第一信用风险标签,所述第二用户数据带有第二信用风险标签;/n根据所述第二用户数据构造任务集;所述任务集中所述第二用户数据的类别包括具有信用风险类别和无信用风险类别;/n确定各个所述任务集的类别之间的距离标签;/n对所述第二用户数据进行预测,得到对应各个所述任务集的第一识别结果和所述类别之间的距离预测结果;/n根据所述第二信用风险标签和所述第一识别结果确定第一损失值,根据所述距离标签和所述距离预测结果确定第二损失值;/n根据所述第一损失值和所述第二损失值对所述元学习器的第一参数进行迭代训练,得到训练好的所述元学习器;/n将所述第一用户数据和所述第一信用风险标签输入训练好的所述元学习器进行训练,得到对应所述目标域金融项目的训练好的所述分类器。/n

【技术特征摘要】
1.一种金融风险识别模型的训练方法,其特征在于,所述识别模型包括元学习器和分类器,所述训练方法包括以下步骤:
获取目标域金融项目的第一用户数据和至少两个源域金融项目的第二用户数据;所述第一用户数据带有第一信用风险标签,所述第二用户数据带有第二信用风险标签;
根据所述第二用户数据构造任务集;所述任务集中所述第二用户数据的类别包括具有信用风险类别和无信用风险类别;
确定各个所述任务集的类别之间的距离标签;
对所述第二用户数据进行预测,得到对应各个所述任务集的第一识别结果和所述类别之间的距离预测结果;
根据所述第二信用风险标签和所述第一识别结果确定第一损失值,根据所述距离标签和所述距离预测结果确定第二损失值;
根据所述第一损失值和所述第二损失值对所述元学习器的第一参数进行迭代训练,得到训练好的所述元学习器;
将所述第一用户数据和所述第一信用风险标签输入训练好的所述元学习器进行训练,得到对应所述目标域金融项目的训练好的所述分类器。


2.根据权利要求1所述的方法,其特征在于:所述根据所述第二用户数据构造任务集,包括:
从至少两个所述源域金融项目中随机采样相同个数的所述第二用户数据,得到对应各个所述源域金融项目的任务集。


3.根据权利要求2所述的方法,其特征在于,根据所述任务集对应的所述源域金融项目是否相同,确定各个所述类别之间的所述距离标签。


4.根据权利要求1所述的方法,其特征在于,所述训练方法还包括以下步骤:
将所述第二用户数据输入至预分类模型,得到第二识别结果;所述预分类模型包括特征提取器和基分类器;
根据所述第二信用风险标签和所述第二识别结果确定第三损失值;
根据所述第三损失值对所述预分类模型的第二参数进行迭代训练,得到训练好的所述预分类模型;
将训练好的所述预分类模型的所述特征提取器配置到所述识别模型。


5.根据权利要求4所述的方法,其特征在于:所述任务集包括支持集;所述第一识别结果包括支持集识别结果;
所述对所述第二用户数据进行预测,得到对应各个所述任务集的第一识别结果,包括:
将各个所述支持集输入至所述元学习器,得到对应各个所述任务集的分类器;
通过对应的所述分类器对所述支持集进行分类,得到所述支持集识别结果。


6.根据权利要求5所述的方法,其特征在于:所述元学习器包括类编码器和域聚合器,所述域聚合器包括自适应聚合器和分类器生成器;
所述将各个所述支持集输入至所述元学习器,得到对应各个所述任务集的分类器,包括:
通过所述类编码器提取所述支持集的类特征嵌入向量;
根据所述基分类器的权重矩阵和所述类特征嵌入向量,通过所述自适应聚合器迁移所述权重矩阵,得到第一权重参数;
基于所述类特征嵌入向量,通过所述分类器生成器生成第二权重参数;
根据所述第一权重参数和所述第二权重参数,得到所述分类器。


7.根据权利要求6所述的方法,其特征在于:所述根据所述基分类器的权重矩阵和所述类特征嵌入向量,通过所述自适应聚合器迁移所述权重矩阵,包括:
确定所述权重矩阵和所述类特征嵌入向量的相似度;
根据所述相似度,确定所述权重矩阵的注意力得分;
根据所述注意力得分,通过所述自适应聚合器迁移所述权重矩阵。


8.根据权利要求7所述的方法,其特征在于:所述确定所述权重矩阵和所述类...

【专利技术属性】
技术研发人员:孙艺芙蓝利君赵雪尧李超
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1