【技术实现步骤摘要】
金融风险识别模型的训练方法、装置、计算机设备及介质
本专利技术涉及机器学习
,尤其是一种金融风险识别模型的训练方法、装置、计算机设备及介质。
技术介绍
近年来,人工智能技术飞速发展,基于机器学习的分类应用在多个领域取得了较大进展。传统的机器学习主要是单任务学习,即在给定任务的数据集上训练预测模型,这种方式存在着所需训练数据多、模型泛化能力差的缺陷。对于一些特定领域的分类任务,样本数据往往存在有标记不足的问题,例如金融风控领域中,一些新的项目并没有大量包含信用记录的用户数据,这可能导致模型的训练无法有效进行或者训练出的模型准确性不高,无法达到预期的使用效果。
技术实现思路
本专利技术的目的在于至少一定程度上解决现有技术中存在的技术问题之一。为此,本申请实施例的一个目的在于提供一种金融风险识别模型的训练方法,该方法通过迁移学习能够基于少量带信用风险标签的用户数据训练出针对目标域金融项目的识别模型,可提高模型的泛化性能。为了达到上述技术目的,本申请实施例所采取的技术方案包括:第一方面,本申请实施例提供了金融风险识别模型的训练方法,所述识别模型包括元学习器和分类器,所述训练方法包括以下步骤:获取目标域金融项目的第一用户数据和至少两个源域金融项目的第二用户数据;所述第一用户数据带有第一信用风险标签,所述第二用户数据带有第二信用风险标签;根据所述第二用户数据构造任务集;所述任务集中所述第二用户数据的类别包括具有信用风险类别和无信用风险类别;确定各个所述任务 ...
【技术保护点】
1.一种金融风险识别模型的训练方法,其特征在于,所述识别模型包括元学习器和分类器,所述训练方法包括以下步骤:/n获取目标域金融项目的第一用户数据和至少两个源域金融项目的第二用户数据;所述第一用户数据带有第一信用风险标签,所述第二用户数据带有第二信用风险标签;/n根据所述第二用户数据构造任务集;所述任务集中所述第二用户数据的类别包括具有信用风险类别和无信用风险类别;/n确定各个所述任务集的类别之间的距离标签;/n对所述第二用户数据进行预测,得到对应各个所述任务集的第一识别结果和所述类别之间的距离预测结果;/n根据所述第二信用风险标签和所述第一识别结果确定第一损失值,根据所述距离标签和所述距离预测结果确定第二损失值;/n根据所述第一损失值和所述第二损失值对所述元学习器的第一参数进行迭代训练,得到训练好的所述元学习器;/n将所述第一用户数据和所述第一信用风险标签输入训练好的所述元学习器进行训练,得到对应所述目标域金融项目的训练好的所述分类器。/n
【技术特征摘要】
1.一种金融风险识别模型的训练方法,其特征在于,所述识别模型包括元学习器和分类器,所述训练方法包括以下步骤:
获取目标域金融项目的第一用户数据和至少两个源域金融项目的第二用户数据;所述第一用户数据带有第一信用风险标签,所述第二用户数据带有第二信用风险标签;
根据所述第二用户数据构造任务集;所述任务集中所述第二用户数据的类别包括具有信用风险类别和无信用风险类别;
确定各个所述任务集的类别之间的距离标签;
对所述第二用户数据进行预测,得到对应各个所述任务集的第一识别结果和所述类别之间的距离预测结果;
根据所述第二信用风险标签和所述第一识别结果确定第一损失值,根据所述距离标签和所述距离预测结果确定第二损失值;
根据所述第一损失值和所述第二损失值对所述元学习器的第一参数进行迭代训练,得到训练好的所述元学习器;
将所述第一用户数据和所述第一信用风险标签输入训练好的所述元学习器进行训练,得到对应所述目标域金融项目的训练好的所述分类器。
2.根据权利要求1所述的方法,其特征在于:所述根据所述第二用户数据构造任务集,包括:
从至少两个所述源域金融项目中随机采样相同个数的所述第二用户数据,得到对应各个所述源域金融项目的任务集。
3.根据权利要求2所述的方法,其特征在于,根据所述任务集对应的所述源域金融项目是否相同,确定各个所述类别之间的所述距离标签。
4.根据权利要求1所述的方法,其特征在于,所述训练方法还包括以下步骤:
将所述第二用户数据输入至预分类模型,得到第二识别结果;所述预分类模型包括特征提取器和基分类器;
根据所述第二信用风险标签和所述第二识别结果确定第三损失值;
根据所述第三损失值对所述预分类模型的第二参数进行迭代训练,得到训练好的所述预分类模型;
将训练好的所述预分类模型的所述特征提取器配置到所述识别模型。
5.根据权利要求4所述的方法,其特征在于:所述任务集包括支持集;所述第一识别结果包括支持集识别结果;
所述对所述第二用户数据进行预测,得到对应各个所述任务集的第一识别结果,包括:
将各个所述支持集输入至所述元学习器,得到对应各个所述任务集的分类器;
通过对应的所述分类器对所述支持集进行分类,得到所述支持集识别结果。
6.根据权利要求5所述的方法,其特征在于:所述元学习器包括类编码器和域聚合器,所述域聚合器包括自适应聚合器和分类器生成器;
所述将各个所述支持集输入至所述元学习器,得到对应各个所述任务集的分类器,包括:
通过所述类编码器提取所述支持集的类特征嵌入向量;
根据所述基分类器的权重矩阵和所述类特征嵌入向量,通过所述自适应聚合器迁移所述权重矩阵,得到第一权重参数;
基于所述类特征嵌入向量,通过所述分类器生成器生成第二权重参数;
根据所述第一权重参数和所述第二权重参数,得到所述分类器。
7.根据权利要求6所述的方法,其特征在于:所述根据所述基分类器的权重矩阵和所述类特征嵌入向量,通过所述自适应聚合器迁移所述权重矩阵,包括:
确定所述权重矩阵和所述类特征嵌入向量的相似度;
根据所述相似度,确定所述权重矩阵的注意力得分;
根据所述注意力得分,通过所述自适应聚合器迁移所述权重矩阵。
8.根据权利要求7所述的方法,其特征在于:所述确定所述权重矩阵和所述类...
【专利技术属性】
技术研发人员:孙艺芙,蓝利君,赵雪尧,李超,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。