【技术实现步骤摘要】
本说明书涉及计算机,尤其涉及一种多任务学习方法、装置、存储介质及电子设备。
技术介绍
1、目前,多任务学习在许多领域中都是常见的模型训练的手段之一。在多任务学习中,可以是针对不同类型的数据产生的多任务的学习,也可以是针对相同类型的数据对应的不同标签产生的多任务的学习。
2、而对于相同类型的数据对应的不同标签产生的多任务学习,很容易出现泛化能力过差的问题。以风控场景为例,大多数情况下,一个样本对象通常只会存在一种风险,很难同时存在多种风险,这就导致样本对象的多风险标签的整体分布较为稀疏,进而导致在训练的过程中,模型的决策会过于向已知的风险靠拢,最终导致训练出的模型在判断对象是否存在多种不同的风险时准确率较低。
3、因此,如何在样本质量较差的情况下提高多任务学习的泛化能力是一个亟待解决的问题。
技术实现思路
1、本说明书提供一种多任务学习方法、装置、存储介质及电子设备,以至少部分地解决现有技术存在的上述问题。
2、本说明书采用下述技术方案:
3、
...【技术保护点】
1.一种多任务学习方法,包括:
2.如权利要求1所述的方法,所述样本数据为用户数据,所述目标模型为风控模型,所述子任务为判断用户是否存在指定类型的风险,不同的子任务判断用户存在的风险的类型不同。
3.如权利要求2所述的方法,所述样本数据在任一子任务下的标注包括用户是否存在该子任务所判断的类型的风险;所述候选数据在至少一个子任务下的标注为用户存在指定类型的风险。
4.如权利要求1所述的方法,对选择的各候选数据进行融合,得到虚拟样本数据,具体包括:
5.如权利要求1所述的方法,所述目标模型至少包括特征提取子网、输出子网;
...【技术特征摘要】
1.一种多任务学习方法,包括:
2.如权利要求1所述的方法,所述样本数据为用户数据,所述目标模型为风控模型,所述子任务为判断用户是否存在指定类型的风险,不同的子任务判断用户存在的风险的类型不同。
3.如权利要求2所述的方法,所述样本数据在任一子任务下的标注包括用户是否存在该子任务所判断的类型的风险;所述候选数据在至少一个子任务下的标注为用户存在指定类型的风险。
4.如权利要求1所述的方法,对选择的各候选数据进行融合,得到虚拟样本数据,具体包括:
5.如权利要求1所述的方法,所述目标模型至少包括特征提取子网、输出子网;
6.如权利要求5所述的方法,将所述待优化样本特征输入所述输出子网,得到所述输出子网输出的所述虚拟样本数据在每个子任务下的输出结果,具体包括:
7.如权利要求6所述的方法,预先确定标准特征,具体包括:
8.如权利要求7所述的方法,确定所述待优化样本特征与该子任务下预设的标准特征之间的距离,并根据所述距离输出该子任务下的输出结果,具体包括:
9.如权利要求5所述的方法,所述特征提取子网中存在若干网络层;
10.一种多任务学习装置,包括:
11.如权利要求10所述的装置,所述样本数据为用户数据,所述目标模型为风控模型,所述子任务为判断用户是否存在指定类型的风险,不同的子任务判断用户存在的风险的类型不同。
12.如权利要求11所述的装置,所述样本数据在任一子任务下的标注包括用户是否存在该子任务所判断的类型的风险;所述候选数据在至少一个子任务下的标注为用户存在指定类型的风险。
13.如权利要求10所述的装置,所述数据融合模块,具体用于对选择的各候选数...
【专利技术属性】
技术研发人员:刘芳卿,
申请(专利权)人:支付宝杭州信息技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。