一种多任务学习方法、装置、存储介质及电子设备制造方法及图纸

技术编号：40539233 阅读：8 留言：0更新日期：2024-03-05 18:54

本说明书公开了一种多任务学习方法、装置、存储介质及电子设备。在本说明书提供的多任务学习方法中，获取样本数据以及所述样本数据在各子任务下的标注；在所述样本数据中选择若干候选数据；对选择的各候选数据进行融合，得到虚拟样本数据；针对每个子任务，将各候选数据在该子任务下的标注融合，得到所述虚拟样本数据在该子任务下的标注；采用所述虚拟样本数据以及所述虚拟样本数据在每个子任务下的标注，对目标模型进行训练。

全部详细技术资料下载

【技术实现步骤摘要】

本说明书涉及计算机，尤其涉及一种多任务学习方法、装置、存储介质及电子设备。

技术介绍

1、目前，多任务学习在许多领域中都是常见的模型训练的手段之一。在多任务学习中，可以是针对不同类型的数据产生的多任务的学习，也可以是针对相同类型的数据对应的不同标签产生的多任务的学习。

2、而对于相同类型的数据对应的不同标签产生的多任务学习，很容易出现泛化能力过差的问题。以风控场景为例，大多数情况下，一个样本对象通常只会存在一种风险，很难同时存在多种风险，这就导致样本对象的多风险标签的整体分布较为稀疏，进而导致在训练的过程中，模型的决策会过于向已知的风险靠拢，最终导致训练出的模型在判断对象是否存在多种不同的风险时准确率较低。

3、因此，如何在样本质量较差的情况下提高多任务学习的泛化能力是一个亟待解决的问题。

技术实现思路

1、本说明书提供一种多任务学习方法、装置、存储介质及电子设备，以至少部分地解决现有技术存在的上述问题。

2、本说明书采用下述技术方案：

3、本说明书提供了一种多任务学习方法，包括：

4、获取样本数据以及所述样本数据在各子任务下的标注；

5、在所述样本数据中选择若干候选数据；

6、对选择的各候选数据进行融合，得到虚拟样本数据；

7、针对每个子任务，将各候选数据在该子任务下的标注融合，得到所述虚拟样本数据在该子任务下的标注；

8、采用所述虚拟样本数据以及所述虚拟样本数据在每个子任

9、可选地，所述样本数据为用户数据，所述目标模型为风控模型，所述子任务为判断用户是否存在指定类型的风险，不同的子任务判断用户存在的风险的类型不同。

10、可选地，所述样本数据在任一子任务下的标注包括用户是否存在该子任务所判断的类型的风险；所述候选数据在至少一个子任务下的标注为用户存在指定类型的风险。

11、可选地，对选择的各候选数据进行融合，得到虚拟样本数据，具体包括：

12、对选择的各候选数据进行插值处理，得到虚拟样本数据；

13、将各候选数据在该子任务下的标注融合，得到所述虚拟样本数据在该子任务下的标注，具体包括：

14、对各候选数据在该子任务下的标注进行插值处理，得到所述虚拟样本数据在该子任务下的标注。

15、可选地，所述目标模型至少包括特征提取子网、输出子网；

16、采用所述虚拟样本数据以及所述虚拟样本数据在每个子任务下的标注，对目标模型进行训练，具体包括：

17、将所述虚拟样本数据输入待训练的目标模型；

18、通过所述特征提取子网提取所述虚拟样本数据的待优化样本特征；

19、将所述待优化样本特征输入所述输出子网，得到所述输出子网输出的所述虚拟样本数据在每个子任务下的输出结果；

20、以所述虚拟样本数据在每个子任务下的输出结果与所述虚拟样本数据在每个子任务下的标注之间的差异最小为优化目标，对所述目标模型进行训练。

21、可选地，将所述待优化样本特征输入所述输出子网，得到所述输出子网输出的所述虚拟样本数据在每个子任务下的输出结果，具体包括：

22、将所述待优化样本特征输入所述输出子网，以使所述输出子网针对每个子任务，确定所述待优化样本特征与该子任务下预设的标准特征之间的距离，并根据所述距离输出该子任务下的输出结果。

23、可选地，预先确定标准特征，具体包括：

24、针对每个子任务，将所述样本数据中在该子任务下的标注为第一类标注的样本数据确定为第一样本数据，将所述第一样本数据输入所述目标模型的提取子网，并根据所述提取子网输出的所述第一样本数据的第一特征，确定该子任务的第一标准特征；并，

25、将所述样本数据中在该子任务下的标注为第二类标注的样本数据确定为第二样本数据，将所述第二样本数据输入所述目标模型的提取子网，并根据所述提取子网输出的所述第二样本数据的第二特征，确定该子任务的第二标准特征。

26、可选地，确定所述待优化样本特征与该子任务下预设的标准特征之间的距离，并根据所述距离输出该子任务下的输出结果，具体包括：

27、确定所述待优化样本特征与该子任务的第一标准特征之间的第一距离以及所述待优化样本特征与该子任务的第二标准特征之间的第二距离；

28、根据所述第一距离、所述第二距离以及预设的平衡参数，确定该子任务下的输出结果。

29、可选地，所述特征提取子网中存在若干网络层；

30、在对目标模型进行训练之前，所述方法还包括：

31、将选择的各候选数据输入目标模型的特征提取子网；

32、在所述若干网络层中选择一个指定网络层，将所述指定网络层输出的所述各候选数据的中间特征进行插值处理，得到所述虚拟样本数据的虚拟中间特征；

33、通过所述特征提取子网继续处理所述虚拟中间特征，得到所述虚拟样本数据的虚拟样本特征；

34、采用所述虚拟样本数据以及所述虚拟样本数据在每个子任务下的标注，对目标模型进行训练，具体包括：

35、采用所述虚拟样本数据的虚拟样本特征以及所述虚拟样本数据在每个子任务下的标注，对目标模型进行训练。

36、本说明书提供了一种多任务学习装置，包括：

37、获取模块，用于获取样本数据以及所述样本数据在各子任务下的标注；

38、选择模块，用于在所述样本数据中选择若干候选数据；

39、数据融合模块，用于对选择的各候选数据进行融合，得到虚拟样本数据；

40、标注融合模块，用于针对每个子任务，将各候选数据在该子任务下的标注融合，得到所述虚拟样本数据在该子任务下的标注；

41、训练模块，用于采用所述虚拟样本数据以及所述虚拟样本数据在每个子任务下的标注，对目标模型进行训练。

42、可选地，所述样本数据为用户数据，所述目标模型为风控模型，所述子任务为判断用户是否存在指定类型的风险，不同的子任务判断用户存在的风险的类型不同。

43、可选地，所述样本数据在任一子任务下的标注包括用户是否存在该子任务所判断的类型的风险；所述候选数据在至少一个子任务下的标注为用户存在指定类型的风险。

44、可选地，所述数据融合模块，具体用于对选择的各候选数据进行插值处理，得到虚拟样本数据；

45、所述标注融合模块，具体用于对各候选数据在该子任务下的标注进行插值处理，得到所述虚拟样本数据在该子任务下的标注。

46、可选地，所述目标模型至少包括特征提取子网、输出子网；

47、所述训练模块，具体用于将所述虚拟样本数据输入待训练的目标模型；通过所述特征提取子网提取所述虚拟样本数据的待优化样本特征；将所述待优化样本特征输入所述输出子网，得到所述输出子网输出的所述虚拟样本数据在每个子任务本文档来自技高网...

【技术保护点】

1.一种多任务学习方法，包括：

2.如权利要求1所述的方法，所述样本数据为用户数据，所述目标模型为风控模型，所述子任务为判断用户是否存在指定类型的风险，不同的子任务判断用户存在的风险的类型不同。

3.如权利要求2所述的方法，所述样本数据在任一子任务下的标注包括用户是否存在该子任务所判断的类型的风险；所述候选数据在至少一个子任务下的标注为用户存在指定类型的风险。

4.如权利要求1所述的方法，对选择的各候选数据进行融合，得到虚拟样本数据，具体包括：

5.如权利要求1所述的方法，所述目标模型至少包括特征提取子网、输出子网；

6.如权利要求5所述的方法，将所述待优化样本特征输入所述输出子网，得到所述输出子网输出的所述虚拟样本数据在每个子任务下的输出结果，具体包括：

7.如权利要求6所述的方法，预先确定标准特征，具体包括：

8.如权利要求7所述的方法，确定所述待优化样本特征与该子任务下预设的标准特征之间的距离，并根据所述距离输出该子任务下的输出结果，具体包括：

9.如权利要求5所述的方法，所述特

10.一种多任务学习装置，包括：

11.如权利要求10所述的装置，所述样本数据为用户数据，所述目标模型为风控模型，所述子任务为判断用户是否存在指定类型的风险，不同的子任务判断用户存在的风险的类型不同。

12.如权利要求11所述的装置，所述样本数据在任一子任务下的标注包括用户是否存在该子任务所判断的类型的风险；所述候选数据在至少一个子任务下的标注为用户存在指定类型的风险。

13.如权利要求10所述的装置，所述数据融合模块，具体用于对选择的各候选数据进行插值处理，得到虚拟样本数据；

14.如权利要求10所述的装置，所述目标模型至少包括特征提取子网、输出子网；

15.如权利要求14所述的装置，所述训练模块，具体用于将所述待优化样本特征输入所述输出子网，以使所述输出子网针对每个子任务，确定所述待优化样本特征与该子任务下预设的标准特征之间的距离，并根据所述距离输出该子任务下的输出结果。

16.如权利要求15所述的装置，所述装置还包括预先确定模块，具体用于针对每个子任务，将所述样本数据中在该子任务下的标注为第一类标注的样本数据确定为第一样本数据，将所述第一样本数据输入所述目标模型的提取子网，并根据所述提取子网输出的所述第一样本数据的第一特征，确定该子任务的第一标准特征；并，将所述样本数据中在该子任务下的标注为第二类标注的样本数据确定为第二样本数据，将所述第二样本数据输入所述目标模型的提取子网，并根据所述提取子网输出的所述第二样本数据的第二特征，确定该子任务的第二标准特征。

17.如权利要求16所述的装置，所述训练模块，具体用于确定所述待优化样本特征与该子任务的第一标准特征之间的第一距离以及所述待优化样本特征与该子任务的第二标准特征之间的第二距离；根据所述第一距离、所述第二距离以及预设的平衡参数，确定该子任务下的输出结果。

18.如权利要求14所述的装置，所述特征提取子网中存在若干网络层；

19.一种计算机可读存储介质，所述存储介质存储有计算机程序，所述计算机程序被处理器执行时实现上述权利要求1～9任一项所述的方法。

20.一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现上述权利要求1～9任一项所述的方法。

...

【技术特征摘要】

1.一种多任务学习方法，包括：

4.如权利要求1所述的方法，对选择的各候选数据进行融合，得到虚拟样本数据，具体包括：

5.如权利要求1所述的方法，所述目标模型至少包括特征提取子网、输出子网；

7.如权利要求6所述的方法，预先确定标准特征，具体包括：

9.如权利要求5所述的方法，所述特征提取子网中存在若干网络层；

10.一种多任务学习装置，包括：

13.如权利要求10所述的装置，所述数据融合模块，具体用于对选择的各候选数...

【专利技术属性】
技术研发人员：刘芳卿，
申请(专利权)人：支付宝杭州信息技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人