多任务学习模型的预测方法及装置制造方法及图纸

技术编号：30142839 阅读：21 留言：0更新日期：2021-09-23 15:09

本公开提供了一种多任务学习模型的预测方法及装置，所述方法包括：利用掩码对嵌入向量进行加权，得到加权后的嵌入向量；将加权后的嵌入向量输入第一子网络层和第三子网络层，得到第一子网络层的第一输出向量和第三子网络层的第二输出向量；将第一输出向量和第二输出向量输入第二子网络层进行处理，得到第三输出向量，处理包括利用第二子网络层的中的第一编码变量对第一输出向量进行计算，利用第二子网络层的中的第二编码变量对第二输出向量进行计算，其中第一编码变量指示第一子网络层中神经元与第三子网络层中神经元之间的连接关系，第二编码变量指示第二子网络层中神经元与第三子网络层中神经元之间的连接关系。第三子网络层中神经元之间的连接关系。第三子网络层中神经元之间的连接关系。

全部详细技术资料下载

【技术实现步骤摘要】
多任务学习模型的预测方法及装置

[0001]本公开涉及机器学习
，尤其涉及一种多任务学习模型的预测方法、使用方法及装置。

技术介绍

[0002]多任务学习模型可以在机器学习过程中实现多个任务的参数共享，从而实现了多个任务共同学习。当任务之间的相关性较弱时，多任务学习的学习效果较差。针对该问题，基于子网络路由的多任务学习模型包括编码变量，编码变量用于对多任务学习模型中的子网络层之间的连接关系进行编码，实现了子网络层间的稀疏连接，从而减小相关性较低的任务之间的参数共享，进而提高了相关性较弱的多任务学习效果。

技术实现思路

[0003]有鉴于此，本公开提供了一种多任务学习模型的预测方法及装置，以进一步改善多任务学习的学习效果。
[0004]第一方面，本公开提供了一种多任务学习模型的预测方法，所述多任务学习模型包括嵌入层、第一任务子网络、第二任务子网络以及任务共享子网络，所述第一任务子网络包括第一子网络层和第二子网络层，所述任务共享子网络包括第三子网络层；所述方法包括：将待处理的任务数据输入所述嵌入层，得到所述嵌入层的嵌入向量；利用掩码对所述嵌入向量进行加权，得到加权后的嵌入向量；将所述加权后的嵌入向量输入所述第一子网络层和所述第三子网络层，得到所述第一子网络层的第一输出向量和所述第三子网络层的第二输出向量；将所述第一输出向量和所述第二输出向量输入第二子网络层进行处理，得到第三输出向量，所述处理包括利用第二子网络层的中的第一编码变量对所述第一输出向量进行计算，利用第二子网络层的中的第二编码变量对...

【技术保护点】

【技术特征摘要】
1.一种多任务学习模型的预测方法，所述多任务学习模型包括嵌入层、第一任务子网络、第二任务子网络以及任务共享子网络，所述第一任务子网络包括第一子网络层和第二子网络层，所述任务共享子网络包括第三子网络层；所述方法包括：将待处理的任务数据输入所述嵌入层，得到所述嵌入层的嵌入向量；利用掩码对所述嵌入向量进行加权，得到加权后的嵌入向量；将所述加权后的嵌入向量输入所述第一子网络层和所述第三子网络层，得到所述第一子网络层的第一输出向量和所述第三子网络层的第二输出向量；将所述第一输出向量和所述第二输出向量输入所述第二子网络层进行处理，得到第三输出向量，所述处理包括利用所述第二子网络层的中的第一编码变量对所述第一输出向量进行计算，利用所述第二子网络层的中的第二编码变量对所述第二输出向量进行计算，其中所述第一编码变量指示所述第一子网络层中神经元与所述第三子网络层中神经元之间的连接关系，所述第二编码变量指示所述第二子网络层中神经元与所述第三子网络层中神经元之间的连接关系。2.根据权利要求1所述的方法，所述掩码为软掩码。3.根据权利要求1所述的方法，所述第一编码变量或所述第二编码变量包括多个元素，所述元素的值为0或1。4.根据权利要求1所述的方法，所述任务数据为图像数据或文本数据。5.根据权利要求4所述的方法，所述文本数据包括以下信息中的一种或多种：用户的身份信息，用户点击的商品信息以及用户购买的商品信息。6.一种基于多任务学习模型的预测装置，所述多任务学习模型包括嵌入层、第一任务子网络、第二任务子网络以及任务共享子网络，所述第一任务子网络包括第一子网络层...

【专利技术属性】
技术研发人员：丁珂，董鑫，何勇，程磊，李海，严坦，张亮，莫林剑，
申请(专利权)人：支付宝杭州信息技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人