模型训练方法、装置、终端设备及存储介质制造方法及图纸

技术编号：37122990 阅读：21 留言：0更新日期：2023-04-01 05:18

本申请实施例提供一种模型训练方法、装置、终端设备及存储介质，该模型训练方法包括：将第一样本中的用户静态数据输入第一编码网络，得到第一样本的第一编码结果；第一样本是目标样本集合中的任一个；将第一样本中的基于用户行为的时间序列数据输入第二编码网络，得到第一样本的第二编码结果；将第一样本的编码结果和第二样本的编码结果进行组合后，输入多任务编码网络，得到第一样本的多任务预测结果；基于第二编码结果计算第二编码网络的训练损失，基于多任务预测结果计算多任务编码网络的训练损失；基于第二编码网络的训练损失和多任务编码网络的训练损失对多任务模型进行优化。本申请实施例可以提高模型的训练效果。本申请实施例可以提高模型的训练效果。本申请实施例可以提高模型的训练效果。

全部详细技术资料下载

【技术实现步骤摘要】
模型训练方法、装置、终端设备及存储介质

[0001]本申请涉及机器学习
，具体涉及一种模型训练方法、装置、终端设备及存储介质。

技术介绍

[0002]目前，在金融营销推荐场景，通常使用传统的特征工程进行特征加工，然后将处理好的特征作为模型的输入。然而，目前的模型的训练数据一般采用的用户的静态数据，比如用户标识(identity，ID)、用户统计的数据等，导致模型的训练效果较差。

技术实现思路

[0003]本申请实施例提供一种模型训练方法、装置、终端设备及存储介质，可以提高模型的训练效果。
[0004]本申请实施例的第一方面提供了一种模型训练方法，包括：
[0005]将第一样本中的用户静态数据输入所述第一编码网络，得到所述第一样本的第一编码结果；所述第一样本是目标样本集合中的任一个；
[0006]将所述第一样本中的基于用户行为的时间序列数据输入所述第二编码网络，得到所述第一样本的第二编码结果；
[0007]将所述第一样本的编码结果和所述第二样本的编码结果进行组合后，输入所述多任务编码网络，得到所述第一样本的多任务预测结果；
[0008]计算所述第二编码网络的训练损失，计算所述多任务编码网络的训练损失；
[0009]基于所述第二编码网络的训练损失和所述多任务编码网络的训练损失对所述多任务模型进行优化。
[0010]本申请实施例的第二方面提供了一种模型训练装置，所述装置应用于多任务模型，所述多任务模型包括：第一编码网络、第二编码网络和多任务编码网...

【技术保护点】

【技术特征摘要】
1.一种模型训练方法，其特征在于，所述方法应用于多任务模型，所述多任务模型包括：第一编码网络、第二编码网络和多任务编码网络；所述方法包括：将第一样本中的用户静态数据输入所述第一编码网络，得到所述第一样本的第一编码结果；所述第一样本是目标样本集合中的任一个；将所述第一样本中的基于用户行为的时间序列数据输入所述第二编码网络，得到所述第一样本的第二编码结果；将所述第一样本的编码结果和所述第二样本的编码结果进行组合后，输入所述多任务编码网络，得到所述第一样本的多任务预测结果；基于所述第二编码结果计算所述第二编码网络的训练损失，基于所述多任务预测结果计算所述多任务编码网络的训练损失；基于所述第二编码网络的训练损失和所述多任务编码网络的训练损失对所述多任务模型进行优化。2.根据权利要求1所述的方法，其特征在于，所述将第一样本中的用户静态数据输入所述第一编码网络，得到所述第一样本的第一编码结果，包括：将所述第一样本中的用户静态数据输入所述第一编码网络，所述第一编码网络用于将所述用户静态数据进行嵌入编码，以映射到d维的向量空间，得到所述第一样本的第一编码结果，所述第一编码结果为d维编码张量，d为大于或等于2的整数。3.根据权利要求1所述的方法，其特征在于，所述将所述第一样本中的基于用户行为的时间序列数据输入所述第二编码网络，得到所述第一样本的第二编码结果，包括：基于所述第一样本中的基于用户行为的时间序列数据生成输入数据、正标签数据和负标签数据；其中，所述正标签数据为所述输入数据在时间维度上往前偏移一位，所述负标签数据与所述正标签数据在每个时间维度上均不相同；将所述输入数据、所述正标签数据和所述负标签数据输入所述第二编码网络，所述第二编码网络用于将所述输入数据、正标签数据和负标签数据分别进行嵌入编码，以映射到d维的向量空间，得到所述输入数据对应的d维编码张量、所述正标签数据对应的d维编码张量和所述负标签数据对应的d维编码张量，d为大于或等于2的整数；将所述输入数据对应的d维编码张量进行自注意力编码，得到所述第一样本的第二编码结果，所述第二编码结果为d维编码张量。4.根据权利要求3所述的方法，其特征在于，所述基于所述第二编码结果计算所述第二编码网络的训练损失，包括：基于所述第一样本的第二编码结果、所述正标签数据对应的d维编码张量和所述负标签数据对应的d维编码张量计算所述第二编码网络的训练损失。5.根据权利要求1所述的方法，其特征在于，所述多任务编码网络包括顺序连接的R个任务编码子网络，每个任务编码子网络包括自注意力层和全连接层，当前顺序的任务编码子网络的自注意力层的输出连接下一顺序的任务编码子网络自注意力层的输入；所述将所述第一样本的编码结果和所述第二样本的编码结果进行组合后，输入所述多任务编码网络，得到所述第一样本的多任务预测结果，包括：将所述第一样本的编码结果和所述第二样本的编码结果进行组合，得到合并编码结果；
将所述合并编码结果分别输入所述R个任务编码子网络的自注意力层，所述R个任务编码子网络的全连接层分别输出R个预测结果，R为大于或等于2的整数。6.根据权利要求5所述的方法，其特征在于，所述基于所述多任务预测结果计算所述多任务编码网络的训练损失，包括：基于每个任务编码子网络的全连接层输出的预测结果与对应的标签计算每个任务编码子网络的损失，将R个任务编码子网络的损...

【专利技术属性】
技术研发人员：黄钢，孔涛涛，
申请(专利权)人：OPPO重庆智能科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人