任务筛选模型生成方法、装置、电子设备及存储介质制造方法及图纸

技术编号:38996658 阅读:8 留言:0更新日期:2023-10-07 10:27
本公开关于一种任务筛选模型生成方法、装置、电子设备及存储介质,涉及计算机技术领域,该方法通过将第一训练样本分别输入资源推荐模型以及待训练的任务筛选模型;获取资源推荐主任务网络的第一预测标签,多个资源推荐辅助任务网络的第二预测标签,以及任务筛选模型的筛选因子;基于样本标签和第一预测标签确定第一损失值,基于样本标签、第二预测标签和筛选因子确定第二损失值;获取已更新模型参数资源推荐主任务网络对样本资源的第三预测标签,确定目标损失值;基于目标损失值调整任务筛选模型的模型参数,在达到第一停止条件的情况下,将当前的任务筛选模型确定为目标任务筛选模型。可以提高资源推荐辅助任务网络的筛选效率。率。率。

【技术实现步骤摘要】
任务筛选模型生成方法、装置、电子设备及存储介质


[0001]本公开涉及计算机
,尤其涉及一种任务筛选模型生成方法、装置、电子设备及存储介质。

技术介绍

[0002]多任务辅助学习(Multi

task AuxiliaryLearning,MATL)是一种通过在资源推荐主任务网络之外训练额外的资源推荐辅助任务网络来帮助资源推荐主任务网络获得更好的学习效果,提高资源推荐主任务网络对未见过的测试数据的预测能力,即提高资源推荐主任务网络泛化性的方法。
[0003]现有技术中,可以采用多任务辅助学习模型对资源推荐结果进行预测,但是,通常需要通过大量的离线实验人工手动筛选出合适的资源推荐辅助任务网络,筛选过程费时费力,导致资源推荐辅助任务网络的筛选效率较低。

技术实现思路

[0004]本公开提供一种任务筛选模型生成方法、装置、电子设备及存储介质,以解决人工手动筛选资源推荐辅助任务网络的方法效率低的问题。本公开的技术方案如下:
[0005]根据本公开实施例的第一方面,提供了一种任务筛选模型生成方法,包括:
[0006]将第一训练样本分别输入资源推荐模型以及待训练的任务筛选模型;所述资源推荐模型包括资源推荐主任务网络和多个资源推荐辅助任务网络,所述第一训练样本包括样本资源以及所述样本资源的样本标签;所述资源推荐模型用于根据所述资源推荐主任务网络的输出和所述资源推荐辅助任务网络的输出,确定资源推荐结果;
[0007]获取所述资源推荐主任务网络预测的所述样本资源的第一预测标签,并获取所述多个资源推荐辅助任务网络预测的所述样本资源的第二预测标签,以及获取所述任务筛选模型对所述多个资源推荐辅助任务网络的筛选因子;所述筛选因子用于表征保留或剔除对应的资源推荐辅助任务网络;
[0008]基于所述样本标签和所述第一预测标签确定所述资源推荐主任务网络对应的第一损失值,以及基于所述样本标签、所述第二预测标签和所述筛选因子,确定所述多个资源推荐辅助任务网络对应的第二损失值;
[0009]基于所述第一损失值以及所述第二损失值,对所述资源推荐模型的模型参数进行更新;
[0010]获取已更新所述模型参数的资源推荐模型中的资源推荐主任务网络,对所述样本资源的第三预测标签,并根据所述第三预测标签和所述样本标签,确定目标损失值;
[0011]基于所述目标损失值调整所述任务筛选模型的模型参数,并在达到第一停止条件的情况下,将当前的任务筛选模型确定为目标任务筛选模型。
[0012]可选的,所述基于所述样本标签、所述第二预测标签和所述筛选因子,确定所述多个资源推荐辅助任务网络对应的第二损失值,包括:
[0013]基于所述样本标签和所述多个资源推荐辅助任务网络的第二预测标签,确定各所述资源推荐辅助任务网络各自的损失值;
[0014]根据所述筛选因子对各所述资源推荐辅助任务网络进行筛选,得到筛选后的资源推荐辅助任务网络;
[0015]将所述筛选后的资源推荐辅助任务网络的损失值,确定为所述第二损失值。
[0016]可选的,所述基于所述第一损失值以及所述第二损失值,对所述资源推荐模型的模型参数进行更新,包括:
[0017]根据所述第一损失值以及所述第二损失值,确定所述资源推荐模型的模型参数对应的第一梯度值;
[0018]基于所述第一梯度值对所述资源推荐模型的模型参数进行更新。
[0019]可选的,所述基于所述第一梯度值对所述资源推荐模型的模型参数进行更新,包括:
[0020]获取所述任务筛选模型对应的学习率,并将所述学习率与所述第一梯度值的乘积,确定为所述资源推荐模型对应的第一参数更新量;
[0021]基于所述第一参数更新量,对所述资源推荐模型的模型参数进行更新。
[0022]可选的,所述基于所述目标损失值调整所述任务筛选模型的模型参数,包括:
[0023]根据所述目标损失值确定所述任务筛选模型的模型参数对应的第二梯度值;
[0024]基于所述第二梯度值对所述任务筛选模型的模型参数进行调整。
[0025]可选的,所述基于所述第二梯度值对所述任务筛选模型的模型参数进行调整,包括:
[0026]获取所述任务筛选模型对应的学习率,并将所述学习率与所述第二梯度值的乘积确定为第二参数更新量;
[0027]基于所述第二参数更新量,对所述任务筛选模型的模型参数进行调整。
[0028]可选的,所述将当前的任务筛选模型确定为目标任务筛选模型之后,所述方法还包括:
[0029]将第二训练样本输入所述目标任务筛选模型,并获取所述目标任务筛选模型对所述多个资源推荐辅助任务网络的筛选因子,作为目标筛选因子;
[0030]基于所述目标筛选因子对所述多个资源推荐辅助任务网络进行筛选,得到待训练资源推荐模型;
[0031]基于所述第二训练样本对所述待训练资源推荐模型进行模型训练,并在达到第二停止条件的情况下,将当前的待训练资源推荐模型确定为目标资源推荐模型。
[0032]可选的,所述基于所述目标筛选因子对所述资源推荐模型中的多个资源推荐辅助任务网络进行筛选,包括:
[0033]获取每个所述资源推荐辅助任务网络对应的目标筛选因子;
[0034]在一个所述资源推荐辅助任务网络对应的目标筛选因子表征剔除所述资源推荐辅助任务网络的情况下,剔除所述资源推荐辅助任务网络。
[0035]根据本公开实施例的第二方面,提供了一种任务筛选模型生成装置,包括:
[0036]输入模块,用于将第一训练样本输入资源推荐模型以及待训练的任务筛选模型;所述资源推荐模型包括资源推荐主任务网络和多个资源推荐辅助任务网络,所述第一训练
样本包括样本资源以及所述样本资源的样本标签;所述资源推荐模型用于根据所述资源推荐主任务网络的输出和所述资源推荐辅助任务网络的输出,确定资源推荐结果;
[0037]第一获取模块,用于获取资源推荐主任务网络预测的所述样本资源的第一预测标签,并获取所述多个资源推荐辅助任务网络预测的所述样本资源的第二预测标签,以及获取所述任务筛选模型对所述多个资源推荐辅助任务网络的筛选因子;所述筛选因子用于表征保留或剔除对应的资源推荐辅助任务网络;
[0038]第一确定模块,用于基于所述样本标签和所述第一预测标签确定所述资源推荐主任务网络对应的第一损失值,以及基于所述样本标签、所述第二预测标签和所述筛选因子,确定所述多个资源推荐辅助任务网络对应的第二损失值;
[0039]更新模块,用于基于所述第一损失值以及所述第二损失值,对所述资源推荐模型的模型参数进行更新;
[0040]第二确定模块,用于获取已更新所述模型参数的资源推荐模型中的资源推荐主任务网络,对所述样本资源的第三预测标签,并根据所述第三预测标签和所述样本标签,确定目标损失值;
[0041]训练模块,用于基于所述目标损失值调整所述任务筛选模型的模型参数,并在达到第一停本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种任务筛选模型生成方法,其特征在于,所述方法包括:将第一训练样本分别输入资源推荐模型以及待训练的任务筛选模型;所述资源推荐模型包括资源推荐主任务网络和多个资源推荐辅助任务网络,所述第一训练样本包括样本资源以及所述样本资源的样本标签;所述资源推荐模型用于根据所述资源推荐主任务网络的输出和所述资源推荐辅助任务网络的输出,确定资源推荐结果;获取所述资源推荐主任务网络预测的所述样本资源的第一预测标签,并获取所述多个资源推荐辅助任务网络预测的所述样本资源的第二预测标签,以及获取所述任务筛选模型对所述多个资源推荐辅助任务网络的筛选因子;所述筛选因子用于表征保留或剔除对应的资源推荐辅助任务网络;基于所述样本标签和所述第一预测标签确定所述资源推荐主任务网络对应的第一损失值,以及基于所述样本标签、所述第二预测标签和所述筛选因子,确定所述多个资源推荐辅助任务网络对应的第二损失值;基于所述第一损失值以及所述第二损失值,对所述资源推荐模型的模型参数进行更新;获取已更新所述模型参数的资源推荐模型中的资源推荐主任务网络,对所述样本资源的第三预测标签,并根据所述第三预测标签和所述样本标签,确定目标损失值;基于所述目标损失值调整所述任务筛选模型的模型参数,并在达到第一停止条件的情况下,将当前的任务筛选模型确定为目标任务筛选模型。2.根据权利要求1所述的方法,其特征在于,所述基于所述样本标签、所述第二预测标签和所述筛选因子,确定所述多个资源推荐辅助任务网络对应的第二损失值,包括:基于所述样本标签和所述多个资源推荐辅助任务网络的第二预测标签,确定各所述资源推荐辅助任务网络各自的损失值;根据所述筛选因子对各所述资源推荐辅助任务网络进行筛选,得到筛选后的资源推荐辅助任务网络;将所述筛选后的资源推荐辅助任务网络的损失值,确定为所述第二损失值。3.根据权利要求1所述的方法,其特征在于,所述基于所述第一损失值以及所述第二损失值,对所述资源推荐模型的模型参数进行更新,包括:根据所述第一损失值以及所述第二损失值,确定所述资源推荐模型的模型参数对应的第一梯度值;基于所述第一梯度值对所述资源推荐模型的模型参数进行更新。4.根据权利要求3所述的方法,其特征在于,所述基于所述第一梯度值对所述资源推荐模型的模型参数进行更新,包括:获取所述任务筛选模型对应的学习率,并将所述学习率与所述第一梯度值的乘积,确定为所述资源推荐模型对应的第一参数更新量;基于所述第一参数更新量,对所述资源推荐模型的模型参数进行更新。5.根据权利要求1

4任一所述的方法,其特征在于,所述基于所述目标损失值调整所述任务筛选模型的模型参数,包括:根据所述目标损失值确定所述任务筛选模型的模型参数对应的第二梯度值;基于所述第二梯度值对所述任务筛选模型的模型参数进行调整。
6.根据权利要求5所述的方法,其特征在于,所述基于所述第二梯度值对所述任务筛选模型的模型参数进行调整,包括:...

【专利技术属性】
技术研发人员:赵壮
申请(专利权)人:北京达佳互联信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1