【技术实现步骤摘要】
任务筛选模型生成方法、装置、电子设备及存储介质
[0001]本公开涉及计算机
,尤其涉及一种任务筛选模型生成方法、装置、电子设备及存储介质。
技术介绍
[0002]多任务辅助学习(Multi
‑
task AuxiliaryLearning,MATL)是一种通过在资源推荐主任务网络之外训练额外的资源推荐辅助任务网络来帮助资源推荐主任务网络获得更好的学习效果,提高资源推荐主任务网络对未见过的测试数据的预测能力,即提高资源推荐主任务网络泛化性的方法。
[0003]现有技术中,可以采用多任务辅助学习模型对资源推荐结果进行预测,但是,通常需要通过大量的离线实验人工手动筛选出合适的资源推荐辅助任务网络,筛选过程费时费力,导致资源推荐辅助任务网络的筛选效率较低。
技术实现思路
[0004]本公开提供一种任务筛选模型生成方法、装置、电子设备及存储介质,以解决人工手动筛选资源推荐辅助任务网络的方法效率低的问题。本公开的技术方案如下:
[0005]根据本公开实施例的第一方面,提供了一种任务筛选模型生成方法,包括:
[0006]将第一训练样本分别输入资源推荐模型以及待训练的任务筛选模型;所述资源推荐模型包括资源推荐主任务网络和多个资源推荐辅助任务网络,所述第一训练样本包括样本资源以及所述样本资源的样本标签;所述资源推荐模型用于根据所述资源推荐主任务网络的输出和所述资源推荐辅助任务网络的输出,确定资源推荐结果;
[0007]获取所述资源推荐主任务网络预测的所述样本资源的 ...
【技术保护点】
【技术特征摘要】
1.一种任务筛选模型生成方法,其特征在于,所述方法包括:将第一训练样本分别输入资源推荐模型以及待训练的任务筛选模型;所述资源推荐模型包括资源推荐主任务网络和多个资源推荐辅助任务网络,所述第一训练样本包括样本资源以及所述样本资源的样本标签;所述资源推荐模型用于根据所述资源推荐主任务网络的输出和所述资源推荐辅助任务网络的输出,确定资源推荐结果;获取所述资源推荐主任务网络预测的所述样本资源的第一预测标签,并获取所述多个资源推荐辅助任务网络预测的所述样本资源的第二预测标签,以及获取所述任务筛选模型对所述多个资源推荐辅助任务网络的筛选因子;所述筛选因子用于表征保留或剔除对应的资源推荐辅助任务网络;基于所述样本标签和所述第一预测标签确定所述资源推荐主任务网络对应的第一损失值,以及基于所述样本标签、所述第二预测标签和所述筛选因子,确定所述多个资源推荐辅助任务网络对应的第二损失值;基于所述第一损失值以及所述第二损失值,对所述资源推荐模型的模型参数进行更新;获取已更新所述模型参数的资源推荐模型中的资源推荐主任务网络,对所述样本资源的第三预测标签,并根据所述第三预测标签和所述样本标签,确定目标损失值;基于所述目标损失值调整所述任务筛选模型的模型参数,并在达到第一停止条件的情况下,将当前的任务筛选模型确定为目标任务筛选模型。2.根据权利要求1所述的方法,其特征在于,所述基于所述样本标签、所述第二预测标签和所述筛选因子,确定所述多个资源推荐辅助任务网络对应的第二损失值,包括:基于所述样本标签和所述多个资源推荐辅助任务网络的第二预测标签,确定各所述资源推荐辅助任务网络各自的损失值;根据所述筛选因子对各所述资源推荐辅助任务网络进行筛选,得到筛选后的资源推荐辅助任务网络;将所述筛选后的资源推荐辅助任务网络的损失值,确定为所述第二损失值。3.根据权利要求1所述的方法,其特征在于,所述基于所述第一损失值以及所述第二损失值,对所述资源推荐模型的模型参数进行更新,包括:根据所述第一损失值以及所述第二损失值,确定所述资源推荐模型的模型参数对应的第一梯度值;基于所述第一梯度值对所述资源推荐模型的模型参数进行更新。4.根据权利要求3所述的方法,其特征在于,所述基于所述第一梯度值对所述资源推荐模型的模型参数进行更新,包括:获取所述任务筛选模型对应的学习率,并将所述学习率与所述第一梯度值的乘积,确定为所述资源推荐模型对应的第一参数更新量;基于所述第一参数更新量,对所述资源推荐模型的模型参数进行更新。5.根据权利要求1
‑
4任一所述的方法,其特征在于,所述基于所述目标损失值调整所述任务筛选模型的模型参数,包括:根据所述目标损失值确定所述任务筛选模型的模型参数对应的第二梯度值;基于所述第二梯度值对所述任务筛选模型的模型参数进行调整。
6.根据权利要求5所述的方法,其特征在于,所述基于所述第二梯度值对所述任务筛选模型的模型参数进行调整,包括:...
【专利技术属性】
技术研发人员:赵壮,
申请(专利权)人:北京达佳互联信息技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。