多媒体推荐模型的训练方法、装置、服务器以及存储介质制造方法及图纸

技术编号:28776613 阅读:19 留言:0更新日期:2021-06-09 11:06
本公开关于一种多媒体推荐模型的训练方法、装置、服务器以及存储介质,属于深度学习技术领域,该方法包括:对多个多媒体推荐模型进行迭代训练,确定各个多媒体推荐模型对应的关联模型,基于各个多媒体推荐模型的模型参数和对应的关联模型的模型参数,分别确定各个多媒体推荐模型的目标模型参数。本公开实施例提供的技术方案,由于各个多媒体推荐模型每次所确定的关联模型均基于上一次所确定的关联模型来确定,因此,能够确保各个多媒体推荐模型间的模型参数能够尽可能地融合交互,能够更加广泛的进行多媒体推荐模型间的参数优化,提高了模型训练的全面性,从而提升了多媒体推荐模型的预测能力。的预测能力。的预测能力。

【技术实现步骤摘要】
多媒体推荐模型的训练方法、装置、服务器以及存储介质


[0001]本公开涉及深度学习
,尤其涉及一种多媒体推荐模型的训练方法、装置、服务器以及存储介质。

技术介绍

[0002]随着深度学习技术的日渐成熟,深度学习已经取代传统机器学习算法,成为机器学习中的技术首选。深度学习的实质,是通过构建具有很多隐层的机器学习模型,并利用海量的训练数据进行模型训练,来学习更有用的特征,从而提升模型输出的准确性。
[0003]目前,对模型进行训练时,通常是利用训练数据,对单个模型进行迭代训练,在每一次迭代结束后,基于本次迭代的模型训练结果与本次迭代的训练数据的真实标签,计算模型训练结果与真实标签之间的损失值,再基于损失值对该模型的模型参数进行更新,直至训练满足条件,则训练结束。
[0004]上述技术中,仅对单个模型进行训练,可能会造成模型训练不稳定,导致训练得到的模型的预测能力较低。

技术实现思路

[0005]本公开提供一种多媒体推荐模型的训练方法、装置、服务器以及存储介质,能够更加广泛的进行多媒体推荐模型间的参数优化,提高了模型训练的全面性,从而提升了多媒体推荐模型的预测能力。本公开的技术方案如下:
[0006]根据本公开实施例的第一方面,提供一种多媒体推荐模型的训练方法,该方法包括:
[0007]对多个多媒体推荐模型进行迭代训练,该多个多媒体推荐模型的层次结构以及该层次结构中模型参数的类型相同,该模型参数为对应多媒体推荐模型的权重参数;
[0008]确定第一多媒体推荐模型对应的关联模型,该第一多媒体推荐模型为该多个多媒体推荐模型中的任意一个,该关联模型为该多个多媒体推荐模型中除该第一多媒体推荐模型以外的一个,且,该关联模型基于该第一多媒体推荐模型上一次所确定的关联模型确定;
[0009]基于该第一多媒体推荐模型的模型参数和对应的关联模型的模型参数,确定该第一多媒体推荐模型的目标模型参数。
[0010]在一些实施例中,该确定第一多媒体推荐模型对应的关联模型包括:
[0011]在一次迭代结束时,在除该第一多媒体推荐模型以外的多个多媒体推荐模型中,选取该第一多媒体推荐模型的起始关联模型,其中,各个该多媒体推荐模型对应的起始关联模型不同;
[0012]在第N次迭代结束时,基于该第一多媒体推荐模型上一次所确定的关联模型的顺序,确定与该关联模型相邻的下一多媒体推荐模型,作为该第一多媒体推荐模型在第N次迭代结束的关联模型,该N为确定关联模型的迭代次数,N为大于1的正整数。
[0013]在一些实施例中,该方法还包括:
[0014]每确定K

1个关联模型时,选取该起始关联模型,作为该第一多媒体推荐模型在本次迭代结束时的关联模型,该K为该多个多媒体推荐模型的数目,K为大于1的正整数。
[0015]在一些实施例中,该基于该第一多媒体推荐模型的模型参数和对应的关联模型的模型参数,确定该第一多媒体推荐模型的目标模型参数包括:
[0016]基于该第一多媒体推荐模型的第一权重系数和对应的关联模型的第二权重系数,对该第一多媒体推荐模型的模型参数和对应的关联模型的模型参数,进行加权平均,得到该第一多媒体推荐模型的目标模型参数。
[0017]在一些实施例中,该方法还包括:
[0018]基于模型训练的迭代次数,确定该第一多媒体推荐模型的第一权重系数和该第二权重系数。
[0019]在一些实施例中,该基于模型训练的迭代次数,确定该第一多媒体推荐模型的第一权重系数和该第二权重系数包括:
[0020]响应于模型训练的迭代次数小于或等于第一阈值,将该第一权重系数调整为第一数值,将该第二权重系数调整为第二数值,该第一数值大于该第二数值;
[0021]响应于该模型训练的迭代次数大于该第一阈值,且小于或等于第二阈值,基于该迭代次数,确定该第二权重系数的数值,该第二权重系数的数值与该迭代次数正相关;
[0022]响应于该模型训练的迭代次数大于该第二阈值,将该第一权重系数和该第二权重系数均调整为第三数值。
[0023]在一些实施例中,该响应于该模型训练的迭代次数大于该第一阈值,且小于或等于第二阈值,基于该迭代次数,确定该第二权重系数的数值包括:
[0024]响应于该模型训练的迭代次数大于该第一阈值,且小于或等于第二阈值,基于该迭代次数和线性关系数据,确定该第二权重系数的数值,该线性关系数据为第二权重系数的数值随该迭代次数线性递增的关系数据。
[0025]在一些实施例中,该确定第一多媒体推荐模型对应的关联模型包括:
[0026]每间隔目标迭代次数,在当前迭代过程结束时,确定该第一多媒体推荐模型对应的关联模型。
[0027]在一些实施例中,该对多个多媒体推荐模型进行迭代训练包括:
[0028]接收终端发送的在线数据,基于该在线数据,对该多个多媒体推荐模型进行迭代训练;
[0029]该确定第一多媒体推荐模型对应的关联模型包括:
[0030]每间隔目标时长,在当前迭代过程结束时,确定该第一多媒体推荐模型对应的关联模型。
[0031]根据本公开实施例的第二方面,提供一种多媒体推荐模型的训练装置,该装置包括:
[0032]训练单元,被配置为执行对多个多媒体推荐模型进行迭代训练,该多个多媒体推荐模型的层次结构以及该层次结构中模型参数的类型相同,该模型参数为对应多媒体推荐模型的权重参数;
[0033]模型确定单元,被配置为执行确定第一多媒体推荐模型对应的关联模型,该第一多媒体推荐模型为该多个多媒体推荐模型中的任意一个,该关联模型为该多个多媒体推荐
模型中除该第一多媒体推荐模型以外的一个,且,该关联模型基于该第一多媒体推荐模型上一次所确定的关联模型确定;
[0034]参数确定单元,被配置为执行基于该第一多媒体推荐模型的模型参数和对应的关联模型的模型参数,确定该第一多媒体推荐模型的目标模型参数。
[0035]在一些实施例中,该模型确定单元,被配置为执行:
[0036]在一次迭代结束时,在除该第一多媒体推荐模型以外的多个多媒体推荐模型中,选取该第一多媒体推荐模型的起始关联模型,其中,各个该多媒体推荐模型对应的起始关联模型不同;
[0037]在第N次迭代结束时,基于该第一多媒体推荐模型上一次所确定的关联模型的顺序,确定与该关联模型相邻的下一多媒体推荐模型,作为该第一多媒体推荐模型在第N次迭代结束的关联模型,该N为确定关联模型的迭代次数,N为大于1的正整数。
[0038]在一些实施例中,该模型确定单元,还被配置为执行:
[0039]每确定K

1个关联模型时,选取该起始关联模型,作为该第一多媒体推荐模型在本次迭代结束时的关联模型,该K为该多个多媒体推荐模型的数目,K为大于1的正整数。
[0040]在一些实施例中,该参数确定单元,被配置为执行:
[0041]基于该第一多媒体推荐模型的本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种多媒体推荐模型的训练方法,其特征在于,所述方法包括:对多个多媒体推荐模型进行迭代训练,所述多个多媒体推荐模型的层次结构以及所述层次结构中模型参数的类型相同,所述模型参数为对应多媒体推荐模型的权重参数;确定第一多媒体推荐模型对应的关联模型,所述第一多媒体推荐模型为所述多个多媒体推荐模型中的任意一个,所述关联模型为所述多个多媒体推荐模型中除所述第一多媒体推荐模型以外的一个,且,所述关联模型基于所述第一多媒体推荐模型上一次所确定的关联模型确定;基于所述第一多媒体推荐模型的模型参数和对应的关联模型的模型参数,确定所述第一多媒体推荐模型的目标模型参数。2.根据权利要求1所述的多媒体推荐模型的训练方法,其特征在于,所述确定第一多媒体推荐模型对应的关联模型包括:在一次迭代结束时,在除所述第一多媒体推荐模型以外的多个多媒体推荐模型中,选取所述第一多媒体推荐模型的起始关联模型,其中,各个所述多媒体推荐模型对应的起始关联模型不同;在第N次迭代结束时,基于所述第一多媒体推荐模型上一次所确定的关联模型的顺序,确定与所述关联模型相邻的下一多媒体推荐模型,作为所述第一多媒体推荐模型在第N次迭代结束的关联模型,所述N为确定关联模型的迭代次数,N为大于1的正整数。3.根据权利要求2所述的多媒体推荐模型的训练方法,其特征在于,所述方法还包括:每确定K

1个关联模型时,选取所述起始关联模型,作为所述第一多媒体推荐模型在本次迭代结束时的关联模型,所述K为所述多个多媒体推荐模型的数目,K为大于1的正整数。4.根据权利要求1所述的多媒体推荐模型的训练方法,其特征在于,所述基于所述第一多媒体推荐模型的模型参数和对应的关联模型的模型参数,确定所述第一多媒体推荐模型的目标模型参数包括:基于所述第一多媒体推荐模型的第一权重系数和对应的关联模型的第二权重系数,对所述第一多媒体推荐模型的模型参数和对应的关联模型的模型参数,进行加权平均,得到所述第一多媒体推荐模型的目标模型参数。5.根据权利要求4所述的多媒体推荐模型的训练方法,其特征在于,所述方法还包括:基于模型训练的迭代次数,确...

【专利技术属性】
技术研发人员:李吉祥杨森贾纪元
申请(专利权)人:北京达佳互联信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1