推荐模型的预训练方法技术

技术编号:39741768 阅读:4 留言:0更新日期:2023-12-17 23:42
本申请公开一种推荐模型的预训练方法

【技术实现步骤摘要】
推荐模型的预训练方法、调整方法、推荐方法及相关产品


[0001]本申请涉及多领域推荐
,尤其涉及一种推荐模型的预训练方法

调整方法

推荐方法及相关产品


技术介绍

[0002]在多领域推荐
(MDR

multi

domain recommendation)

中,推荐模型的训练和构建方案取得了很大进展,完成构建后的推荐模型可以用于对对象进行预测,以便为对象推荐其感兴趣的内容

然而现有的推荐模型训练方案大多选择以文本信息作为跨领域的桥梁,而忽略了其他模态信息的重要价值,例如,图像信息是许多领域中内容的主要信息源

这导致相关技术中训练得到的一些推荐模型面临的训练数据集中的模态信息不充分,进而导致了存在模型稳健性不足的情况

[0003]由此,如何提高推荐模型的稳健性,已经成为当前领域亟待解决的技术问题


技术实现思路

[0004]本申请实施例提供了一种推荐模型的预训练方法

调整方法

推荐方法及相关产品,旨在提高推荐模型的稳健性

[0005]本申请第一方面提供了一种推荐模型的预训练方法,包括:
[0006]获取对象的单源域行为序列;所述单源域行为序列包括同一源域的多个内容,且所述多个内容依照受所述对象触发的时间由先到后排序;
[0007]获取所述单源域行为序列中的内容对应的多模态信息;所述多模态信息包括至少两种不同模态的信息;
[0008]将内容对应的多模态信息作为待训练推荐模型的输入,通过所述待训练推荐模型在所输入的多模态信息的基础上处理得到内容在多域通用内容表示空间的多模态向量表示;
[0009]根据所述单源域行为序列中内容的排序,以及所述单源域行为序列中各内容分别在所述多域通用内容表示空间中的多模态向量表示,获得所述对象在所述单源域行为序列所属源域的行为向量表示;
[0010]由所述待训练推荐模型基于所述行为向量表示,预测所述对象触发所述单源域行为序列的末尾内容之后触发的首个相同源域的内容;
[0011]根据预测触发的首个相同源域的内容和所述对象在所述单源域行为序列的末尾内容之后实际触发的首个相同源域的内容的差别,迭代调整所述待训练推荐模型的参数,直至调整后的模型满足预训练截止条件,预训练结束得到初步推荐模型

[0012]本申请第二方面提供了一种模型调整方法,用于通过第一方面预训练得到的初步推荐模型进行调整,以实现所述初步推荐模型从源域向目标域的迁移,包括:
[0013]获取目标对象的多域混合流行为序列;所述多域混合流行为序列包括多个领域的多个内容,且所述多个领域的多个内容依照受所述目标对象触发的时间由先到后排序;所
述多域混合流行为序列涉及的多个领域中包括所述目标域;
[0014]基于所述多域混合流行为序列中的各内容对应的多模态信息,通过所述初步推荐模型,分别获得所述多域混合流行为序列中的各内容在多域通用内容表示空间的多模态向量表示;
[0015]根据所述多域混合流行为序列中的各内容的排序,以及所述多域混合流行为序列中的各内容在多域通用内容表示空间的多模态向量表示,获得所述目标对象在所述多域混合流行为序列对应的多域混合流行为向量表示;
[0016]由所述初步推荐模型基于所述多域混合流行为向量表示,预测所述目标对象触发所述多域混合流行为序列的末尾内容之后,触发的首个所述目标域的内容;
[0017]根据预测触发的所述目标域的内容和所述目标对象在所述多域混合流行为序列的末尾内容之后,实际触发的首个所述目标域的内容的差别,迭代调整所述初步推荐模型的参数,直至模型调整好满足预设微调截止条件,结束调整得到目标推荐模型

[0018]本申请第三方面提供了一种推荐方法,用于通过第二方面获得的目标推荐模型进行推荐,包括:
[0019]获取待推荐对象的历史行为序列,所述历史行为序列中至少包含隶属于所述目标域的内容,且所述历史行为序列中的各内容依照受所述待推荐对象触发的时间由先到后排序;
[0020]基于所述历史行为序列中的各内容对应的多模态信息,通过所述目标推荐模型,分别获得所述历史行为序列中的各内容在多域通用内容表示空间的多模态向量表示;
[0021]根据所述历史行为序列中的各内容的排序,以及所述历史行为序列中的各内容在多域通用内容表示空间的多模态向量表示,获得所述待推荐对象在所述历史行为序列对应的历史行为向量表示;
[0022]由所述目标推荐模型基于所述历史行为向量表示,预测所述待推荐对象触发所述历史行为序列的末尾内容之后,触发的首个所述目标域的内容;
[0023]向所述待推荐对象推荐所述目标推荐模型预测出的首个所述目标域的内容

[0024]本申请第四方面提供了一种推荐模型的预训练装置,包括:
[0025]行为序列获取模块,用于获取对象的单源域行为序列;所述单源域行为序列包括同一源域的多个内容,且所述多个内容依照受所述对象触发的时间由先到后排序;
[0026]多模态信息获取模块,用于获取所述单源域行为序列中的内容对应的多模态信息;所述多模态信息包括至少两种不同模态的信息;
[0027]信息输入确定模块,用于将内容对应的多模态信息作为待训练推荐模型的输入,通过所述待训练推荐模型在所输入的多模态信息的基础上处理得到内容在多域通用内容表示空间的多模态向量表示;
[0028]行为表示构造模块,用于根据所述单源域行为序列中内容的排序,以及所述单源域行为序列中各内容分别在所述多域通用内容表示空间中的多模态向量表示,获得所述对象在所述单源域行为序列所属源域的行为向量表示;
[0029]相同源域内容预测模块,用于由所述待训练推荐模型基于所述行为向量表示,预测所述对象触发所述单源域行为序列的末尾内容之后触发的首个相同源域的内容;
[0030]初步推荐模型获得模块,用于根据预测触发的首个相同源域的内容和所述对象在
所述单源域行为序列的末尾内容之后实际触发的首个相同源域的内容的差别,迭代调整所述待训练推荐模型的参数,直至调整后的模型满足预训练截止条件,预训练结束得到初步推荐模型

[0031]本申请第五方面提供了一种模型调整装置,包括:
[0032]混合流行为序列获取模块,用于获取目标对象的多域混合流行为序列;所述多域混合流行为序列包括多个领域的多个内容,且所述多个领域的多个内容依照受所述目标对象触发的时间由先到后排序;所述多域混合流行为序列涉及的多个领域中包括所述目标域;
[0033]多模态向量表示获得模块,用于基于所述多域混合流行为序列中的各内容对应的多模态信息,通过所述初步推荐模型,分别获得所述多域混合流行为序列中的各内容在多域通用内容表示空本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种推荐模型的预训练方法,其特征在于,包括:获取对象的单源域行为序列;所述单源域行为序列包括同一源域的多个内容,且所述多个内容依照受所述对象触发的时间由先到后排序;获取所述单源域行为序列中的内容对应的多模态信息;所述多模态信息包括至少两种不同模态的信息;将内容对应的多模态信息作为待训练推荐模型的输入,通过所述待训练推荐模型在所输入的多模态信息的基础上处理得到内容在多域通用内容表示空间的多模态向量表示;根据所述单源域行为序列中内容的排序,以及所述单源域行为序列中各内容分别在所述多域通用内容表示空间中的多模态向量表示,获得所述对象在所述单源域行为序列所属源域的行为向量表示;由所述待训练推荐模型基于所述行为向量表示,预测所述对象触发所述单源域行为序列的末尾内容之后触发的首个相同源域的内容;根据预测触发的首个相同源域的内容和所述对象在所述单源域行为序列的末尾内容之后实际触发的首个相同源域的内容的差别,迭代调整所述待训练推荐模型的参数,直至调整后的模型满足预训练截止条件,预训练结束得到初步推荐模型
。2.
根据权利要求1所述的方法,其特征在于,所述待训练推荐模型包括内容表示构造模块

行为表示构造模块和预测模块,其中,所述行为表示构造模块的输入端和输出端分别连接所述内容表示构造模块的输出端和所述预测模块的输入端;所述内容表示构造模块,用于在所输入的多模态信息的基础上处理得到内容在多域通用内容表示空间的多模态向量表示;所述行为表示构造模块,用于根据所述单源域行为序列中内容的排序,以及所述单源域行为序列中各内容分别在所述多域通用内容表示空间中的多模态向量表示,获得所述对象在所述单源域行为序列所属源域的行为向量表示;所述预测模块,用于基于所述行为向量表示,预测所述对象触发所述单源域行为序列的末尾内容之后触发的首个相同源域的内容,并在所述预训练截止条件不满足时,反向传播调整所述行为表示构造模块和
/
或所述内容表示构造模块的参数
。3.
根据权利要求2所述的方法,其特征在于,所述内容表示构造模块包括:多模态内容表示构造器和多域映射器;所述将内容对应的多模态信息作为待训练推荐模型的输入,通过所述待训练推荐模型在所输入的多模态信息的基础上处理得到内容在多域通用内容表示空间的多模态向量表示,包括:将内容对应的多模态信息输入至所述多模态内容表示构造器中,通过所述多模态内容表示构造器对所述多模态信息进行联合表征学习,得到内容在所属源域的多模态表示;通过所述多域映射器将所述多模态表示映射到所述多域通用内容表示空间,得到内容在所述多域通用内容表示空间的多模态向量表示
。4.
根据权利要求3所述的方法,其特征在于,所述至少两种不同模态的信息包括图像模态信息和文本模态信息;所述多模态内容表示构造器包括:视觉与语言联合表征模型以及适应层,所述适应层包括图像模态自注意力模块

文本模态自注意力模块以及图像文本跨模态自注意力模块;
所述将内容对应的多模态信息输入至所述多模态内容表示构造器中,通过所述多模态内容表示构造器对所述多模态信息进行联合表征学习,得到内容在所属源域的多模态表示,包括:将内容对应的图像模态信息和文本模态信息共同输入到所述视觉与语言联合表征模型中,通过所述视觉与语言联合表征模型对所述图像模态信息和所述文本模态信息进行联合表征学习,得到内容在所属源域的第一图像模态向量表示和第一文本模态向量表示;通过所述图像模态自注意力模块学习所述第一图像模态向量表示,通过所述文本模态自注意力模块学习所述第一文本模态向量表示,以及通过所述图像文本跨模态自注意力模块联合学习所述第一图像模态向量表示和所述第一文本模态向量表示,得到所述图像模态自注意力模块

所述文本模态自注意力模块以及所述图像文本跨模态自注意力模块分别输出的内容在所属源域的第二图像模态向量表示

第二文本模态向量表示以及第一跨模态向量表示
。5.
根据权利要求4所述的方法,其特征在于,所述多域映射器包括映射层

拼接层和多层感知机;所述通过所述多域映射器将所述多模态表示映射到所述多域通用内容表示空间,得到内容在所述多域通用内容表示空间的多模态向量表示,包括:通过所述多域映射器,将内容在所属源域的第二图像模态向量表示

第二文本模态向量表示以及第一跨模态向量表示分别映射到所述多域通用内容表示空间,得到所述第二图像模态向量表示对应的第一映射结果

所述第二文本模态向量表示对应的第二映射结果和所述第一跨模态向量表示对应的第三映射结果;通过所述拼接层对所述第一映射结果

所述第三映射结果和所述第二映射结果依次拼接,得到拼接结果;通过所述多层感知机对所述拼接结果进行降维处理,得到内容在所述多域通用内容表示空间的多模态向量表示
。6.
根据权利要求5所述的方法,其特征在于,所述映射层包括白化层和混合专家网络层,所述白化层包括分别对应于图像模态

文本模态和图像文本跨模态的第一白化模块

第二白化模块和第三白化模块;所述混合专家网络层包括分别对应于图像模态

文本模态和图像文本跨模态的第一混合专家网络

第二混合专家网络和第三混合专家网络;所述第一混合专家网络

所述第二混合专家网络和所述第三混合专家网络均采用面向于所述多域通用内容表示空间涉及到的多个领域的门控机制;所述多个领域包括内容所属源域;所述通过所述多域映射器,将内容在所属源域的第二图像模态向量表示

第二文本模态向量表示以及第一跨模态向量表示分别映射到所述多域通用内容表示空间,得到所述第二图像模态向量表示对应的第一映射结果

所述第二文本模态向量表示对应的第二映射结果和所述第一跨模态向量表示对应的第三映射结果,包括:通过所述第一白化模块

所述第二白化模块和所述第三白化模块分别对所述第二图像模态向量表示

所述第二文本模态向量表示以及所述第一跨模态向量表示进行白化处理,得到所述第二图像模态向量表示

所述第二文本模态向量表示以及所述第一跨模态向量表示分别对应的第一白化结果

第二白化结果和第三白化结果;通过所述第一混合专家网络

所述第二混合专家网络和所述第三混合专家网络分别通
过所述门控机制对所述第一白化结果

所述第二白化结果和所述第三白化结果进行处理,得到所述第一映射结果

所述第二映射结果和所述第三映射结果
。7.
根据权利要求2所述的方法,其特征在于,所述行为表示构造模块包括对象行为编码器;所述根据所述单源域行为序列中内容的排序,以及所述单源域行为序列中各内容分别在所述多域通用内容表示空间中的多模态向量表示,获得所述对象在所述单源域行为序列所属源域的行为向量表示,包括:根据所述单源域行为序列中内容的排序,得到内容在所述单源域行为序列中的位置信息;根据所述单源域行为序列中各内容分别在所述多域通用内容表示空间中的多模态向量表示,以及内容在所述单源域行为序列中的位置信息,得到所述单源域行为序列对应的内容表示序列;将所述内容表示序列作为所述对象行为编码器的输入,通过所述对象行为编码器对所述内容表示序列进行编码处理,得到所述对象在所述单源域行为序列所属源域的行为向量表示
。8.
根据权利要求7所述的方法,其特征在于,所述根据所述单源域行为序列中各内容分别在所述多域通用内容表示空间中的多模态向量表示,以及内容在所...

【专利技术属性】
技术研发人员:赵鑫谢若冰孙文奇卞书青周杰
申请(专利权)人:中国人民大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1