推荐模型的预训练方法技术

技术编号：39741768 阅读：4 留言：0更新日期：2023-12-17 23:42

本申请公开一种推荐模型的预训练方法

全部详细技术资料下载

【技术实现步骤摘要】
推荐模型的预训练方法、调整方法、推荐方法及相关产品

[0001]本申请涉及多领域推荐
，尤其涉及一种推荐模型的预训练方法
、
调整方法
、
推荐方法及相关产品
。

技术介绍

[0002]在多领域推荐
(MDR
，
multi
‑
domain recommendation)

中，推荐模型的训练和构建方案取得了很大进展，完成构建后的推荐模型可以用于对对象进行预测，以便为对象推荐其感兴趣的内容
。
然而现有的推荐模型训练方案大多选择以文本信息作为跨领域的桥梁，而忽略了其他模态信息的重要价值，例如，图像信息是许多领域中内容的主要信息源
。
这导致相关技术中训练得到的一些推荐模型面临的训练数据集中的模态信息不充分，进而导致了存在模型稳健性不足的情况
。
[0003]由此，如何提高推荐模型的稳健性，已经成为当前领域亟待解决的技术问题
。

技术实现思路

[0004]本申请实施例提供了一种推荐模型的预训练方法
、
调整方法
、
推荐方法及相关产品，旨在提高推荐模型的稳健性
。
[0005]本申请第一方面提供了一种推荐模型的预训练方法，包括：
[0006]获取对象的单源域行为序列；所述单源域行为序列包括同一源域的多个内容，且所述多个内容依照受所述对象触发的时间由先到后排序；
[0007]获取所述单源...

【技术保护点】

【技术特征摘要】
1.
一种推荐模型的预训练方法，其特征在于，包括：获取对象的单源域行为序列；所述单源域行为序列包括同一源域的多个内容，且所述多个内容依照受所述对象触发的时间由先到后排序；获取所述单源域行为序列中的内容对应的多模态信息；所述多模态信息包括至少两种不同模态的信息；将内容对应的多模态信息作为待训练推荐模型的输入，通过所述待训练推荐模型在所输入的多模态信息的基础上处理得到内容在多域通用内容表示空间的多模态向量表示；根据所述单源域行为序列中内容的排序，以及所述单源域行为序列中各内容分别在所述多域通用内容表示空间中的多模态向量表示，获得所述对象在所述单源域行为序列所属源域的行为向量表示；由所述待训练推荐模型基于所述行为向量表示，预测所述对象触发所述单源域行为序列的末尾内容之后触发的首个相同源域的内容；根据预测触发的首个相同源域的内容和所述对象在所述单源域行为序列的末尾内容之后实际触发的首个相同源域的内容的差别，迭代调整所述待训练推荐模型的参数，直至调整后的模型满足预训练截止条件，预训练结束得到初步推荐模型
。2.
根据权利要求1所述的方法，其特征在于，所述待训练推荐模型包括内容表示构造模块
、
行为表示构造模块和预测模块，其中，所述行为表示构造模块的输入端和输出端分别连接所述内容表示构造模块的输出端和所述预测模块的输入端；所述内容表示构造模块，用于在所输入的多模态信息的基础上处理得到内容在多域通用内容表示空间的多模态向量表示；所述行为表示构造模块，用于根据所述单源域行为序列中内容的排序，以及所述单源域行为序列中各内容分别在所述多域通用内容表示空间中的多模态向量表示，获得所述对象在所述单源域行为序列所属源域的行为向量表示；所述预测模块，用于基于所述行为向量表示，预测所述对象触发所述单源域行为序列的末尾内容之后触发的首个相同源域的内容，并在所述预训练截止条件不满足时，反向传播调整所述行为表示构造模块和
/
或所述内容表示构造模块的参数
。3.
根据权利要求2所述的方法，其特征在于，所述内容表示构造模块包括：多模态内容表示构造器和多域映射器；所述将内容对应的多模态信息作为待训练推荐模型的输入，通过所述待训练推荐模型在所输入的多模态信息的基础上处理得到内容在多域通用内容表示空间的多模态向量表示，包括：将内容对应的多模态信息输入至所述多模态内容表示构造器中，通过所述多模态内容表示构造器对所述多模态信息进行联合表征学习，得到内容在所属源域的多模态表示；通过所述多域映射器将所述多模态表示映射到所述多域通用内容表示空间，得到内容在所述多域通用内容表示空间的多模态向量表示
。4.
根据权利要求3所述的方法，其特征在于，所述至少两种不同模态的信息包括图像模态信息和文本模态信息；所述多模态内容表示构造器包括：视觉与语言联合表征模型以及适应层，所述适应层包括图像模态自注意力模块
、
文本模态自注意力模块以及图像文本跨模态自注意力模块；
所述将内容对应的多模态信息输入至所述多模态内容表示构造器中，通过所述多模态内容表示构造器对所述多模态信息进行联合表征学习，得到内容在所属源域的多模态表示，包括：将内容对应的图像模态信息和文本模态信息共同输入到所述视觉与语言联合表征模型中，通过所述视觉与语言联合表征模型对所述图像模态信息和所述文本模态信息进行联合表征学习，得到内容在所属源域的第一图像模态向量表示和第一文本模态向量表示；通过所述图像模态自注意力模块学习所述第一图像模态向量表示，通过所述文本模态自注意力模块学习所述第一文本模态向量表示，以及通过所述图像文本跨模态自注意力模块联合学习所述第一图像模态向量表示和所述第一文本模态向量表示，得到所述图像模态自注意力模块
、
所述文本模态自注意力模块以及所述图像文本跨模态自注意力模块分别输出的内容在所属源域的第二图像模态向量表示
、
第二文本模态向量表示以及第一跨模态向量表示
。5.
根据权利要求4所述的方法，其特征在于，所述多域映射器包括映射层
、
拼接层和多层感知机；所述通过所述多域映射器将所述多模态表示映射到所述多域通用内容表示空间，得到内容在所述多域通用内容表示空间的多模态向量表示，包括：通过所述多域映射器，将内容在所属源域的第二图像模态向量表示
、
第二文本模态向量表示以及第一跨模态向量表示分别映射到所述多域通用内容表示空间，得到所述第二图像模态向量表示对应的第一映射结果
、
所述第二文本模态向量表示对应的第二映射结果和所述第一跨模态向量表示对应的第三映射结果；通过所述拼接层对所述第一映射结果
、
所述第三映射结果和所述第二映射结果依次拼接，得到拼接结果；通过所述多层感知机对所述拼接结果进行降维处理，得到内容在所述多域通用内容表示空间的多模态向量表示
。6.
根据权利要求5所述的方法，其特征在于，所述映射层包括白化层和混合专家网络层，所述白化层包括分别对应于图像模态
、
文本模态和图像文本跨模态的第一白化模块
、
第二白化模块和第三白化模块；所述混合专家网络层包括分别对应于图像模态
、
文本模态和图像文本跨模态的第一混合专家网络
、
第二混合专家网络和第三混合专家网络；所述第一混合专家网络
、
所述第二混合专家网络和所述第三混合专家网络均采用面向于所述多域通用内容表示空间涉及到的多个领域的门控机制；所述多个领域包括内容所属源域；所述通过所述多域映射器，将内容在所属源域的第二图像模态向量表示
、
第二文本模态向量表示以及第一跨模态向量表示分别映射到所述多域通用内容表示空间，得到所述第二图像模态向量表示对应的第一映射结果
、
所述第二文本模态向量表示对应的第二映射结果和所述第一跨模态向量表示对应的第三映射结果，包括：通过所述第一白化模块
、
所述第二白化模块和所述第三白化模块分别对所述第二图像模态向量表示
、
所述第二文本模态向量表示以及所述第一跨模态向量表示进行白化处理，得到所述第二图像模态向量表示
、
所述第二文本模态向量表示以及所述第一跨模态向量表示分别对应的第一白化结果
、
第二白化结果和第三白化结果；通过所述第一混合专家网络
、
所述第二混合专家网络和所述第三混合专家网络分别通
过所述门控机制对所述第一白化结果
、
所述第二白化结果和所述第三白化结果进行处理，得到所述第一映射结果
、
所述第二映射结果和所述第三映射结果
。7.
根据权利要求2所述的方法，其特征在于，所述行为表示构造模块包括对象行为编码器；所述根据所述单源域行为序列中内容的排序，以及所述单源域行为序列中各内容分别在所述多域通用内容表示空间中的多模态向量表示，获得所述对象在所述单源域行为序列所属源域的行为向量表示，包括：根据所述单源域行为序列中内容的排序，得到内容在所述单源域行为序列中的位置信息；根据所述单源域行为序列中各内容分别在所述多域通用内容表示空间中的多模态向量表示，以及内容在所述单源域行为序列中的位置信息，得到所述单源域行为序列对应的内容表示序列；将所述内容表示序列作为所述对象行为编码器的输入，通过所述对象行为编码器对所述内容表示序列进行编码处理，得到所述对象在所述单源域行为序列所属源域的行为向量表示
。8.
根据权利要求7所述的方法，其特征在于，所述根据所述单源域行为序列中各内容分别在所述多域通用内容表示空间中的多模态向量表示，以及内容在所...

【专利技术属性】
技术研发人员：赵鑫，谢若冰，孙文奇，卞书青，周杰，
申请(专利权)人：中国人民大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人