一种跨域推荐及模型训练的方法技术

技术编号：39509306 阅读：8 留言：0更新日期：2023-11-25 18:44

本公开的实施方式提供了一种跨域推荐及模型训练的方法

全部详细技术资料下载

【技术实现步骤摘要】
一种跨域推荐及模型训练的方法、装置、设备及存储介质

[0001]本公开的实施方式涉及通信
，更具体地，本公开的实施方式涉及一种跨域推荐及模型训练的方法
、
装置
、
设备及存储介质
。

技术介绍

[0002]本部分旨在为权利要求书中陈述的本公开的实施方式提供背景或上下文
。
此处的描述不因为包括在本部分中就承认是现有技术
。
[0003]内容推荐可以帮助用户在海量的信息中找到真正感兴趣的内容
。
因此，通常需要根据用户的历史数据
(
包括历史浏览记录
、
历史喜爱度等行为数据
)
来确定用户的兴趣偏好，从而为用户提供精准的内容推荐服务
。
然而，传统的推荐算法往往仅能够对某一领域内历史数据丰富的用户进行推荐，而无法对该领域内历史数据稀疏的用户实现推荐
。
比如，在视频推荐场景中，某些活跃度较低的用户在该视频领域内的视频行为
(
包括观看
、
投币
、
点赞等行为
)
数据较为稀疏，从而导致无法刻画这些用户的兴趣偏好，难以实现精准推荐以及多样性推荐
。
而跨域推荐旨在结合多个领域的信息对用户进行内容推荐，即通过引入其他领域
(
辅助域
/
源域
)
的信息进行辅助，从而在目标域内对用户实现精准推荐，提高目标域的推荐效果r/>。
[0004]目前，相关技术中的跨域推荐算法无法很好地运用辅助域的信息，导致跨域推荐效果较差
。

技术实现思路

[0005]在本公开实施方式的第一方面中，提供了一种跨域推荐模型的训练方法，包括：
[0006]获取训练样本集，所述训练样本集包括样本用户的
id
特征
、
样本物品的
id
特征以及所述样本用户与所述样本物品的目标相似度；所述样本物品包括目标域的第一样本物品和区别于所述目标域的至少一个辅助域的第二样本物品；所述目标相似度包括所述样本用户与所述第一样本物品的第一目标相似度，以及所述样本用户与所述第二样本物品的第二目标相似度；
[0007]将所述训练样本集输入待训练模型，以由所述待训练模型生成所述样本用户对应的目标域样本用户向量和所述第一样本物品对应的第一样本物品向量，并基于所述目标域样本用户向量和所述第一样本物品向量，输出所述样本用户和所述第一样本物品的第一预测相似度；其中，所述目标域样本用户向量包括用于表征所述样本用户在所述目标域的独有兴趣的目标独有样本用户向量，以及用于表征所述样本用户在所述目标域和所述辅助域的通用兴趣的共享样本用户向量；
[0008]基于所述第一预测相似度和所述第一目标相似度对所述模型进行迭代训练，直至第一损失函数收敛或迭代次数达到上限
。
[0009]可选的，所述训练样本集包括训练正样本集和训练负样本集，其中，所述训练正样本集包含的样本物品为与所述样本用户存在历史交互行为的物品，所述训练负样本集包含
的样本物品为与所述样本用户不存在所述历史交互行为的物品
。
[0010]可选的，所述待训练模型生成所述样本用户对应的目标域样本用户向量，包括：所述待训练模型基于所述样本用户的
id
特征生成所述目标独有样本用户向量和所述共享样本用户向量；将所述目标独有样本用户向量和所述共享样本用户向量进行融合，得到所述目标域样本用户向量
。
[0011]可选的，所述方法还包括：所述待训练模型生成所述样本用户对应的辅助域样本用户向量和所述第二样本物品对应的第二样本物品向量，并基于所述辅助域样本用户向量和所述第二样本物品向量，输出所述样本用户和所述第二样本物品的第二预测相似度；其中，所述辅助域样本用户向量包括用于表征所述样本用户在所述辅助域的独有兴趣的辅助独有样本用户向量，以及所述共享样本用户向量；基于所述第二预测相似度和所述第二目标相似度对所述模型进行迭代训练，直至第二损失函数收敛或迭代次数达到上限
。
[0012]可选的，所述第一损失函数包括对应于所述目标域样本用户向量的第一结果损失函数，以及对应于所述目标独有样本用户向量和所述共享样本用户向量的第一中间值损失函数；所述第二损失函数包括对应于所述辅助域样本用户向量的第二结果损失函数，以及对应于所述辅助独有样本用户向量和所述共享样本用户向量的第二中间值损失函数
。
[0013]可选的，所述第一结果损失函数用于计算所述目标域样本用户向量与所述第一样本物品向量的预测相似度的损失值；所述第二结果损失函数用于计算所述辅助域样本用户向量与所述第二样本物品向量的预测相似度的损失值
。
[0014]可选的，所述第一中间值损失函数用于计算所述目标独有样本用户向量与所述第一样本物品向量的预测相似度的损失值，以及所述共享样本用户向量与所述第一样本物品向量的预测相似度的损失值；所述第二中间值损失函数用于计算所述辅助独有样本用户向量与所述第二样本物品向量的预测相似度的损失值，以及所述共享样本用户向量与所述第二样本物品向量的预测相似度的损失值
。
[0015]在本公开实施方式的第二方面中，提供了一种跨域推荐方法，包括：
[0016]获取目标用户的
id
特征，以及目标域中待推荐物品的
id
特征；
[0017]基于所述目标用户的
id
特征和所述待推荐物品的
id
特征，分别生成所述目标用户对应的用户向量和所述待推荐物品对应的物品向量；其中，所述用户向量包括用于表征所述目标用户在所述目标域的独有兴趣的独有用户向量，以及用于表征所述目标用户在所述目标域和区别于所述目标域的至少一个辅助域的通用兴趣的共享用户向量；
[0018]基于所述用户向量和所述物品向量计算所述目标用户与所述待推荐物品的相似度，并基于所述相似度向所述目标用户推荐预设数量的目标物品
。
[0019]在本公开实施方式的第三方面中，提供了一种跨域推荐模型的训练装置，包括：
[0020]样本获取单元，用于获取训练样本集，所述训练样本集包括样本用户的
id
特征
、
样本物品的
id
特征以及所述样本用户与所述样本物品的目标相似度；所述样本物品包括目标域的第一样本物品和区别于所述目标域的至少一个辅助域的第二样本物品；所述目标相似度包括所述样本用户与所述第一样本物品的第一目标相似度，以及所述样本用户与所述第二样本物品的第二目标相似度；
[0021]输出单元，用于将所述训练样本集输入待训练模型，以由所述待训练模型生成所述样本用户对应的目标域样本用户向量和所述第一样本物品对应的第一样本物品向量，并
基于所述目标域样本用户向量和所述第一样本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.
一种跨域推荐模型的训练方法，其特征在于，该方法包括：获取训练样本集，所述训练样本集包括样本用户的
id
特征
、
样本物品的
id
特征以及所述样本用户与所述样本物品的目标相似度；所述样本物品包括目标域的第一样本物品和区别于所述目标域的至少一个辅助域的第二样本物品；所述目标相似度包括所述样本用户与所述第一样本物品的第一目标相似度，以及所述样本用户与所述第二样本物品的第二目标相似度；将所述训练样本集输入待训练模型，以由所述待训练模型生成所述样本用户对应的目标域样本用户向量和所述第一样本物品对应的第一样本物品向量，并基于所述目标域样本用户向量和所述第一样本物品向量，输出所述样本用户和所述第一样本物品的第一预测相似度；其中，所述目标域样本用户向量包括用于表征所述样本用户在所述目标域的独有兴趣的目标独有样本用户向量，以及用于表征所述样本用户在所述目标域和所述辅助域的通用兴趣的共享样本用户向量；基于所述第一预测相似度和所述第一目标相似度对所述模型进行迭代训练，直至第一损失函数收敛或迭代次数达到上限
。2.
根据权利要求1所述的方法，其特征在于，还包括：所述待训练模型生成所述样本用户对应的辅助域样本用户向量和所述第二样本物品对应的第二样本物品向量，并基于所述辅助域样本用户向量和所述第二样本物品向量，输出所述样本用户和所述第二样本物品的第二预测相似度；其中，所述辅助域样本用户向量包括用于表征所述样本用户在所述辅助域的独有兴趣的辅助独有样本用户向量，以及所述共享样本用户向量；基于所述第二预测相似度和所述第二目标相似度对所述模型进行迭代训练，直至第二损失函数收敛或迭代次数达到上限
。3.
根据权利要求2所述的方法，其特征在于，所述第一损失函数包括对应于所述目标域样本用户向量的第一结果损失函数，以及对应于所述目标独有样本用户向量和所述共享样本用户向量的第一中间值损失函数；所述第二损失函数包括对应于所述辅助域样本用户向量的第二结果损失函数，以及对应于所述辅助独有样本用户向量和所述共享样本用户向量的第二中间值损失函数
。4.
根据权利要求3所述的方法，其特征在于，所述第一结果损失函数用于计算所述目标域样本用户向量与所述第一样本物品向量的预测相似度的损失值；所述第二结果损失函数用于计算所述辅助域样本用户向量与所述第二样本物品向量的预测相似度的损失值
。5.
根据权利要求3所述的方法，其特征在于，所述第一中间值损失函数用于计算所述目标独有样本用户向量与所述第一样本物品向量的预测相似度的损失值，以及所述共享样本用户向量与所述第一样本物品向量的预测相似度的损失值；所述第二中间值损失函数用于计算所述辅助独有样本用户向量与所述第二样本物品向量的预测相似度的损失值，以及所述共享样本用户向量与所述第二样本物品向量的预测相似度的损失值
。6.
一种跨域推荐方法，其特征在于，该方法包括：获取目标用户的
id
特征，以及目标域中待推荐物品的
...

【专利技术属性】
技术研发人员：张娟，许盛辉，潘照明，
申请(专利权)人：杭州网之易创新科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人