基于图嵌入算法的召回方法、装置、电子设备及介质制造方法及图纸

技术编号:33645529 阅读:27 留言:0更新日期:2022-06-02 20:22
本申请公开了一种基于图嵌入算法的召回方法、装置、电子设备及介质。本申请中,可以获取与至少一个样本用户关联的行为数据的至少一个推荐物品Item,行为数据包括文本、视频以及图像的其中一种;计算得到每个样本用户对应的至少一个Item的embedding向量平均值,并将embedding向量平均值以及对应样本用户的用户信息合并作为输入特征输入到初始图嵌入模型;利用key

【技术实现步骤摘要】
基于图嵌入算法的召回方法、装置、电子设备及介质


[0001]本申请中涉及数据处理技术,尤其是一种基于图嵌入算法的召回方法、装置、电子设备及介质。

技术介绍

[0002]当前,多模态检索问题已经吸引了大量学者的关注。由于在互联网中存在着大量的多媒体数据,如图像、文本、视频等等,也就因此对于一个目标的语义描述提供了多种多样的表达方式。
[0003]例如对于猫的描述形式可以包含:一段关于猫的描述的文字,一段猫的录制视频,一段猫叫声的录音,或者是一些关于猫的照片。而多模态检索问题就是针对这种多模态之间的交叉检索,即用图片去检索相关的文本,或者用文本去检索相关的图片。
[0004]然而,目前的单独基于图嵌入的召回方法只包含了物品的特征,而未对物品和用户的特征进行交叉,这也导致召回的准确率不高。

技术实现思路

[0005]本申请实施例提供一种基于图嵌入算法的召回方法、装置、电子设备及介质。用以解决相关技术中存在的,图嵌入的召回方法只包含了物品的特征所导致的召回准确率不高的问题。
[0006]其中,根据本申请实施例的一本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于图嵌入算法的召回方法,其特征在于,包括:获取与至少一个样本用户关联的行为数据的至少一个推荐物品Item,所述行为数据包括文本、视频以及图像的其中一种;计算得到每个样本用户对应的所述至少一个Item的embedding向量平均值,并将所述embedding向量平均值以及对应样本用户的用户信息合并作为输入特征输入到初始图嵌入模型;利用key

value算法,计算每两个输入特征之间的注意力函数相似性得分,并将所述注意力函数相似性得分输入到所述初始图嵌入模型的全连接层,得到每个样本用户的目标向量;对每个样本用户的目标向量进行多分类任务训练,确定每个Item被用户选取的概率。2.如权利要求1所述的方法,其特征在于,所述计算得到每个样本用户对应的所述至少一个Item的embedding向量平均值,包括:提取出所述行为数据中存在的用户行为数据,并利用所述用户行为数据构造每个item有向图;通过随机游走算法从所述item有向图中生成item序列,并通过word2vec方式对所述item序列进行训练,得到每个item的embedding向量;对所述每个item的embedding向量进行相加取平均值,得到所述至少一个Item的embedding向量平均值。3.如权利要求1所述的方法,其特征在于,所述利用如下公式计算每两个输入特征之间的注意力函数相似性得分,包括:的注意力函数相似性得分,包括:其中,m和n为任意两个输入特征的序号,e对应于输入特征,ψ
(h)
对应于两个输入特征之间的注意力函数相似性得分,M对应于输入特征的总数量。4.如权利要求3所述的方法,其特征在于,在所述计算每两个输入特征之间的注意力函数相似性得分之后,还包括:利用残差网络对所述注意力函数相似性得分进行优化,其中所述残差网络由下述公式得到:其中,H对应于注意力函数相似性得分的数量,对应于最终的注意力函数相似性得分。5.如权利要求1所述的方法,其特征在于,所述对每个样本用户的目标向量进...

【专利技术属性】
技术研发人员:刘斌何英杰张睿郑轩
申请(专利权)人:特斯联科技集团有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1