基于多个数据域确定用户与物品的关联关系的方法及装置制造方法及图纸

技术编号:21659576 阅读:57 留言:0更新日期:2019-07-20 05:51
本说明书实施例提供一种计算机执行的、基于多个数据域确定用户与物品的关联关系的方法和装置,多个数据域至少对应第一二部图和第二二部图,在方法中,首先获取两个二部图的用户集合交集中的第一用户在第一二部图中的第一嵌入向量,和在第二二部图中的第二嵌入向量;基于这两个向量,获取第一用户的融合用户向量。此外,获取两个二部图中任意的第一物品在对应二部图中的第一物品嵌入向量;然后,基于融合用户向量和第一物品嵌入向量,确定该第一用户和第一物品之间的关联关系。还可以对物品交集中的物品的嵌入向量进行融合,基于融合物品向量确定用户与物品的关联关系。

A Method and Device for Determining the Association between Users and Items Based on Multiple Data Domains

【技术实现步骤摘要】
基于多个数据域确定用户与物品的关联关系的方法及装置
本说明书一个或多个实施例涉及机器学习领域,尤其涉及计算机执行的、预测用户与物品的关联关系的方法和装置。
技术介绍
关系网络图是对现实世界中实体之间的关系的描述,目前广泛地应用于各种计算机信息处理中。一般地,关系网络图包含节点集合和边集合,节点表示现实世界中的实体,边表示现实世界中实体之间的联系。在许多情况下,希望将关系网络图中的元素或结构用向量的形式进行表示,这个过程称为图嵌入。在图嵌入的方法中,通常会根据节点特征,以及网络关系,学习得到节点的嵌入向量。常见的图嵌入方法有deepwalk,node2vec,以及structure2vec等。关系网络图的图嵌入可以应用于多种技术场景。例如,在一种技术场景中,关系网络图中的节点可以包括用户和物品。通过对这样的关系网络图进行图嵌入和进一步分析,可以得到用户与物品之间的关联关系,从而可以进行物品推荐、打分预测等。在图嵌入的学习和使用中,常常受限于数据稀疏性的影响,无法学习到较优的嵌入模型,使得性能受到限制。因此,希望能有改进的方案,能够更好地利用和发掘可用数据,从而提升基于图嵌入的用户-物品分析。
技术实现思路
本说明书一个或多个实施例描述了基于多个数据域确定用户与物品的关联关系的方法及装置,其中通过融合多个数据域对应的二部图中的数据,获得更加全面的用户融合数据或物品融合数据,基于融合数据进行用户-物品关联关系的分析,提高分析的准确性以及物品推荐的准确性。根据第一方面,提供了一种计算机执行的、基于多个数据域确定用户与物品的关联关系的方法,所述多个数据域包括第一数据域和第二数据域,所述第一数据域包括,基于第一用户集合和第一物品集合形成的第一二部图,第二数据域包括,基于第二用户集合和第二物品集合形成的第二二部图,所述方法包括:获取第一用户在所述第一二部图中的第一嵌入向量,以及在第二二部图中的第二嵌入向量,所述第一用户属于所述第一用户集合和第二用户集合的交集;基于所述第一嵌入向量和第二嵌入向量,获取所述第一用户的融合用户向量;获取第一物品的第一物品嵌入向量,其中,所述第一物品属于所述第一物品集合,所述第一物品嵌入向量为所述第一物品在所述第一二部图中的嵌入向量;或者,所述第一物品属于第二物品集合,所述第一物品嵌入向量为所述第一物品在所述第二二部图中的嵌入向量;基于所述融合用户向量和所述第一物品嵌入向量,确定所述第一用户和所述第一物品之间的关联关系。根据一种实施方式,通过以下方式获取上述第一嵌入向量:利用预先训练的图嵌入模型,处理所述第一用户在所述第一二部图中的特征信息,得到所述第一嵌入向量。在一个实施例中,所述图嵌入模型通过以下方式训练:根据所述图嵌入模型的模型参数集,确定所述第一用户集合中第二用户对应的第二用户嵌入向量,以及所述第一物品集合中第二物品对应的第二物品嵌入向量;根据所述第二用户嵌入向量和所述第二物品嵌入向量,确定第二用户和第二物品之间的关联度预测值;根据所述第二用户对所述第二物品的用户操作,确定关联度标签值;根据所述关联度预测值和关联度标签值,确定模型预测的损失值;在损失值减小的方向,更新所述模型参数集。进一步的,在一个实施例中,所述用户操作包括打分,所述关联度标签值包括打分的分值;或者,所述用户操作包括以下中的至少一项:点击,浏览,购买;所述关联度标签值包括,二分类标签值。根据一种实施方式,通过以下方式之一获取融合用户向量:计算所述第一嵌入向量和第二嵌入向量的均值,作为所述融合用户向量;对所述第一嵌入向量和第二嵌入向量进行加权求和,将求和结果作为所述融合用户向量;将所述第一嵌入向量和第二嵌入向量中模值较大的向量,作为所述融合用户向量。在一个实施例中,基于所述融合用户向量和所述第一物品嵌入向量,确定所述第一用户和所述第一物品之间的关联关系包括:对所述融合用户向量和所述第一物品嵌入向量进行点积操作,基于点积结果确定所述关联关系。根据一种实施方式,所述方法还包括,根据所述关联关系,预测所述第一用户对所述第一物品的评分。根据一种实施方式,所述方法还包括,根据所述关联关系,确定所述第一物品对所述第一用户的推荐度,以用于向所述第一用户进行物品推荐。根据第二方面,提供一种计算机执行的、基于多个数据域预测用户与物品的关联关系的方法,所述多个数据域包括第一数据域和第二数据域,所述第一数据域包括,基于第一用户集合和第一物品集合形成的第一二部图,第二数据域包括,基于第二用户集合和第二物品集合形成的第二二部图,所述方法包括:获取第一物品在所述第一二部图中的第一嵌入向量,以及在第二二部图中的第二嵌入向量,所述第一物品属于所述第一物品集合和第二物品集合的交集;基于所述第一嵌入向量和第二嵌入向量,获取所述第一物品的融合物品向量;获取第一用户的第一用户嵌入向量,其中,所述第一用户属于所述第一用户集合,所述第一用户嵌入向量为所述第一用户在所述第一二部图中的嵌入向量;或者,所述第一用户属于第二用户集合,所述第一用户嵌入向量为所述第一用户在所述第二二部图中的嵌入向量;基于所述融合物品向量和所述第一用户嵌入向量,确定所述第一用户和所述第一物品之间的关联关系。在一种实施方式中,通过以下方式获取第一嵌入向量:利用预先训练的图嵌入模型,处理所述第一物品在所述第一二部图中的特征信息,得到所述第一嵌入向量。在一个实施例中,通过以下方式之一获取第一物品的融合物品向量:计算所述第一嵌入向量和第二嵌入向量的均值,作为所述融合物品向量;对所述第一嵌入向量和第二嵌入向量进行加权求和,将求和结果作为所述融合物品向量;将所述第一嵌入向量和第二嵌入向量中模值较大的向量,作为所述融合物品向量。根据一种实施方式,通过对所述融合物品向量和所述第一用户嵌入向量进行点积操作,基于点积结果来确定第一用户和第一物品的关联关系。根据第三方面,提供一种基于多个数据域确定用户与物品的关联关系的装置,所述多个数据域包括第一数据域和第二数据域,所述第一数据域包括,基于第一用户集合和第一物品集合形成的第一二部图,第二数据域包括,基于第二用户集合和第二物品集合形成的第二二部图,所述装置包括:用户向量获取单元,配置为获取第一用户在所述第一二部图中的第一嵌入向量,以及在第二二部图中的第二嵌入向量,所述第一用户属于所述第一用户集合和第二用户集合的交集;向量融合单元,配置为基于所述第一嵌入向量和第二嵌入向量,获取所述第一用户的融合用户向量;物品向量获取单元,配置为获取第一物品的第一物品嵌入向量,其中,所述第一物品属于所述第一物品集合,所述第一物品嵌入向量为所述第一物品在所述第一二部图中的嵌入向量;或者,所述第一物品属于第二物品集合,所述第一物品嵌入向量为所述第一物品在所述第二二部图中的嵌入向量;确定单元,配置为基于所述融合用户向量和所述第一物品嵌入向量,确定所述第一用户和所述第一物品之间的关联关系。根据第四方面,提供一种基于多个数据域预测用户与物品的关联关系的装置,所述多个数据域包括第一数据域和第二数据域,所述第一数据域包括,基于第一用户集合和第一物品集合形成的第一二部图,第二数据域包括,基于第二用户集合和第二物品集合形成的第二二部图,所述装置包括:物品向量获取单元,配置为获取第一物品在所述本文档来自技高网...

【技术保护点】
1.一种计算机执行的、基于多个数据域确定用户与物品的关联关系的方法,所述多个数据域包括第一数据域和第二数据域,所述第一数据域包括,基于第一用户集合和第一物品集合形成的第一二部图,第二数据域包括,基于第二用户集合和第二物品集合形成的第二二部图,所述方法包括:获取第一用户在所述第一二部图中的第一嵌入向量,以及在第二二部图中的第二嵌入向量,所述第一用户属于所述第一用户集合和第二用户集合的交集;基于所述第一嵌入向量和第二嵌入向量,获取所述第一用户的融合用户向量;获取第一物品的第一物品嵌入向量,其中,所述第一物品属于所述第一物品集合,所述第一物品嵌入向量为所述第一物品在所述第一二部图中的嵌入向量;或者,所述第一物品属于第二物品集合,所述第一物品嵌入向量为所述第一物品在所述第二二部图中的嵌入向量;基于所述融合用户向量和所述第一物品嵌入向量,确定所述第一用户和所述第一物品之间的关联关系。

【技术特征摘要】
1.一种计算机执行的、基于多个数据域确定用户与物品的关联关系的方法,所述多个数据域包括第一数据域和第二数据域,所述第一数据域包括,基于第一用户集合和第一物品集合形成的第一二部图,第二数据域包括,基于第二用户集合和第二物品集合形成的第二二部图,所述方法包括:获取第一用户在所述第一二部图中的第一嵌入向量,以及在第二二部图中的第二嵌入向量,所述第一用户属于所述第一用户集合和第二用户集合的交集;基于所述第一嵌入向量和第二嵌入向量,获取所述第一用户的融合用户向量;获取第一物品的第一物品嵌入向量,其中,所述第一物品属于所述第一物品集合,所述第一物品嵌入向量为所述第一物品在所述第一二部图中的嵌入向量;或者,所述第一物品属于第二物品集合,所述第一物品嵌入向量为所述第一物品在所述第二二部图中的嵌入向量;基于所述融合用户向量和所述第一物品嵌入向量,确定所述第一用户和所述第一物品之间的关联关系。2.根据权利要求1所述的方法,其中,获取第一用户在所述第一二部图中的第一嵌入向量包括:利用预先训练的图嵌入模型,处理所述第一用户在所述第一二部图中的特征信息,得到所述第一嵌入向量。3.根据权利要求2所述的方法,其中,所述图嵌入模型通过以下方式训练:根据所述图嵌入模型的模型参数集,确定所述第一用户集合中第二用户对应的第二用户嵌入向量,以及所述第一物品集合中第二物品对应的第二物品嵌入向量;根据所述第二用户嵌入向量和所述第二物品嵌入向量,确定第二用户和第二物品之间的关联度预测值;根据所述第二用户对所述第二物品的用户操作,确定关联度标签值;根据所述关联度预测值和关联度标签值,确定模型预测的损失值;在损失值减小的方向,更新所述模型参数集。4.根据权利要求3所述的方法,其中,所述用户操作包括打分,所述关联度标签值包括打分的分值;或者,所述用户操作包括以下中的至少一项:点击,浏览,购买;所述关联度标签值包括,二分类标签值。5.根据权利要求1所述的方法,其中,基于所述第一嵌入向量和第二嵌入向量,获取所述第一用户的融合用户向量包括以下之一:计算所述第一嵌入向量和第二嵌入向量的均值,作为所述融合用户向量;对所述第一嵌入向量和第二嵌入向量进行加权求和,将求和结果作为所述融合用户向量;将所述第一嵌入向量和第二嵌入向量中模值较大的向量,作为所述融合用户向量。6.根据权利要求1所述的方法,其中,基于所述融合用户向量和所述第一物品嵌入向量,确定所述第一用户和所述第一物品之间的关联关系包括:对所述融合用户向量和所述第一物品嵌入向量进行点积操作,基于点积结果确定所述关联关系。7.根据权利要求1所述的方法,还包括,根据所述关联关系,预测所述第一用户对所述第一物品的评分。8.根据权利要求1所述的方法,还包括,根据所述关联关系,确定所述第一物品对所述第一用户的推荐度,以用于向所述第一用户进行物品推荐。9.一种计算机执行的、基于多个数据域预测用户与物品的关联关系的方法,所述多个数据域包括第一数据域和第二数据域,所述第一数据域包括,基于第一用户集合和第一物品集合形成的第一二部图,第二数据域包括,基于第二用户集合和第二物品集合形成的第二二部图,所述方法包括:获取第一物品在所述第一二部图中的第一嵌入向量,以及在第二二部图中的第二嵌入向量,所述第一物品属于所述第一物品集合和第二物品集合的交集;基于所述第一嵌入向量和第二嵌入向量,获取所述第一物品的融合物品向量;获取第一用户的第一用户嵌入向量,其中,所述第一用户属于所述第一用户集合,所述第一用户嵌入向量为所述第一用户在所述第一二部图中的嵌入向量;或者,所述第一用户属于第二用户集合,所述第一用户嵌入向量为所述第一用户在所述第二二部图中的嵌入向量;基于所述融合物品向量和所述第一用户嵌入向量,确定所述第一用户和所述第一物品之间的关联关系。10.根据权利要求9所述的方法,其中,获取第一物品在所述第一二部图中的第一嵌入向量包括:利用预先训练的图嵌入模型,处理所述第一物品在所述第一二部图中的特征信息,得到所述第一嵌入向量。11.根据权利要求9所述的方法,其中,基于所述第一嵌入向量和第二嵌入向量,获取所述第一物品的融合物品向量包括以下之一:计算所述第一嵌入向量和第二嵌入向量的均值,作为所述融合物品向量;对所述第一嵌入向量和第二嵌入向量进行加权求和,将求和结果作为所述融合物品向量;将所述第一嵌入向量和第二嵌入向量中模值较大的向量,作为所述融合物品向量。12.根据权利要求9所述的方法,其中,基于所述融合物品向量和所述第一用户嵌入向量,确定所述第一用户和所述第一物品之间的关联关系包括:对所述融合物品向量和所述第一用户嵌入向量进行点积操作,基于点积结果确定所述关联关系。13.一种基于多个数据域确定用户与物品的关联关系的装置,所述多个数据域包括第一数据域和第二数据域,所述第一数据域包括,基于第一用户集合和第一物品集合形成的第一二部图,第二数据...

【专利技术属性】
技术研发人员:陈超超王力周俊
申请(专利权)人:阿里巴巴集团控股有限公司
类型:发明
国别省市:开曼群岛,KY

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1