商品图谱向量化方法、装置、电子设备及存储介质制造方法及图纸

技术编号:32293503 阅读:13 留言:0更新日期:2022-02-12 20:03
本公开提供了一种商品图谱向量化方法、装置、电子设备及存储介质,涉及知识图谱技术领域。该方法包括:构建商品图谱,其中,商品图谱中至少包含如下维度的实体关系:用户维度、商品维度和品类维度;根据从电商平台采集的商品数据和用户交互数据,学习商品图谱中实体关系的向量表示,得到商品图谱向量化表示模型。本公开能够得到一个适用于商品领域的商品图谱向量化表示模型,基于该商品图谱向量化模型,能够实现商品领域的商品推荐、商品搜索、图谱补全等任务。补全等任务。补全等任务。

【技术实现步骤摘要】
商品图谱向量化方法、装置、电子设备及存储介质


[0001]本公开涉及知识图谱
,尤其涉及一种商品图谱向量化方法、装置、电子设备及存储介质。

技术介绍

[0002]知识图谱是大规模语义网络知识库,采取符号化的知识表示方式,利用三元组来描述具体的知识,并以有向图的形式对其进行表示和存储,具有语义丰富、结构友好、易于理解等优点。由于在表达人类先验知识上具有优良的特性,知识图谱近年来在自然语言处理、问答系统、推荐系统等诸多领域取得了广泛且成功的应用。目前,知识图谱对三元组的定义比较简单,实体之间的关系主要为继承关系或组合关系,一般只有文本模态,语义关系较为简单。
[0003]知识图谱嵌入(Knowledge Graph Embedding,KGE)学习知识库中的实体关系的向量表示。相关技术中提供的知识图谱嵌入模型,大多数情况下都是用于图谱补全任务中,还有关系抽取和智能问答两大任务,在商品领域的推荐、搜索等任务中应用较少,这是因为商品图谱数据存在噪音和数据稀疏性问题。
[0004]需要说明的是,在上述
技术介绍
部分公开的信息仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。

技术实现思路

[0005]本公开提供一种商品图谱向量化方法、装置、电子设备及存储介质,至少在一定程度上克服相关技术中提供的知识图谱嵌入模型不适用于商品图谱数据的技术问题。
[0006]本公开的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本公开的实践而习得。r/>[0007]根据本公开的一个方面,提供了一种商品图谱向量化方法,该方法包括:构建商品图谱,其中,所述商品图谱中至少包含如下维度的实体关系:用户维度、商品维度和品类维度;根据从电商平台采集的商品数据和用户交互数据,学习所述商品图谱中实体关系的向量表示,得到商品图谱向量化表示模型。
[0008]在一些实施例中,所述用户维度的实体关系包括:共同购买和共同浏览;所述商品维度的实体关系包括:相似商品和商品描述;所述品类维度的实体关系包括:商品所属类目的层级关系。
[0009]在一些实施例中,根据从电商平台采集的商品数据和用户交互数据,学习所述商品图谱中实体关系的向量表示,得到商品图谱向量化表示模型,包括:根据采集的商品数据,确定相似商品的向量表示;使用自注意力机制从采集的商品数据和用户交互数据中,提取共同购买、共同浏览、商品描述和商品所属类目层级关系的向量表示。
[0010]在一些实施例中,根据采集的商品数据,确定相似商品的向量表示,包括:从采集的商品数据中提取各个商品的商品标题和/或商品描述信息;对各个商品的商品标题和/或
商品描述信息进行分词,得到分词结果;使用word2vec模型训练方法对分词结果进行训练,得到word2vec模型在商品数据集上的模型文件;使用word2vec模型在商品数据集上的模型文件,根据各个商品的商品标题生成各个商品的向量表示;根据各个商品的向量表示,计算各个商品之间的相似度;根据各个商品之间的相似度确定相似商品,生成相似商品的向量表示。
[0011]在一些实施例中,本公开提供的商品图谱向量化方法还包括:将待执行任务的标注数据作为模型输出数据,对商品图谱向量化表示模型进行参数优化,得到适用于待执行任务的商品图谱向量化表示模型。
[0012]在一些实施例中,上述待执行任务为如下任意之一:商品知识图谱补全任务、商品搜索排序任务或商品推荐任务。
[0013]在一些实施例中,本公开提供的商品图谱向量化方法还包括:采集如下多种模态的商品数据:文字、图片或视频。
[0014]根据本公开的另一个方面,还提供了一种商品图谱向量化装置,该装置包括:商品图谱构建模块,用于构建商品图谱,其中,所述商品图谱中至少包含如下维度的实体关系:用户维度、商品维度和品类维度;商品图谱向量化模块,用于根据从电商平台采集的商品数据和用户交互数据,学习所述商品图谱中实体关系的向量表示,得到商品图谱向量化表示模型。
[0015]在一些实施例中,所述用户维度的实体关系包括:共同购买和共同浏览;所述商品维度的实体关系包括:相似商品和商品描述;所述品类维度的实体关系包括:商品所属类目的层级关系。
[0016]在一些实施例中,上述商品图谱向量化模块还用于:根据采集的商品数据,确定相似商品的向量表示;使用自注意力机制从采集的商品数据和用户交互数据中,提取共同购买、共同浏览、商品描述和商品所属类目层级关系的向量表示。
[0017]在一些实施例中,上述商品图谱向量化模块还用于:从采集的商品数据中提取各个商品的商品标题和/或商品描述信息;对各个商品的商品标题和/或商品描述信息进行分词,得到分词结果;使用word2vec模型训练方法对分词结果进行训练,得到word2vec模型在商品数据集上的模型文件;使用word2vec模型在商品数据集上的模型文件,根据各个商品的商品标题生成各个商品的向量表示;根据各个商品的向量表示,计算各个商品之间的相似度;根据各个商品之间的相似度确定相似商品,生成相似商品的向量表示。
[0018]在一些实施例中,本公开实施例中提供的商品图谱向量化装置还包括:模型优化模块,用于将待执行任务的标注数据作为模型输出数据,对商品图谱向量化表示模型进行参数优化,得到适用于待执行任务的商品图谱向量化表示模型。
[0019]在一些实施例中,上述待执行任务为如下任意之一:商品知识图谱补全任务、商品搜索排序任务或商品推荐任务。
[0020]在一些实施例中,本公开提供的商品图谱向量化装置还包括:数据采集模块,用于采集如下多种模态的商品数据:文字、图片或视频。
[0021]根据本公开的另一个方面,还提供了一种电子设备,该电子设备包括:处理器;以及存储器,用于存储所述处理器的可执行指令;其中,所述处理器配置为经由执行所述可执行指令来执行上述任意一项所述的商品图谱向量化方法。
[0022]根据本公开的另一个方面,还提供了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述任意一项所述的商品图谱向量化方法。
[0023]本公开的实施例所提供的商品图谱向量化方法、装置、电子设备及存储介质,构建包含用户维度、商品维度和品类维度等实体关系的商品图谱,进而根据从电商平台采集的商品数据和用户交互数据,学习所述商品图谱中实体关系的向量表示,能够得到一个适用于商品领域的商品图谱向量化表示模型,基于该商品图谱向量化模型,能够实现商品领域的商品推荐、商品搜索、图谱补全等任务。
[0024]应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
[0025]此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种商品图谱向量化方法,其特征在于,包括:构建商品图谱,其中,所述商品图谱中至少包含如下维度的实体关系:用户维度、商品维度和品类维度;根据从电商平台采集的商品数据和用户交互数据,学习所述商品图谱中实体关系的向量表示,得到商品图谱向量化表示模型。2.根据权利要求1所述的商品图谱向量化方法,其特征在于,所述用户维度的实体关系包括:共同购买和共同浏览;所述商品维度的实体关系包括:相似商品和商品描述;所述品类维度的实体关系包括:商品所属类目的层级关系。3.根据权利要求1所述的商品图谱向量化方法,其特征在于,根据从电商平台采集的商品数据和用户交互数据,学习所述商品图谱中实体关系的向量表示,得到商品图谱向量化表示模型,包括:根据采集的商品数据,确定相似商品的向量表示;使用自注意力机制从采集的商品数据和用户交互数据中,提取共同购买、共同浏览、商品描述和商品所属类目层级关系的向量表示。4.根据权利要求2所述的商品图谱向量化方法,其特征在于,根据采集的商品数据,确定相似商品的向量表示,包括:从采集的商品数据中提取各个商品的商品标题和/或商品描述信息;对各个商品的商品标题和/或商品描述信息进行分词,得到分词结果;使用word2vec模型训练方法对分词结果进行训练,得到word2vec模型在商品数据集上的模型文件;使用word2vec模型在商品数据集上的模型文件,根据各个商品的商品标题生成各个商品的向量表示;根据各个商...

【专利技术属性】
技术研发人员:杨艳丽毛建新范亚国陈志刚高源张烨
申请(专利权)人:国能北京商务网络有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1