【技术实现步骤摘要】
一种基于知识图谱规则嵌入的组合商品挖掘方法
本专利技术涉及知识图谱规则领域,尤其是涉及一种基于知识图谱规则嵌入的组合商品挖掘方法。
技术介绍
在知识图谱中,用三元组(head,relation,tail)来表示知识。我们可以用独热向量来表示这个知识。但实体和关系太多,维度太大。当两个实体或关系很近时,独热向量无法捕捉相似度。受Wrod2Vec模型的启发,学术界提出了很多用分布表示来表示实体和关系的方法(KGE),如TransE,TransH,TransR等等。这些模型的基本思想是通过对图结构的学习,可以用低维稠密向量来表示head、relation和tail。比如TransE,就是让head向量和relation向量的和尽可能靠近tail向量。在TransE中,一个三元组的得分为对于正确的三元组(h,r,t)∈△,应该有较低的得分,而错误的三元组(h′,r′,t′)∈△′,应该有比较高的得分,最终的损失函数为:知识图谱就只有正确的三元组(goldentriplet),因此可以通过破坏一个正确三 ...
【技术保护点】
1.一种基于知识图谱规则嵌入的组合商品挖掘方法,其特征在于,包括:/n(1)构建商品的知识图谱,对于知识图谱中的每个三元组数据,头实体为商品I,关系为商品属性P,尾实体为商品属性值V;/n(2)将商品I、商品属性P、商品属性值V分别表示成embedding,并随机初始化若干个规则的embedding;/n(3)将规则的embedding和商品属性的embedding拼接输入到第一个神经网络中,得到商品属性的重要性分数s
【技术特征摘要】
1.一种基于知识图谱规则嵌入的组合商品挖掘方法,其特征在于,包括:
(1)构建商品的知识图谱,对于知识图谱中的每个三元组数据,头实体为商品I,关系为商品属性P,尾实体为商品属性值V;
(2)将商品I、商品属性P、商品属性值V分别表示成embedding,并随机初始化若干个规则的embedding;
(3)将规则的embedding和商品属性的embedding拼接输入到第一个神经网络中,得到商品属性的重要性分数s1;
(4)将规则的embedding和商品属性的embedding拼接输入到第二个神经网络中,得到该规则在该属性下应该取得的属性值的embedding:Vpred;
(5)将规则的embedding和商品属性的embedding拼接输入到第三个神经网络中,计算某条规则在某个属性下的属性值相同的概率分数p;
(6)若两个商品在某个属性下的属性值不同,计算Vpred和V1的相似度分数s21,以及Vpred和V2的相似度分数s22;若两个商品在该属性下的属性值相同,计算Vpred和Vture的相似度分数s2;
其中,V1表示两个商品中的一个商品在该属性下属性值的embedding,V2为另一个商品在该属性下属性值的embedding,Vture为该相同属性值的embedding;
(7)当某个属性的重要性分数s1大于阈值thres1,且在该属性下两个商品的属性值相同,则汇总得到这个属性-属性值对的分数scoreij为s1×(p+(1-p)×s2);当某个属性的重要性分数s1大于thres1,且在该属性下两个商品的属性值不同,则汇总得到这个属性-属性值对的分数scoreij为0.5×s1×(s21+s22);当某个属性的重要性分数s1小于等于thres1时,此时这个属性-属性值对的得分为0;
(8)汇总一个商品对的m个属性-属性值对的得分scoreij得到scorei:
(9)汇总n条规则下一个商品对的得分scorei,得到该商品对最终的得分score:
(10)将得到的一个商品对的score与两个是否属于组合品的标签0或者1比较得到交叉熵损失;基于梯度下降的优化算法迭代求解直至损失值收敛,三个神经网络的参数训练完毕,同时得到学习完规则的embedding;
(11)对于学习完规则的embedding,利用上述训练完毕的神经网络进行解析,得到商品组合的规则。
2.根据权利要求1所述的基于知识图谱规则嵌入的组合商品挖掘方法,其特征在于,步骤(2)中,将商品I、商品属性P、商品属性值V以及若干个规则都分别编号成一个id,然后每个id再构成一个onehot向量,之后将这个onehot向量映射成一个embedding,该embeding会随着模型训练过程不断优化。
3.根据权利要求1所述的基于知识图谱规则嵌入的组合商品挖掘方法,其特征在于,步骤(3)~(5...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。