当前位置: 首页 > 专利查询>浙江大学专利>正文

一种基于知识图谱规则嵌入的组合商品挖掘方法技术

技术编号:28039628 阅读:29 留言:0更新日期:2021-04-09 23:22
本发明专利技术公开了一种基于知识图谱规则嵌入的组合商品挖掘方法,包括:将规则、商品、属性和属性值表示成embedding;将规则和属性的embedding拼接输入到第一个神经网络中得到属性的重要性分数;将规则和属性拼接输入到第二个神经网络中得到这条规则在该属性下应该取的属性值的embedding;计算输入的两个商品在该属性下的取值与模型计算出来的属性值的embedding的相似性程度;计算所有的属性‑属性值对的得分汇总后可以得到这两个商品在该规则下的得分;然后与这两个商品真实的分数做交叉熵损失,用基于梯度下降的优化算法迭代训练;模型训练好后可以通过类似的方式解析规则的embedding,从而得到人可以理解的规则。

【技术实现步骤摘要】
一种基于知识图谱规则嵌入的组合商品挖掘方法
本专利技术涉及知识图谱规则领域,尤其是涉及一种基于知识图谱规则嵌入的组合商品挖掘方法。
技术介绍
在知识图谱中,用三元组(head,relation,tail)来表示知识。我们可以用独热向量来表示这个知识。但实体和关系太多,维度太大。当两个实体或关系很近时,独热向量无法捕捉相似度。受Wrod2Vec模型的启发,学术界提出了很多用分布表示来表示实体和关系的方法(KGE),如TransE,TransH,TransR等等。这些模型的基本思想是通过对图结构的学习,可以用低维稠密向量来表示head、relation和tail。比如TransE,就是让head向量和relation向量的和尽可能靠近tail向量。在TransE中,一个三元组的得分为对于正确的三元组(h,r,t)∈△,应该有较低的得分,而错误的三元组(h′,r′,t′)∈△′,应该有比较高的得分,最终的损失函数为:知识图谱就只有正确的三元组(goldentriplet),因此可以通过破坏一个正确三元组的头实体或者尾实本文档来自技高网...

【技术保护点】
1.一种基于知识图谱规则嵌入的组合商品挖掘方法,其特征在于,包括:/n(1)构建商品的知识图谱,对于知识图谱中的每个三元组数据,头实体为商品I,关系为商品属性P,尾实体为商品属性值V;/n(2)将商品I、商品属性P、商品属性值V分别表示成embedding,并随机初始化若干个规则的embedding;/n(3)将规则的embedding和商品属性的embedding拼接输入到第一个神经网络中,得到商品属性的重要性分数s

【技术特征摘要】
1.一种基于知识图谱规则嵌入的组合商品挖掘方法,其特征在于,包括:
(1)构建商品的知识图谱,对于知识图谱中的每个三元组数据,头实体为商品I,关系为商品属性P,尾实体为商品属性值V;
(2)将商品I、商品属性P、商品属性值V分别表示成embedding,并随机初始化若干个规则的embedding;
(3)将规则的embedding和商品属性的embedding拼接输入到第一个神经网络中,得到商品属性的重要性分数s1;
(4)将规则的embedding和商品属性的embedding拼接输入到第二个神经网络中,得到该规则在该属性下应该取得的属性值的embedding:Vpred;
(5)将规则的embedding和商品属性的embedding拼接输入到第三个神经网络中,计算某条规则在某个属性下的属性值相同的概率分数p;
(6)若两个商品在某个属性下的属性值不同,计算Vpred和V1的相似度分数s21,以及Vpred和V2的相似度分数s22;若两个商品在该属性下的属性值相同,计算Vpred和Vture的相似度分数s2;
其中,V1表示两个商品中的一个商品在该属性下属性值的embedding,V2为另一个商品在该属性下属性值的embedding,Vture为该相同属性值的embedding;
(7)当某个属性的重要性分数s1大于阈值thres1,且在该属性下两个商品的属性值相同,则汇总得到这个属性-属性值对的分数scoreij为s1×(p+(1-p)×s2);当某个属性的重要性分数s1大于thres1,且在该属性下两个商品的属性值不同,则汇总得到这个属性-属性值对的分数scoreij为0.5×s1×(s21+s22);当某个属性的重要性分数s1小于等于thres1时,此时这个属性-属性值对的得分为0;
(8)汇总一个商品对的m个属性-属性值对的得分scoreij得到scorei:



(9)汇总n条规则下一个商品对的得分scorei,得到该商品对最终的得分score:



(10)将得到的一个商品对的score与两个是否属于组合品的标签0或者1比较得到交叉熵损失;基于梯度下降的优化算法迭代求解直至损失值收敛,三个神经网络的参数训练完毕,同时得到学习完规则的embedding;
(11)对于学习完规则的embedding,利用上述训练完毕的神经网络进行解析,得到商品组合的规则。


2.根据权利要求1所述的基于知识图谱规则嵌入的组合商品挖掘方法,其特征在于,步骤(2)中,将商品I、商品属性P、商品属性值V以及若干个规则都分别编号成一个id,然后每个id再构成一个onehot向量,之后将这个onehot向量映射成一个embedding,该embeding会随着模型训练过程不断优化。


3.根据权利要求1所述的基于知识图谱规则嵌入的组合商品挖掘方法,其特征在于,步骤(3)~(5...

【专利技术属性】
技术研发人员:陈华钧康矫健张文
申请(专利权)人:浙江大学
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1