【技术实现步骤摘要】
用于生成节点的向量表示的方法和装置
本申请实施例涉及计算机
,具体涉及用于生成节点的向量表示的方法和装置。
技术介绍
知识图谱中,树结构是描述集合或可传递层次关系的一种常用数据结构,常被用来表征知识的上下位关系,如概念体系结构、百科的类别结构、知网、概念网等知识图谱数据。目前,常用的知识图谱嵌入到向量空间的方法主要包括以下三种:其一,基于图结构中的路径信息,使用有偏随机游走采样,将图结构嵌入到向量空间中,训练得到节点的向量表示;其二,利用图注意力机制学习图中的节点及边关系,训练得到知识图谱中节点及边关系的向量表示;其三,基于三元组关系学习图中节点及边关系,训练得到节点的向量表示。然而,上述三种方法均无法捕捉到可传递的语义相似关系,不适用于树结构知识图谱。
技术实现思路
本申请实施例提出了用于生成节点的向量表示的方法和装置。第一方面,本申请实施例提出了一种用于生成节点的向量表示的方法,包括:获取树结构中的节点的标识和相似节点集合,其中,节点是知识图谱中的实体;构造向量化模型,其中,向量化模型的参数是节点的初始向量表示;将节点的标识作为输入,将节点的相似节点集合作为输出,通过迭代更新节点的初始向量表示对向量化模型进行训练,直至向量化模型收敛,得到节点的向量表示。在一些实施例中,获取树结构中的节点的相似节点集合,包括:基于节点在树结构上单向遍历,得到节点的相似节点集合。在一些实施例中,基于节点在树结构上单向遍历,得到节点的相似节点集合,包括:基于节点在树结构上向下采 ...
【技术保护点】
1.一种用于生成节点的向量表示的方法,包括:/n获取树结构中的节点的标识和相似节点集合,其中,所述节点是知识图谱中的实体;/n构造向量化模型,其中,所述向量化模型的参数是所述节点的初始向量表示;/n将所述节点的标识作为输入,将所述节点的相似节点集合作为输出,通过迭代更新所述节点的初始向量表示对所述向量化模型进行训练,直至所述向量化模型收敛,得到所述节点的向量表示。/n
【技术特征摘要】
1.一种用于生成节点的向量表示的方法,包括:
获取树结构中的节点的标识和相似节点集合,其中,所述节点是知识图谱中的实体;
构造向量化模型,其中,所述向量化模型的参数是所述节点的初始向量表示;
将所述节点的标识作为输入,将所述节点的相似节点集合作为输出,通过迭代更新所述节点的初始向量表示对所述向量化模型进行训练,直至所述向量化模型收敛,得到所述节点的向量表示。
2.根据权利要求1所述的方法,其中,所述获取所述树结构中的节点的相似节点集合,包括:
基于所述节点在所述树结构上单向遍历,得到所述节点的相似节点集合。
3.根据权利要求2所述的方法,其中,所述基于所述节点在所述树结构上单向遍历,得到所述节点的相似节点集合,包括:
基于所述节点在所述树结构上向下采样或向上采样,得到所述节点的相似节点集合,其中,所述向下采样的相似度偏序为:{后代节点}>{父节点}>{父节点的其他后代节点}>{祖先节点}>{祖先节点的其他后代节点},所述向上采样的相似度偏序为:{父节点、子节点、兄弟节点}>{祖先节点、后代节点}>{祖先节点的其他节点}。
4.根据权利要求3所述的方法,其中,所述基于所述节点在所述树结构上向下采样,得到所述节点的相似节点集合,包括:
基于所述节点在所述树结构上向下采样到所述节点的后代节点;
确定所述节点的后代节点的数目是否小于最小相似节点数目阈值;
若不小于所述最小相似节点数目阈值,基于所述节点的后代节点生成所述节点的相似节点集合;
若小于所述最小相似节点数目阈值,按照所述向下采样的相似度偏序继续在所述树结构上采样,直至所采样到的节点的数目不小于所述最小相似节点数目阈值,基于所采样到的节点生成所述节点的相似节点集合。
5.根据权利要求3所述的方法,其中,所述基于所述节点在所述树结构上向上采样,得到所述节点的相似节点集合,包括:
基于所述节点在所述树结构上向上采样到所述节点的父节点、子节点和兄弟节点;
确定所述节点的父节点、子节点和兄弟节点的总数目是否小于最小相似节点数目阈值;
若不小于所述最小相似节点数目阈值,基于所述节点的父节点、子节点和兄弟节点生成所述节点的相似节点集合;
若小于所述最小相似节点数目阈值,按照所述向上采样的相似度偏序继续在所述树结构上采样,直至所采样到的节点的数目不小于所述最小相似节点数目阈值,基于所采样到的节点生成所述节点的相似节点集合。
6.根据权利要求1-5之一所述的方法,其中,所述向量化模型以下一项:跳字模型、卷积神经网络和连续词袋模型。
7.一种用于生成节点的向量表示的装置,包括:
获取单元,被配置成获取树结构中的节点的标识和相似节点集合,其中,所述节点是知识图谱中的实...
【专利技术属性】
技术研发人员:秦华鹏,赵岷,程健一,
申请(专利权)人:北京百度网讯科技有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。