This application provides an entity embedding method, device, medium and device. The method includes: determining the feature vector of the target entity as the first feature vector based on the attribute information of the target entity in the knowledge map; searching the target encyclopedia page corresponding to the target entity from the Encyclopedia database; and determining the relationship between the target entity and the linked entities in the target Encyclopedia page. The transition probability is that the link entity corresponds to the link entity in the target Encyclopedia page; the reference entity of the target entity is determined according to the relationship transition probability and the corresponding jump steps of the target entity; the feature vector of the target entity is determined as the second feature vector based on the reference entity of the target entity and the target entity; the first feature vector and the second feature vector are grouped. Then, the mixed eigenvectors of the target entity are obtained. This application improves the effect of entity embedding and makes the construction and/or application of subsequent knowledge maps ideal.
【技术实现步骤摘要】
一种实体嵌入方法、装置、介质及设备
本申请涉及知识图谱处理
,具体而言,涉及一种实体嵌入方法、装置、介质及设备。
技术介绍
知识图谱(KnowledgeGraph)作为一种新的知识表示方法和数据管理模式,在自然语言处理、问题回答、信息检索等领域有着重要的应用。知识图谱旨在描述的是真实世界中存在的实体及其关系,一般可以采用三元组表示,该三元组包括头实体、尾实体和关系,实体之间是通过关系相互联结,形成了网状的知识结构。实体嵌入是构建知识图谱的关键技术,其主要目的是应用低维度向量对实体及其关系进行建模。目前常用的实体嵌入方法多是直接从百科数据库中查找属于特定实体的一维向量。这种方法忽略了实体之间的关系,容易出现实体嵌入的准确度较低的问题。
技术实现思路
有鉴于此,本申请的目的在于提供一种实体嵌入方法、装置、介质及设备,能够充分考虑实体间的关系,提高实体嵌入效果。第一方面,本申请实施例提供了一种实体嵌入方法,包括:基于知识图谱中目标实体的属性信息,确定所述目标实体的特征向量,作为第一特征向量;从百科数据库中查找与所述目标实体对应的目标百科页面;确定所述目标实体转移至所述目标百科页面中各链接实体的关系转移概率,所述链接实体为所述目标百科页面中的链接对应的实体;根据所述关系转移概率以及该目标实体对应的跳转步数,确定所述目标实体的参考实体;基于所述目标实体及所述目标实体的参考实体,确定所述目标实体的特征向量,作为第二特征向量;将所述第一特征向量和所述第二特征向量进行组合,得到所述目标实体的混合特征向量。可选的,所述确定所述目标实体转移至所述目标百科页面中各链接实体的关 ...
【技术保护点】
1.一种实体嵌入方法,其特征在于,包括:基于知识图谱中目标实体的属性信息,确定所述目标实体的特征向量,作为第一特征向量;从百科数据库中查找与所述目标实体对应的目标百科页面;确定所述目标实体转移至所述目标百科页面中各链接实体的关系转移概率,所述链接实体为所述目标百科页面中的链接对应的实体;根据所述关系转移概率以及该目标实体对应的跳转步数,确定所述目标实体的参考实体;基于所述目标实体及所述目标实体的参考实体,确定所述目标实体的特征向量,作为第二特征向量;将所述第一特征向量和所述第二特征向量进行组合,得到所述目标实体的混合特征向量。
【技术特征摘要】
1.一种实体嵌入方法,其特征在于,包括:基于知识图谱中目标实体的属性信息,确定所述目标实体的特征向量,作为第一特征向量;从百科数据库中查找与所述目标实体对应的目标百科页面;确定所述目标实体转移至所述目标百科页面中各链接实体的关系转移概率,所述链接实体为所述目标百科页面中的链接对应的实体;根据所述关系转移概率以及该目标实体对应的跳转步数,确定所述目标实体的参考实体;基于所述目标实体及所述目标实体的参考实体,确定所述目标实体的特征向量,作为第二特征向量;将所述第一特征向量和所述第二特征向量进行组合,得到所述目标实体的混合特征向量。2.根据权利要求1所述的方法,其特征在于,所述确定所述目标实体转移至所述目标百科页面中各链接实体的关系转移概率,具体包括:针对所述目标百科页面中的每个链接实体,确定该链接实体在所述目标百科页面中出现的次数与第一数值的比值,其中,所述第一数值为所有链接实体在所述目标百科页面中出现的次数的和值;将所述比值确定为所述目标实体转移至该链接实体的关系转移概率。3.根据权利要求1所述的方法,其特征在于,所述确定所述目标实体转移至所述目标百科页面中各链接实体的关系转移概率,包括:针对所述目标百科页面中的每个链接实体,确定该链接实体在所述目标百科页面中出现的次数与第一数值的比值,其中,所述第一数值为所有链接实体在所述目标百科页面中出现的次数的和值;统计所述百科数据库中同时出现所述目标实体与该链接实体的百科页面数;根据统计的百科页面数以及百科数据库中百科页面的总数量,确定所述目标实体至该链接实体的逆向关系概率;基于所述比值和所述逆向关系概率,确定所述目标实体转移至该链接实体的关系转移概率。4.根据权利要求1所述的方法,其特征在于,所述基于所述目标实体及所述目标实体的参考实体,确定所述目标实体的特征向量,具体包括:基于所述目标实体及所述目标实体的参考实体,构建所述目标实体对应的局部子图;将所述局部子图中各实体的原向量组成目标实体对应的原向量集合;基于所述目标实体对应的原向量集合,确定所述目标实体的特征向量。5.根据权利要求1所述的方法,其特征在于,所述从百科数据库中查找与所述目标实体对应的目标百科...
【专利技术属性】
技术研发人员:夏劲夫,郑凯,段立新,江建军,李彩虹,
申请(专利权)人:国信优易数据有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。