【技术实现步骤摘要】
本专利技术属于知识表示和知识发现以及人工智能领域,特别涉及一种基于路径张量分解的知识图谱表示学习方法。
技术介绍
知识图谱(KnowledgeGraph)作为一种新的知识表示方法和数据管理模式,在自然语言处理、问题回答、信息检索等领域有着重要的应用。知识图谱是结构化的语义知识库,用于以符号形式描述物理世界中的概念及其相互关系,其主要采用(head,relation,tail)三元组形式进行知识表示,head是头实体,tail是尾实体,relation是关系,实体之间是通过关系相互联结,形成了网状的知识结构。知识图谱推理是从已有的实体关系三元组,经过推理计算,建立起实体间的新关系,从而丰富和拓展知识图谱。目前常用的知识图谱表示学习方法是将高维知识图谱通过嵌入(embedding)转换到低维连续向量空间,产生了多种不同方式的推理算法,包括基于张量分解推理算法和基于路径推理算法等。基于张量分解算法将整个知识图谱看作是一个大的张量,然后通过张量分解技术分解为多个小的张量片,也就是将高维的知识图谱进行降维处理,大大减少计算时的数据规模。然而,现有的张量分解过程中,只是考虑直接相关联的实体间联系,未考虑到知识图谱的多路径特点,因此,其推理性能受到一定的限制,并不能深层次地挖掘出实体间的关系。基于路径推理算法根据知识图谱图形结构的特点,利用实体间的路径关系进行推理计算,能有效地挖掘出知识图谱中实体间的新关系。但是,现有推理算法还不能解决长路径推理,而且并未考虑路径可靠性和语义组合问题,同时由于关系路径推理算法还处于研究初期,还有很多细致的工作需要完善。
技术实现思路
本专 ...
【技术保护点】
一种基于路径张量分解的知识图谱表示学习方法,其特征在于包括如下步骤:步骤1,提取知识图谱中的实体集、关系集和三元组集,把满足三元组的实体集、关系集嵌入到低维连续向量空间;步骤2,通过PRA算法获得实体间的路径;步骤3,在全部实体可能存在的路径上均进行张量分解,计算分解损失函数值;步骤4,重复步骤3,直至达到收敛的预设值或迭代最大次数;步骤5,如果达到迭代最大次数或收敛于预设值,则进入下一个三元组相关的路径计算,重复步骤2至步骤4,直到训练集全部的三元组都被执行;步骤6,输出训练模型中相应的实体集和关系集。
【技术特征摘要】
1.一种基于路径张量分解的知识图谱表示学习方法,其特征在于包括如下步骤:步骤1,提取知识图谱中的实体集、关系集和三元组集,把满足三元组的实体集、关系集嵌入到低维连续向量空间;步骤2,通过PRA算法获得实体间的路径;步骤3,在全部实体可能存在的路径上均进行张量分解,计算分解损失函数值;步骤4,重复步骤3,直至达到收敛的预设值或迭代最大次数;步骤5,如果达到迭代最大次数或收敛于预设值,则进入下一个三元组相关的路径计算,重复步骤2至步骤4,直到训练集全部的三元组都被执行;步骤6,输出训练模型中相应的实体集和关系集。2.如权利要求1所述的一种基于路径张量分解的知识图谱表示学习方法,其特征在于:所述步骤1中,还包括对实体集和关系集进行规范化处理,并将规范化后的实体集与关系集,按照原来的三元组对应关系映射到相应的向量矩阵中。3.如权利要求1所述的一种基于路径张量分解的知识图谱表示学习方法,其特征在于:所述步骤2中,从数据集中任意选择一个初始实体s,通过随机游走方式,取得从实体s经过路径p到达实体...
【专利技术属性】
技术研发人员:林开标,朱顺痣,吴运兵,卢萍,杨帆,
申请(专利权)人:厦门理工学院,
类型:发明
国别省市:福建;35
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。